大家好,本周給大家分享的是最近發(fā)表在NG上與稀有變異對(duì)復(fù)雜性狀遺傳力的貢獻(xiàn)相關(guān)的一篇文章。
文章題目:Assessing the contribution of rare variants to complex trait heritability from whole-genome sequence data (從全基因組序列數(shù)據(jù)評(píng)估稀有變異對(duì)復(fù)雜性狀遺傳力的貢獻(xiàn))
期刊:Nature Genetics
影響因子: 2020_IF = 38.330; 中科大類: 綜合性期刊1區(qū); 中科小類: 綜合性期刊1區(qū); JCR分區(qū): Q1
發(fā)文單位:澳大利亞昆士蘭大學(xué)、美國(guó)華盛頓大學(xué)等229家單位。
文章作者:澳大利亞昆士蘭大學(xué)Pierrick Wainschteine 為第一作者, Pierrick Wainschteine、Jian Yang和Peter M. Visscher 為共同通訊作者。
摘要:對(duì)于人類復(fù)雜性狀和疾病來(lái)說,大約三分之一到三分之二的遺傳力是由普通的SNP表征的。然而,尚不清楚剩余的遺傳力是否是由于普通SNP對(duì)致病變異的不完善標(biāo)記導(dǎo)致,尤其是致病變異是否稀有,或者是否由于系譜數(shù)據(jù)推斷的偏差而被高估。作者根據(jù)25465名歐洲血統(tǒng)的無(wú)關(guān)個(gè)體的全基因組序列數(shù)據(jù)估計(jì)了身高和體重指數(shù)(BMI)的遺傳力。身高的估計(jì)遺傳力為0.68(標(biāo)準(zhǔn)誤差0.10),體重指數(shù)的估計(jì)遺傳力為0.30(標(biāo)準(zhǔn)誤差0.10)。低連鎖不平衡(LD)中的低次要等位基因頻率變異與相鄰變異的遺傳力豐富,蛋白質(zhì)發(fā)生改變變異的遺傳力更高,與負(fù)向選擇一致。結(jié)果表明,稀有變異,尤其是連鎖不平衡程度較低區(qū)域的變異,是復(fù)雜性狀和疾病仍然缺失遺傳力的主要來(lái)源。
主要結(jié)果:
1、利用WGS數(shù)據(jù)估計(jì)身高和體重指數(shù)的遺傳力
作者選擇了25465個(gè)歐洲血統(tǒng)的基因組子集,使用千人基因組和人類基因組多樣性(HGC)作為參考,對(duì)常見和罕見變異進(jìn)行兩步主成分分析(PCA)。首先,作者在歐洲樣本中使用已知與身高和BMI相關(guān)的常見變異來(lái)測(cè)試每個(gè)隊(duì)列中每個(gè)特征的多基因評(píng)分(PGSs)預(yù)測(cè)能力的一致性,發(fā)現(xiàn)預(yù)測(cè)結(jié)果與之前報(bào)道的一致。然后,為了驗(yàn)證結(jié)果,作者重復(fù)基于普通SNPs的h2SNP先前估計(jì)值,從序列變異中選擇約992000個(gè)HM3 SNPs,并使用軟件包GCTA中GREML方法估計(jì)身高和BMI的h2SNP。作者使用SNP特定的LD指標(biāo),獲得的估計(jì)值稱為h2G+IMP。身高的估計(jì)值在0.50-0.56(s.e.=0.06-0.07)之間,BMI的估計(jì)值在0.16-0.21(s.e.=0.07)之間(圖1)。當(dāng)用已測(cè)序的基因型替換填充的SNP時(shí),遺傳力的估計(jì)值持續(xù)增加,大多數(shù)差異來(lái)自低LD組中0.0001<MAF<0.001的變異,其中填充的準(zhǔn)確性最低??偟膩?lái)說,作者在很大程度上重復(fù)了以前研究中常見或填充變異的結(jié)果。研究發(fā)現(xiàn)基于WGS數(shù)據(jù)(h2WGS)的遺傳力估計(jì)值始終大于h2G+IMP。h2WGS和h2G+IMP之間的差異主要是由稀有的變異解釋的,尤其是那些較低LD附近的變異。

圖1. GREML-LDMS使用HRC參考面板對(duì)n=25465個(gè)樣本填充Illumina InfiniumCore24、GSA 24和Affymetrix Axiom陣列中的SNPs后,用8個(gè)bins校正的20個(gè)PCs進(jìn)行估計(jì)。a、身高的h2G+IMP估計(jì)值介于0.50和0.56之間(s.e.=0.06–0.07)。b、BMI的估計(jì)值在0.16到0.21之間(s.e.=0.07)。MAF在0.0001和0.0010之間的變異的估計(jì)值的s.e.值較大,可以用該MAF bin中大量的填充變異來(lái)解釋,因?yàn)榛赟NP的遺傳力估計(jì)的抽樣方差與獨(dú)立變異的有效數(shù)量成正比。分析中包括總計(jì)約19.0×106至約20.0×106的變異。誤差條表示s.e。
2、LD注釋的影響
為了進(jìn)一步檢查結(jié)果的穩(wěn)健性,作者通過選擇一組更大的變量來(lái)比較GREML-LDMS估計(jì)值,同時(shí)還測(cè)試了一種不同的相關(guān)性估計(jì)。此外,作者還測(cè)試了基于GRM元素的QC是如何影響遺傳力估計(jì)的。這些分析表明質(zhì)量控制步驟確保了遺傳力估計(jì)的穩(wěn)健性。作者還研究了LD注釋的影響,首先使用來(lái)自UK10K數(shù)據(jù)集的樣本內(nèi)或樣本外LD/MAF,并觀察到一致的遺傳力估計(jì),表明從TOPMed注釋中得出的推斷不會(huì)因使用另一個(gè)數(shù)據(jù)集的MAF和LD分層而產(chǎn)生偏差。然后作者研究了LD分區(qū)的效果,發(fā)現(xiàn)將每個(gè)MAF bin分為3或4個(gè)LD bins可以適當(dāng)?shù)夭蹲较∮凶儺怣AF分組的LD異質(zhì)性,將48個(gè)PCs作為固定協(xié)變量進(jìn)行擬合,可以將身高的h2WGS增加到0.67–0.68(s.e.=0.10),BMI增加到0.28–0.32(s.e.=0.10)(圖2)。

圖2. 25465個(gè)樣本中身高和BMI的GREML-LDMS,每個(gè)MAF bin使用3或4個(gè)LD組,校正根據(jù)WGS變量計(jì)算的48160或320個(gè)樣本。每個(gè)變異根據(jù)其LD分?jǐn)?shù)分配到三分位數(shù)或四分位數(shù)。a、使用三個(gè)LD bins估算身高:0.68(s.e.=0.09–0.10)。b、使用三個(gè)LD bins估算BMI:0.30-0.32(s.e.= 0.10)。c、使用四個(gè)LD bins估算身高:0.67-0.68(s.e.= 0.10)。b、使用四個(gè)LD bins估算BMI:0.28-0.30(s.e.= 0.10)。誤差棒代表s.e.
3、功能注釋
從WGS數(shù)據(jù)中估計(jì)并劃分了加性遺傳方差,并研究了估計(jì)的穩(wěn)健性,然后作者探討了是否可以通過功能基因組注釋進(jìn)一步劃分方差。為了研究MAF < 0.1的低LD變異對(duì)遺傳力的具體貢獻(xiàn),利用SnpEff對(duì)低MAF變異和低LD變異進(jìn)行了進(jìn)一步的分類。蛋白質(zhì)改變組包括功能喪失和非同義變異,而保留的變異集包括同義、調(diào)控或非編碼變異。在LD組和MAF組中,蛋白質(zhì)改變變異的比例不同,低MAF組的比例增加,這與對(duì)這類變異的純化選擇一致??偟膩?lái)說,作者考慮了總共11個(gè)分組(MAF>0.1的變異有2個(gè)bins,MAF<0.1的變異有3個(gè)MAF bins;每個(gè)MAF bin進(jìn)一步分為3個(gè)組:低LD蛋白改變、低LD非蛋白改變和高LD)。當(dāng)對(duì)這11個(gè)bins進(jìn)行GREML-LDMS分析時(shí),這11個(gè)bins與48個(gè)PCs相匹配,身高0.61(s.e.=0.09)的總估計(jì)值保持相似,體重指數(shù)0.24(s.e.=0.10)的總估計(jì)值略有增加,由于只使用了兩個(gè)LD bins,這些估計(jì)值向下偏移。有趣的是,與非蛋白質(zhì)改變變體(低LD)或高LD變體相比,具有蛋白質(zhì)改變變體(低LD)的bins的每個(gè)變異解釋的平均方差更大(圖3)。

圖3. GREML-LDMS的每個(gè)變異解釋的方差(遺傳方差的估計(jì)值除以每個(gè)bin中的變異數(shù)),低LD和低MAF(<0.1)變異根據(jù)變異的SnpEff假定效應(yīng)(蛋白質(zhì)改變或非蛋白質(zhì)改變)分為兩個(gè)不同的類別,校正了n=25465樣本中WGS變異的48個(gè)PCs。該分析共有11個(gè)遺傳成分。a-b、對(duì)于身高(a)和體重指數(shù)(b),蛋白質(zhì)改變組(低LD)的遺傳力明顯高于非蛋白質(zhì)改變組(低LD)或高LD變異。誤差條表示s.e。
總之該研究中,作者通過從全基因組序列(WGS)數(shù)據(jù)中估計(jì)身高和體重指數(shù)(BMI)的加性遺傳方差,對(duì)來(lái)自TOPMed項(xiàng)目的25465名無(wú)關(guān)個(gè)體的大樣本進(jìn)行估計(jì),來(lái)說明仍然缺失的遺傳力在很大程度上是由于罕見變異沒有被普通SNP充分標(biāo)記。
文中所有圖片均來(lái)自Assessing the contribution of rare variants to complex trait heritability from whole-genome sequence data
文中有表述不當(dāng)?shù)牡胤?,是我的問題,請(qǐng)?jiān)诤笈_(tái)與小編聯(lián)系修改,也可以自行閱讀原文,謝謝理解與支持。如有團(tuán)體或個(gè)人認(rèn)為本文侵犯您的權(quán)利,請(qǐng)及時(shí)聯(lián)系小編刪除。
文章鏈接地址:https://www.nature.com/articles/s41588-021-00997-7
參考文獻(xiàn):
Wainschtein, P., Jain, D., Zheng, Z. et al. Assessing the contribution of rare variants to complex trait heritability from whole-genome sequence data. Nat Genet 54, 263–273 (2022). https://doi.org/10.1038/s41588-021-00997-7