概覽
- Title:From GWAS to Function: Using Functional Genomics to Identify the Mechanisms Underlying Complex Diseases
- 標(biāo)題:從GWAS到功能:使用功能基因組學(xué)識別復(fù)雜疾病的潛在機(jī)制
- Date:2020.5.13
- Journal:Frontiers in Genetics(IF=4.7)
- Citations:370
一句話簡介
文章對后GWAS時代的研究熱點(diǎn)-探究非編碼SNP的功能探究進(jìn)行了綜述,并探討了未來的發(fā)展方向。
雖然IF不高,但這是一篇通俗易懂的好文章,從citation數(shù)就可以看出。非常適合初學(xué)者(我)學(xué)習(xí)入門。
綜述結(jié)構(gòu)
引言
-
識別與復(fù)雜疾病相關(guān)的細(xì)胞類型
- 基于全基因組顯著性Gwas變異的Snp富集分析
- 全基因組 Snp 富集分析
- 基于Snp遺傳力的富集分析
-
優(yōu)先考慮GWAS位點(diǎn)的致病基因
- 共定位分析
- 共定位在復(fù)雜疾病中的應(yīng)用
- Twas:基因和性狀的直接關(guān)聯(lián)
-
解釋GWAS關(guān)聯(lián)的未來前景
- GWAS與單細(xì)胞基因組學(xué)的整合
- 多基因風(fēng)險評分與功能注釋的整合
- 使用基因編輯驗(yàn)證 GWAS 發(fā)現(xiàn)
結(jié)論
引言
自身免疫、神經(jīng)退行性疾病和心血管疾病等常見的非傳染性疾病是當(dāng)今醫(yī)療保健中最緊迫的挑戰(zhàn)之一。這些疾病受到遺傳易感性與環(huán)境或生活方式因素之間相互作用的影響。這些疾病受到數(shù)千種常見遺傳變異的額外貢獻(xiàn)的影響,每種變異對表型的個體影響很小。它們的遺傳結(jié)構(gòu)遵循多基因模型而非孟德爾模型,這使得研究復(fù)雜疾病具有挑戰(zhàn)性。
盡管GWAS取得了成功,但從其結(jié)果中得出的臨床見解仍然有限,這是由于難以解釋GWAS關(guān)聯(lián)。解釋GWAS關(guān)聯(lián)的挑戰(zhàn)有以下三點(diǎn)(Fig 1):
(1)相鄰的遺傳變異通常彼此相關(guān),因?yàn)樗鼈兺捎跍p數(shù)分裂重組過程中的共分離而遺傳在一起,這種現(xiàn)象被稱為連鎖不平衡(LD)。LD 導(dǎo)致一個基因座中的多個變異存在于同一個個體中,由于存在很強(qiáng)的相關(guān)性,這使得很難得到真正casual的variants。
(2)目前尚不清楚哪些細(xì)胞類型是疾病的真正驅(qū)動因素(即,哪些細(xì)胞類型GWAS變異起作用),哪些是疾病致病過程的結(jié)果。
(3)超過90%的GWAS變異屬于基因組的非編碼區(qū)域,因此不會直接影響基因的編碼序列。這些變體在DNA調(diào)節(jié)元件(cRE)中的積累,可能通過破壞轉(zhuǎn)錄因子結(jié)合位點(diǎn)(TFBS)在調(diào)節(jié)基因的表達(dá)水平起作用。然而,與疾病相關(guān)的基因座通常包含多個基因,因此很難區(qū)分受影響的基因座。
- 總之,有必要進(jìn)行后續(xù)研究來解釋GWAS結(jié)果,包括推斷確切的疾病致病變異、它們調(diào)節(jié)的基因以及它們起作用的細(xì)胞類型

在這里,我們回顧了一些促進(jìn)GWAS結(jié)果解釋的方法,重點(diǎn)關(guān)注SNP富集(SNP enrichment)和共定位(Colocalization)方法,并重點(diǎn)介紹了從這些研究中得出的一些生物學(xué)結(jié)論。有關(guān)精細(xì)映射(fine-mapping)的詳細(xì)方法,我們向讀者推薦以前的綜述(Schaid等人,2018)。最后,我們反思了后GWAS研究的一些挑戰(zhàn)和機(jī)遇,例如高通量單細(xì)胞測序平臺的可用性,相關(guān)中間表型的鑒定,多基因風(fēng)險評分(PRS)的開發(fā),以及基因工程在GWAS驗(yàn)證中的系統(tǒng)應(yīng)用。
Identifying Cell Types Relevant to Complex Diseases 識別與復(fù)雜疾病相關(guān)的細(xì)胞類型【主要介紹SNP enrichment】
Snp Enrichment Analysis Based on Genome-Wide Significant Gwas Variants 基于全基因組顯著的Gwas變異的Snp富集分析
SNPsea方法指出,對于給定性狀,GWAS位點(diǎn)如果在給定細(xì)胞類型中特異性表達(dá)的基因中被富集,則優(yōu)先考慮該細(xì)胞類型。
GWAS變體可以與染色質(zhì)注釋相結(jié)合,例如開放染色質(zhì)區(qū)域(ATAC-seq或DNase)、組蛋白修飾(例如,H3K4me1,H3K4me3,H3K27ac和H3K27me3)、DNA甲基化等。與基因表達(dá)相反,染色質(zhì)標(biāo)記可以與GWAS SNP在物理上重疊,因此可以直接從位于注釋中的SNP中估計(jì)富集分析(Fig 2)。ENCODE、Roadmap Epigenomics、BLUEPRINT project等數(shù)據(jù)庫為這些SNP enrichment提供了豐富的資源。

接下來作者遞進(jìn)式地介紹了集中SNP enrichment的方法,包括:
- 二項(xiàng)檢驗(yàn)(Maurano等人,2012):將GWAS SNP與來自HapMap項(xiàng)目的一組常見SNP相比,GWAS SNPs在DHS區(qū)域富集,且具有組織特異性。
- GREGOR(Schmidt等人,2015):將GWAS SNP與具有相似特性(即LD,基因密度和與TSS的距離)的隨機(jī)SNP集進(jìn)行比較,發(fā)現(xiàn)GWAS SNPs通常在活躍的調(diào)控區(qū)富集。
- epiGWAS(Trenka等人,2013):考慮了峰內(nèi)SNP的位置和峰的高度
- GoShifter(Tlynka等人,2015):不受給定基因組區(qū)域中的高LD的影響
- Pasquali 等人分析了人類胰島中的開放染色質(zhì)、TF 結(jié)合和基因表達(dá),將這些特征與 GWAS 位點(diǎn)整合到 2 型糖尿病和空腹血糖中。作者使用基于排列的測試來估計(jì)富集,并得出結(jié)論,血糖和 2 型糖尿病 SNP 在胰島增強(qiáng)子中強(qiáng)烈富集,它們破壞了關(guān)鍵胰島 TF 的 DNA 結(jié)合。(https://www.nature.com/articles/ng.2870)
- CHEERS(Soskic等人,2019):可以解釋染色質(zhì)景觀的細(xì)微變化,以識別跨細(xì)胞狀態(tài)的SNP富集(https://www.nature.com/articles/s41588-019-0493-9)
Genome-Wide Snp Enrichment Analysis 全基因組 Snp 富集分析

以上所描述的方法利用了來自全基因組顯著SNP的信號(Table 1)。然而,復(fù)雜的性狀是由數(shù)千個風(fēng)險等位基因引起的,大多數(shù)與性狀相關(guān)的SNP仍未被發(fā)現(xiàn)(Vischer 等人,2017 年)。因此,將分析限制在全基因組顯著的變異上可能會限制檢測生物學(xué)重要富集的統(tǒng)計(jì)能力。這促使許多方法的發(fā)展,這些方法使用所有常見的SNP來估計(jì)富集。
- fGWAS(Pickrell,2014):可以“重新權(quán)衡”并發(fā)現(xiàn)最初未達(dá)到全基因組意義的變異的關(guān)聯(lián)信號。
- GARFIELD(Iotchkova 等人,2019 年):將每個 SNP 的性狀關(guān)聯(lián)狀態(tài)建模為概率,定義為變體特征的函數(shù)(即,與功能注釋重疊、到最近的 TSS 的距離和 LD 代理的數(shù)量),從而允許在計(jì)算中包含更多的SNP。
Enrichment Analysis Based on Snp Heritability 基于Snp遺傳力的富集分析
遺傳力是由于遺傳變異導(dǎo)致的性狀變異的比例。SNP遺傳力是由一組給定的SNP解釋的表型變異量。 已經(jīng)開發(fā)了許多方法來估計(jì)性狀的SNP遺傳力,使用個體水平的基因型或來自GWAS的匯總統(tǒng)計(jì)
LDSC(Finucane等人,2015):如果GWAS變體在功能類別中富集,那么屬于該類別的變體將比其他變體解釋更多的性狀遺傳力。作者發(fā)現(xiàn),基因組的保守區(qū)域解釋了更多的遺傳力。此外,針對疾病相關(guān)細(xì)胞類型的增強(qiáng)子內(nèi)的變異也解釋了很大一部分遺傳力。
LDSC-SEG(Finucane等人,2018):LDSC方法的一個局限性是它依賴于染色質(zhì)活性譜,而染色質(zhì)活性譜并不總是可用的。相比之下,基因表達(dá)譜可用于更多數(shù)量的細(xì)胞類型,包括豐度較低的細(xì)胞類型。LDSC-SEG利用基因表達(dá)譜來推斷細(xì)胞特異性的SNP富集。
RolyPoly(Calderon等人,2017):具有較高GWAS效應(yīng)大小的變異往往接近在致病組織中表達(dá)較高的基因。使用回歸模型,RolyPoly 估計(jì)細(xì)胞類型特異性基因表達(dá)對每個組織中 GWAS 效應(yīng)大小方差的影響。
Prioritizing Causal Genes at GWAS Loci 優(yōu)先考慮GWAS位點(diǎn)的致病基因【Colocalization】
一旦確定了最相關(guān)的細(xì)胞類型,下一步就是優(yōu)先考慮與疾病有因果關(guān)系的基因。對于編碼變異,候選基因的鑒定最直接,因?yàn)樽儺悤苯悠茐牡鞍踪|(zhì)的結(jié)構(gòu)。
然而,GWAS鑒定的90%的變異是非編碼的。這些變異被認(rèn)為通過修飾啟動子和增強(qiáng)子活性或破壞TF的結(jié)合位點(diǎn)等機(jī)制來調(diào)節(jié)基因表達(dá)。一個例子是 1q13 位點(diǎn),它包含與低密度脂蛋白膽固醇水平和心肌梗死顯著相關(guān)的變異。該變體被證明產(chǎn)生一個新的TF結(jié)合位點(diǎn),這反過來又導(dǎo)致增強(qiáng)子結(jié)合蛋白的募集,急劇增加附近基因SORT1的表達(dá)。反過來,SORT1 會下調(diào)低密度脂蛋白的水平。這使得 SORT1 成為心肌梗死中一個有趣的藥物靶點(diǎn)。
大多數(shù)與疾病相關(guān)的變異被認(rèn)為通過類似于 SORT1 位點(diǎn)的機(jī)制起作用。然而,GWAS基因座通常包含多個基因,識別致病基因具有挑戰(zhàn)性。分析分子性狀(例如,基因表達(dá)、DNA 甲基化、TF 結(jié)合)并將其與 GWAS 結(jié)果相結(jié)合,有助于將非編碼變異與其靶基因聯(lián)系起來并揭示潛在的調(diào)控事件。
Colocalization Analysis 共定位分析
分子性狀的量化,例如數(shù)千個具有不同基因型的個體的基因表達(dá),使遺傳變異與中間性狀(數(shù)量性狀位點(diǎn)定位,QTL)相關(guān)聯(lián)(Fig3A)

高通量測序成本的降低導(dǎo)致了數(shù)十項(xiàng)QTL定位研究,包括基因表達(dá)(eQTLs)、蛋白質(zhì)表達(dá)(pQTLs),外顯子剪接(sQTL)、DNA甲基化(mQTLs)、染色質(zhì)乙?;╝cQTLs)和染色質(zhì)可及性 (caQTL)。其中,eQTL是最常見的,部分原因是RNA測序技術(shù)的穩(wěn)健性。最全面的 eQTL 資源之一是基因型組織表達(dá)項(xiàng)目 (GTEx),該項(xiàng)目分析了近 1,000 個個體的 53 個組織。另一項(xiàng)舉措是BLUEPRINT項(xiàng)目,測量了197個個體外周血中最豐富的細(xì)胞類型的轉(zhuǎn)錄組,以及DNA甲基化和組蛋白修飾。
將QTL圖譜與GWAS相結(jié)合可以識別疾病關(guān)聯(lián)的潛在分子機(jī)制。這方面的早期例子只是評估GWAS變異是否也是重要的eQTL。Nicolae等人(2010)的一項(xiàng)研究將GWAS結(jié)果與來自人類淋巴母細(xì)胞樣細(xì)胞系的eQTL相結(jié)合,得出的結(jié)論是GWAS SNPs成為eQTLs的可能性幾乎是隨機(jī)SNP集的兩倍。
然而,這些早期方法沒有充分控制GWAS和eQTL信號背后的遺傳結(jié)構(gòu),導(dǎo)致大量假陽性結(jié)果。特別是,SNP之間的連鎖不平衡使得確定GWAS和QTL位點(diǎn)中的哪些變異在因果關(guān)系上驅(qū)動關(guān)聯(lián)變得具有挑戰(zhàn)性。重疊的eQTL和GWAS信號可以用三種可能的情況來解釋(Fig3C):(1)LD中兩個獨(dú)立的因果SNP相互之間(連鎖),(2)通過調(diào)節(jié)基因表達(dá)(因果關(guān)系)來影響性狀的單因果SNP,或(3)對性狀和基因表達(dá)有獨(dú)立影響的單因果SNP(多效性)。區(qū)分這些情況對于正確解釋GWAS結(jié)果至關(guān)重要。

此外,eQTL是豐富的,估計(jì)有48%的常見遺傳變異充當(dāng)至少一個基因的eQTL,這使得GWAS和eQTL信號之間的重疊可能是偶然發(fā)生的。這促使了正式統(tǒng)計(jì)測試的發(fā)展,這些測試估計(jì)兩個信號之間由于偶然性而重疊的概率。這些方法稱為共定位測試。(Table2)

RTC(Nica等人,2010):首先識別具有潛在共定位的位點(diǎn),然后從eQTL效應(yīng)中回歸,即位點(diǎn)中最重要的GWAS SNP。然后使用回歸殘差重新測試eQTL關(guān)聯(lián)。為了解釋該區(qū)域的LD,對該區(qū)域的所有SNP重復(fù)該過程,并將頂級GWAS SNP的影響與其他變體的影響進(jìn)行比較。在存在真正的共定位的情況下,頂級GWAS SNP的回歸系數(shù)的影響明顯大于該區(qū)域任何其他變體的影響。
COLOC(Giambartolomei等人,2014):共定位檢驗(yàn):使用GWAS匯總統(tǒng)計(jì)量計(jì)算與原假設(shè)相比共定位的幾率。自發(fā)布以來,COLOC已成為共定位測試的參考方法。
MOLOC(Giambartolomei 等人,2018 年):COLOC的一個局限性是它一次只能測試兩個特征。MOLOC 擴(kuò)展了 COLOC 的原始配方以包括多種性狀,這些性狀可以是獨(dú)立的GWAS、分子性狀或兩者的組合。
eCAVIAR (Hormozdiari等人,2016):精細(xì)映射可以獨(dú)立應(yīng)用于GWAS和QTL關(guān)聯(lián),然后進(jìn)行整合。eCAVIAR可以擴(kuò)展為在任意數(shù)量的因果SNP的假設(shè)下找到共定位,同時考慮LD。
ENLOC(Wen等人,2017):如果一個性狀的大多數(shù)GWAS SNP也是給定細(xì)胞類型中的eQTL(即,如果GWAS SNP在eQTL中富集),那么兩個性狀之間的大多數(shù)重疊將由真正的共定位驅(qū)動。相反,如果GWAS SNPs沒有在該細(xì)胞類型的eQTL中富集,則更多的重疊預(yù)計(jì)是偶然的。
最后,GWAS變異的影響并不局限于鄰近的基因,并且可能產(chǎn)生更多的遠(yuǎn)端效應(yīng)(反式eQTL)。例如,GWAS變體可能會影響TF的表達(dá),從而對下游基因產(chǎn)生連鎖反應(yīng)。反式 eQTL 遠(yuǎn)離其靶基因,并且往往具有較小的效應(yīng)量,這使得它們在中等樣本量下繪制圖譜極具挑戰(zhàn)性。此外,據(jù)估計(jì),反式 eQTL 的數(shù)量遠(yuǎn)多于順式 eQTL,可能導(dǎo)致許多假陽性共定位?;虮磉_(dá)研究的樣本量不斷增加,使我們能夠系統(tǒng)地繪制反式eQTL,并將提供更多的統(tǒng)計(jì)能力來檢測GWAS和反式eQTL之間有意義的共定位。
Application of Colocalization to Complex Diseases 共定位在復(fù)雜疾病中的應(yīng)用
共定位分析特別有用的領(lǐng)域之一是確定免疫介導(dǎo)疾病的潛在機(jī)制。。。。。。。
共定位還指出了與這些疾病有關(guān)的基因和功能元件。。。。。。
共定位的另一個特別有用的領(lǐng)域是心血管疾病。。。。。。。
最后,共定位分析還可以為復(fù)雜性狀中共享遺傳結(jié)構(gòu)之間的關(guān)系提供信息。。。。。
Twas: Direct Association of Genes and Traits Twas:基因和性狀的直接關(guān)聯(lián)
全轉(zhuǎn)錄組關(guān)聯(lián)研究(TWAS)利用來自 GWAS 和 eQTL 目錄的信息來預(yù)測病例和對照的轉(zhuǎn)錄組,從而允許性狀和基因的直接關(guān)聯(lián),而無需直接分析 GWAS 中包含的每個個體的基因表達(dá)。
基于基因型預(yù)測基因表達(dá)是可能的,因?yàn)榛虮磉_(dá)具有高度可遺傳性,并且大多數(shù)基因表達(dá)遺傳性可歸因于與基因接近(順式)的變異。TWAS使用組織特異性eQTL圖譜作為參考數(shù)據(jù)集來訓(xùn)練預(yù)測器,這些預(yù)測器將個體的基因型作為輸入,并估計(jì)其轉(zhuǎn)錄組水平(圖4A)。這些預(yù)測器僅使用來自順式 SNP 到基因的信息,并且僅限于具有高度可遺傳表達(dá)的基因。該預(yù)測過程類似于基因型插補(bǔ),并允許性狀與每個基因的表達(dá)之間直接關(guān)聯(lián)(圖4B)。此外,通過關(guān)注基因表達(dá)的可遺傳成分,它最大限度地減少了疾病引起的基因表達(dá)變化的混淆。

PrediXcan(Gamazon等人,2015)是TWAS的實(shí)現(xiàn),它使用彈性網(wǎng)絡(luò)模型來預(yù)測eQTL目錄中的基因表達(dá)。它可以發(fā)現(xiàn)與復(fù)雜疾病相關(guān)的基因。這些基因中的大多數(shù)是GWAS的已知候選基因,同時也有以前沒有發(fā)現(xiàn)的基因。重要的是,由于TWAS直接將性狀與基因相關(guān)聯(lián),因此這些關(guān)聯(lián)具有明確的效果方向性。
EpiXcan(Zhang 等人,2019 )考慮了 DNA 甲基化或組蛋白修飾等注釋,每個SNP在預(yù)測中的貢獻(xiàn)由其與貝葉斯分層模型中的調(diào)控元素的重疊進(jìn)行加權(quán)。當(dāng)應(yīng)用于 58 個性狀和 14 個 eQTL 數(shù)據(jù)集時,與 PrediXcan 相比,EpiXcan 的基因-性狀關(guān)聯(lián)數(shù)量增加了 18% 以上。這些關(guān)聯(lián)大多是組織特異性的。
總之,共定位和TWAS優(yōu)先考慮與復(fù)雜疾病有因果關(guān)系的基因。共定位分析將來自 GWAS 和 QTL 的關(guān)聯(lián)信號整合到一個位點(diǎn)的基礎(chǔ)上,以識別兩個性狀共享因果變異的實(shí)例。相比之下,TWAS利用eQTL目錄中的信息來推斷基因表達(dá)值,并將基因與性狀直接關(guān)聯(lián)。來自更多細(xì)胞類型以及更大樣本量的QTL目錄的可用性將改善基因優(yōu)先級,并將GWAS結(jié)果轉(zhuǎn)化為精細(xì)的疾病致病基因集。
Future Perspectives in Interpreting GWAS Associations 解釋GWAS關(guān)聯(lián)的未來前景
富集和共定位分析優(yōu)先考慮與復(fù)雜疾病有關(guān)的組織和基因。然而,這些方法在很大程度上受到綜合參考功能數(shù)據(jù)集的可用性的限制。例如,富集和共定位主要依賴于來自bulk的基因表達(dá)數(shù)據(jù)。然而,來自大塊組織的基因表達(dá)譜以最豐富的細(xì)胞類型為主,并且不捕獲有關(guān)細(xì)胞組成和細(xì)胞類型頻率的信息。此外,共定位方法純粹是觀察性的,不能建立因果關(guān)系。例如,SNP可以通過獨(dú)立的機(jī)制(即多效性)影響基因和性狀,而共定位無法最終將這種情況與單一的因果變異區(qū)分開來。因此,候選基因需要額外的實(shí)驗(yàn)驗(yàn)證才能明確地建立因果關(guān)系,例如,通過將GWAS變體與單細(xì)胞檢測相結(jié)合,或使用基因編輯技術(shù)驗(yàn)證候選基因。
Integration of Gwas With Single-Cell Genomics GWAS與單細(xì)胞基因組學(xué)的整合
單細(xì)胞基因組圖譜的高分辨率使其成為SNP富集分析的有前途的資源。g-chromVAR將精細(xì)映射的GWAS變體與bulk和單細(xì)胞造血細(xì)胞和祖細(xì)胞譜系的染色質(zhì)可及性譜集成在一起。將每個單細(xì)胞中染色質(zhì)可及性的定量水平與從精細(xì)映射推斷的每個變異的因果關(guān)系的后驗(yàn)概率相結(jié)合。富集估計(jì)值在整個分化軌跡中各不相同,并集中在造血的特定階段。例如,隨著細(xì)胞分化為巨核細(xì)胞(血小板的前體),與血小板計(jì)數(shù)相關(guān)的變異逐漸富集。相反,富集隨著向淋巴譜系的分化而減少。
單細(xì)胞技術(shù)還可以擴(kuò)大目前的共定位范圍。由于這些檢測的通量正在以前所未有的規(guī)模增長,現(xiàn)在可以在大規(guī)模個體群體中分析單細(xì)胞轉(zhuǎn)錄組,從而可以繪制單細(xì)胞 eQTL (sc-eQTL)。其中一項(xiàng)研究分析了從 45 名健康個體的外周血中分離的 45,000 個單細(xì)胞中的基因表達(dá),并確定了在血液中不同細(xì)胞類型中具有相反作用的 eQTL。例如,rs4804315 增加了 NK 細(xì)胞中 ZNF414 的表達(dá),但在 T 細(xì)胞中降低了 ZNF414 的表達(dá)。此外,作者還總結(jié)了先前報道的HLA-DQA1和CTSC基因的兩個單核細(xì)胞eQTL,并表明它們對經(jīng)典單核細(xì)胞亞群具有特異性。這些結(jié)果很難從批量基因表達(dá)測量中獲得。這項(xiàng)研究可以作為概念驗(yàn)證,并展示了單細(xì)胞eQTL關(guān)聯(lián)如何迅速與GWAS整合。
單細(xì)胞測序的另一個優(yōu)點(diǎn)是可以將細(xì)胞排序到時間進(jìn)程軌跡中,從而為用于eQTL映射的關(guān)聯(lián)模型添加時間分量。這允許在不同的分化階段鑒定具有不同效應(yīng)大小的eQTL(動態(tài)eQTL)。兩項(xiàng)研究繪制了人類誘導(dǎo)多能干細(xì)胞(iPSCs)分化過程中的動態(tài)eQTL。
Integration of Polygenic Risk Scores With Functional Annotations 多基因風(fēng)險評分與功能注釋的整合
全基因組關(guān)聯(lián)研究變異可用于識別疾病高危個體。這可以通過將個體攜帶的數(shù)百種疾病相關(guān)變異組合成一個反映其整體遺傳風(fēng)險的單一評分來實(shí)現(xiàn),即多基因風(fēng)險評分(PRS)。將 PRS 與流行病學(xué)風(fēng)險因素(如年齡、性別、吸煙狀況、飲食或疾病家族史)相結(jié)合可以改善個體的分層,從而可能導(dǎo)致更有效的臨床干預(yù)。隨著GWAS研究樣本量的增加和更大的驗(yàn)證隊(duì)列的出現(xiàn),多基因風(fēng)險評分的性能有所提高。
盡管取得了這些進(jìn)展,但多基因評分仍面臨嚴(yán)峻的挑戰(zhàn)。首先,預(yù)測精度仍然很低。其次,PRS 基于歐洲 GWAS,其在人群之間的可轉(zhuǎn)移性較低。最后,人們對PRS的功能機(jī)制知之甚少。其中一些挑戰(zhàn)現(xiàn)在正在使用功能注釋來解決。
Validation of Gwas Findings Using Gene Editing 使用基因編輯驗(yàn)證 GWAS 發(fā)現(xiàn)
將CRISPR編輯平臺與信息豐富的功能讀數(shù)相結(jié)合可能是驗(yàn)證GWAS結(jié)果的有力方法。
基因編輯方法也可用于研究非編碼基因組。例如,CRISPR干擾(CRISPRi)使用引導(dǎo)RNA和Cas9酶的缺陷版本來防止調(diào)節(jié)元件接觸其靶基因。相反,CRISPR激活(CRISPRa)使用與Cas9蛋白融合的轉(zhuǎn)錄激活因子來增強(qiáng)轉(zhuǎn)錄。這些工具可用于繪制疾病相關(guān)調(diào)節(jié)元件的功能。
理想情況下,基因編輯應(yīng)在與疾病相關(guān)的細(xì)胞類型中進(jìn)行(例如,在SNP富集優(yōu)先的細(xì)胞中)。然而,目前的基因編輯方法大多局限于細(xì)胞系。需要進(jìn)一步的技術(shù)發(fā)展來常規(guī)應(yīng)用基因編輯作為GWAS的后續(xù)策略。
結(jié)論
GWAS關(guān)聯(lián)與細(xì)胞類型特異性功能數(shù)據(jù)的整合極大地促進(jìn)了我們對遺傳變異如何導(dǎo)致疾病的理解。一方面,SNP富集方法能夠根據(jù)細(xì)胞類型和組織的疾病相關(guān)性對細(xì)胞類型和組織進(jìn)行優(yōu)先級排序。這些方法通過測試特定細(xì)胞類型特有的調(diào)節(jié)元件中變異的積累來起作用。它們可以限制在全基因組顯著變異上,也可以根據(jù)所有常見SNP的貢獻(xiàn)來估計(jì)富集。另一方面,共定位分析整合了eQTL和GWAS關(guān)聯(lián),利用LD信息和關(guān)聯(lián)模式來鑒定GWAS位點(diǎn)的靶基因。此外,TWAS允許通過轉(zhuǎn)錄組插補(bǔ)將基因與表型直接關(guān)聯(lián)。這些方法開始揭示受自身免疫、精神分裂癥和冠心病等復(fù)雜疾病影響的組織和基因。然而,它們受到當(dāng)前功能數(shù)據(jù)集分辨率的限制,無法建立因果關(guān)系。未來,我們預(yù)計(jì)GWAS與單細(xì)胞數(shù)據(jù)的整合以及通過基因編輯和細(xì)胞表型驗(yàn)證候選基因?qū)椭覀儗WAS研究結(jié)果轉(zhuǎn)化為臨床上可操作的基因集。
原文鏈接
https://www.frontiersin.org/articles/10.3389/fgene.2020.00424/full