Post-GWAS: eQTL、mQTL共定位分析(Summary-data-based Mendelian Randomization,SMR)

1、eQTL、mQTL共定位分析的作用

eQTL、mQTL共定位分析屬于Post-GWAS的一項(xiàng)重要工作,旨在GWAS結(jié)果的基礎(chǔ)上鑒定與表型相關(guān)的eQTL和mQTL位點(diǎn)。

傳統(tǒng)的GWAS是將全基因組范圍內(nèi)的常見(jiàn)變異進(jìn)行關(guān)聯(lián)分析,鑒定與表型相關(guān)的基因座,但鑒定出來(lái)的位點(diǎn)大多數(shù)位于基因間隔區(qū),其如何通過(guò)基因或者通路影響表型很難被闡述。

基于此,開(kāi)發(fā)了eQTL、mQTL共定位分析方法。

其原理是利用已有數(shù)據(jù)庫(kù)公布的eQTL、mQTL位點(diǎn),結(jié)合GWAS summary數(shù)據(jù),鑒定與表型相關(guān)的eQTL和mQTL位點(diǎn)。

2、eQTL共定位分析

下載安裝SMR:

wget https://cnsgenomics.com/software/smr/download/smr_Linux.zip

unzip smr_Linux.zip

下載eQTL數(shù)據(jù)(注意我這里下載的是hg19版本的,如果你的GWAS數(shù)據(jù)不是hg19,請(qǐng)自行更改對(duì)應(yīng)的基因組版本的數(shù)據(jù)):

數(shù)據(jù)來(lái)源https://cnsgenomics.com/software/smr/#eQTLsummarydata

wget https://cnsgenomics.com/data/SMR/westra_eqtl_hg19.zip

unzip westra_eqtl_hg19.zip

wget https://cnsgenomics.com/data/SMR/cage_eqtl_data_lite_hg19.tar.gz

tar -zxvf cage_eqtl_data_lite_hg19.tar.gz

wget https://cnsgenomics.com/data/SMR/GTEx_V7_cis_eqtl_summary.tar.gz

tar -zxvf GTEx_V7_cis_eqtl_summary.tar.gz

eQTL共定位分析(以westra_eqtl_hg19數(shù)據(jù)為例):

smr_Linux --bfile file --gwas-summary mygwas.ma --beqtl-summary westra_eqtl_hg19 --out mygwas --thread-num 10

參數(shù)解讀:

file為PLINK的二進(jìn)制格式文件,不了解的話請(qǐng)見(jiàn)鏈接https://www.cnblogs.com/chenwenyan/p/6095531.html

mygwas.ma為GWAS的summary文件,包含SNP、A1、A2、freq、b、se、p、N,N指樣本數(shù)(N沒(méi)有的話,可以直接賦予NA),內(nèi)容如下所示:

image

westra_eqtl_hg19為eQTL數(shù)據(jù),該數(shù)據(jù)通過(guò)westra_eqtl_hg19.zip解壓得到

mygwas為生成的共定位結(jié)果文件名

eQTL共定位結(jié)果(以westra_eqtl_hg19數(shù)據(jù)為例):

image

每一列代表的意思:Columns are probe ID, probe chromosome, gene name, probe position, tans-eQTL chromosome, left boundary of the trans-region, right boundary of the trans-region, SNP name, SNP chromosome, SNP position, the effect (coded) allele, the other allele, frequency of the effect allele (estimated from the reference samples), effect size from GWAS, SE from GWAS, p-value from GWAS, effect size from eQTL study, SE from eQTL study, p-value from eQTL study, effect size from SMR, SE from SMR, p-value from SMR, p-value from HEIDI test, and number of SNPs used in the HEIDI test.

3、mQTL共定位分析

下載mQTL數(shù)據(jù)(注意我這里下載的是hg19版本的,如果你的GWAS數(shù)據(jù)不是hg19,請(qǐng)自行更改對(duì)應(yīng)的基因組版本的數(shù)據(jù)):

數(shù)據(jù)來(lái)源https://cnsgenomics.com/software/smr/#mQTLsummarydata

wget https://cnsgenomics.com/data/SMR/LBC_BSGS_meta.tar.gz

tar -zxvf LBC_BSGS_meta.tar.gz

mQTL共定位分析(以LBC_BSGS_meta的1號(hào)染色體數(shù)據(jù)為例):

smr_Linux --bfile file --gwas-summary mygwas.ma --beqtl-summary /LBC_BSGS_meta/bl_mqtl_chr1 --out mygwas --thread-num 10

參數(shù)解讀:

filemygwas.ma與eQTL共定位分析的輸入文件相同

/LBC_BSGS_meta/bl_mqtl_chr1為mQTL數(shù)據(jù),該數(shù)據(jù)通過(guò)LBC_BSGS_meta.tar.gz解壓得到

mygwas為生成的共定位結(jié)果文件名

mQTL共定位結(jié)果(以LBC_BSGS_meta數(shù)據(jù)為例):

image

每一列代表的意思同eQTL的結(jié)果分析

4、關(guān)于eQTL、mQTL共定位分析相關(guān)的文獻(xiàn)推薦


文獻(xiàn)題目:Summary-Based Methylome-Wide Association Analyses Suggest Potential Genetically Driven Epigenetic Heterogeneity of Alzheimer's Disease

不想看英文題目:基于摘要統(tǒng)計(jì)的甲基化全基因組分析揭示阿爾茲海默癥的表觀異質(zhì)性

雜志和影響因子:J Clin Med (IF: 5.688)

分析方法:結(jié)合阿爾茲海默癥遺傳風(fēng)險(xiǎn)位點(diǎn)和公共數(shù)據(jù)庫(kù)公開(kāi)的全血、大腦的mQTL位點(diǎn)進(jìn)行SMR分析,鑒定與阿爾茲海默癥和DNA甲基化變化相關(guān)的SNP,使用GSA-SNP2包進(jìn)行通路富集分析。

結(jié)論:找到152個(gè)探針、113個(gè)基因與阿爾茲海默癥相關(guān),其中10個(gè)基因均在血液和大腦甲基化中達(dá)到顯著水平。將個(gè)體按照性別、有無(wú)高血壓分組,分別找到22和79個(gè)顯著探針位點(diǎn)與阿爾茲海默癥相關(guān),其可能是阿爾茲海默癥異質(zhì)性的原因。

文章鏈接:https://pubmed.ncbi.nlm.nih.gov/32429084/


文獻(xiàn)題目: Multivariate genomic scan implicates novel loci and haem metabolism in human ageing

不想看英文題目: 多元基因組掃描揭示人類衰老中新的基因座和血紅素代謝

雜志和影響因子: Nat Commun (IF: 11.878)

分析方法: 使用MANOVA對(duì)壽命、健康壽命、父母壽命三個(gè)不同的GWAS summary文件進(jìn)行薈萃分析。隨后對(duì)感興趣的基因座按照性別和年齡進(jìn)行分層分析,用GWAS catalog和PhenoScanner查找感興趣基因的相關(guān)表型。使用SMR進(jìn)行基因表達(dá)共定位分析,使用FUMA的Gene2Func進(jìn)行基因富集分析,使用TwoSampleMR進(jìn)行孟德?tīng)栯S機(jī)化隨機(jī)化;

結(jié)論: 通過(guò)薈萃分析,找到了10基因影響三個(gè)表型,其中5個(gè)(FOXO3,SLC4A7,LINC02513,ZW10和FGD6)是以前未報(bào)道過(guò)的。這10個(gè)基因座大多數(shù)與心血管疾病有關(guān),其表達(dá)活性隨年齡發(fā)生變化。有78個(gè)基因富集在衰老通路上,涉及的通路有DNA損傷,凋亡和體內(nèi)平衡,血紅素代謝。

文章鏈接:

https://pubmed.ncbi.nlm.nih.gov/32678081/


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容