1、eQTL、mQTL共定位分析的作用
eQTL、mQTL共定位分析屬于Post-GWAS的一項(xiàng)重要工作,旨在GWAS結(jié)果的基礎(chǔ)上鑒定與表型相關(guān)的eQTL和mQTL位點(diǎn)。
傳統(tǒng)的GWAS是將全基因組范圍內(nèi)的常見(jiàn)變異進(jìn)行關(guān)聯(lián)分析,鑒定與表型相關(guān)的基因座,但鑒定出來(lái)的位點(diǎn)大多數(shù)位于基因間隔區(qū),其如何通過(guò)基因或者通路影響表型很難被闡述。
基于此,開(kāi)發(fā)了eQTL、mQTL共定位分析方法。
其原理是利用已有數(shù)據(jù)庫(kù)公布的eQTL、mQTL位點(diǎn),結(jié)合GWAS summary數(shù)據(jù),鑒定與表型相關(guān)的eQTL和mQTL位點(diǎn)。
2、eQTL共定位分析
下載安裝SMR:
wget https://cnsgenomics.com/software/smr/download/smr_Linux.zip
unzip smr_Linux.zip
下載eQTL數(shù)據(jù)(注意我這里下載的是hg19版本的,如果你的GWAS數(shù)據(jù)不是hg19,請(qǐng)自行更改對(duì)應(yīng)的基因組版本的數(shù)據(jù)):
數(shù)據(jù)來(lái)源:https://cnsgenomics.com/software/smr/#eQTLsummarydata
wget https://cnsgenomics.com/data/SMR/westra_eqtl_hg19.zip
unzip westra_eqtl_hg19.zip
wget https://cnsgenomics.com/data/SMR/cage_eqtl_data_lite_hg19.tar.gz
tar -zxvf cage_eqtl_data_lite_hg19.tar.gz
wget https://cnsgenomics.com/data/SMR/GTEx_V7_cis_eqtl_summary.tar.gz
tar -zxvf GTEx_V7_cis_eqtl_summary.tar.gz
eQTL共定位分析(以westra_eqtl_hg19數(shù)據(jù)為例):
smr_Linux --bfile file --gwas-summary mygwas.ma --beqtl-summary westra_eqtl_hg19 --out mygwas --thread-num 10
參數(shù)解讀:
file為PLINK的二進(jìn)制格式文件,不了解的話請(qǐng)見(jiàn)鏈接https://www.cnblogs.com/chenwenyan/p/6095531.html
mygwas.ma為GWAS的summary文件,包含SNP、A1、A2、freq、b、se、p、N,N指樣本數(shù)(N沒(méi)有的話,可以直接賦予NA),內(nèi)容如下所示:
image
westra_eqtl_hg19為eQTL數(shù)據(jù),該數(shù)據(jù)通過(guò)westra_eqtl_hg19.zip解壓得到
mygwas為生成的共定位結(jié)果文件名
eQTL共定位結(jié)果(以westra_eqtl_hg19數(shù)據(jù)為例):

每一列代表的意思:Columns are probe ID, probe chromosome, gene name, probe position, tans-eQTL chromosome, left boundary of the trans-region, right boundary of the trans-region, SNP name, SNP chromosome, SNP position, the effect (coded) allele, the other allele, frequency of the effect allele (estimated from the reference samples), effect size from GWAS, SE from GWAS, p-value from GWAS, effect size from eQTL study, SE from eQTL study, p-value from eQTL study, effect size from SMR, SE from SMR, p-value from SMR, p-value from HEIDI test, and number of SNPs used in the HEIDI test.
3、mQTL共定位分析
下載mQTL數(shù)據(jù)(注意我這里下載的是hg19版本的,如果你的GWAS數(shù)據(jù)不是hg19,請(qǐng)自行更改對(duì)應(yīng)的基因組版本的數(shù)據(jù)):
數(shù)據(jù)來(lái)源:https://cnsgenomics.com/software/smr/#mQTLsummarydata
wget https://cnsgenomics.com/data/SMR/LBC_BSGS_meta.tar.gz
tar -zxvf LBC_BSGS_meta.tar.gz
mQTL共定位分析(以LBC_BSGS_meta的1號(hào)染色體數(shù)據(jù)為例):
smr_Linux --bfile file --gwas-summary mygwas.ma --beqtl-summary /LBC_BSGS_meta/bl_mqtl_chr1 --out mygwas --thread-num 10
參數(shù)解讀:
file和mygwas.ma與eQTL共定位分析的輸入文件相同
/LBC_BSGS_meta/bl_mqtl_chr1為mQTL數(shù)據(jù),該數(shù)據(jù)通過(guò)LBC_BSGS_meta.tar.gz解壓得到
mygwas為生成的共定位結(jié)果文件名
mQTL共定位結(jié)果(以LBC_BSGS_meta數(shù)據(jù)為例):

每一列代表的意思同eQTL的結(jié)果分析
4、關(guān)于eQTL、mQTL共定位分析相關(guān)的文獻(xiàn)推薦
文獻(xiàn)題目:Summary-Based Methylome-Wide Association Analyses Suggest Potential Genetically Driven Epigenetic Heterogeneity of Alzheimer's Disease
不想看英文題目:基于摘要統(tǒng)計(jì)的甲基化全基因組分析揭示阿爾茲海默癥的表觀異質(zhì)性
雜志和影響因子:J Clin Med (IF: 5.688)
分析方法:結(jié)合阿爾茲海默癥遺傳風(fēng)險(xiǎn)位點(diǎn)和公共數(shù)據(jù)庫(kù)公開(kāi)的全血、大腦的mQTL位點(diǎn)進(jìn)行SMR分析,鑒定與阿爾茲海默癥和DNA甲基化變化相關(guān)的SNP,使用GSA-SNP2包進(jìn)行通路富集分析。
結(jié)論:找到152個(gè)探針、113個(gè)基因與阿爾茲海默癥相關(guān),其中10個(gè)基因均在血液和大腦甲基化中達(dá)到顯著水平。將個(gè)體按照性別、有無(wú)高血壓分組,分別找到22和79個(gè)顯著探針位點(diǎn)與阿爾茲海默癥相關(guān),其可能是阿爾茲海默癥異質(zhì)性的原因。
文章鏈接:https://pubmed.ncbi.nlm.nih.gov/32429084/
文獻(xiàn)題目: Multivariate genomic scan implicates novel loci and haem metabolism in human ageing
不想看英文題目: 多元基因組掃描揭示人類衰老中新的基因座和血紅素代謝
雜志和影響因子: Nat Commun (IF: 11.878)
分析方法: 使用MANOVA對(duì)壽命、健康壽命、父母壽命三個(gè)不同的GWAS summary文件進(jìn)行薈萃分析。隨后對(duì)感興趣的基因座按照性別和年齡進(jìn)行分層分析,用GWAS catalog和PhenoScanner查找感興趣基因的相關(guān)表型。使用SMR進(jìn)行基因表達(dá)共定位分析,使用FUMA的Gene2Func進(jìn)行基因富集分析,使用TwoSampleMR進(jìn)行孟德?tīng)栯S機(jī)化隨機(jī)化;
結(jié)論: 通過(guò)薈萃分析,找到了10基因影響三個(gè)表型,其中5個(gè)(FOXO3,SLC4A7,LINC02513,ZW10和FGD6)是以前未報(bào)道過(guò)的。這10個(gè)基因座大多數(shù)與心血管疾病有關(guān),其表達(dá)活性隨年齡發(fā)生變化。有78個(gè)基因富集在衰老通路上,涉及的通路有DNA損傷,凋亡和體內(nèi)平衡,血紅素代謝。
文章鏈接:
https://pubmed.ncbi.nlm.nih.gov/32678081/
