前面我們介紹了GEO數(shù)據(jù)挖掘的文章(更多見(jiàn)文末鏈接),大多數(shù)都為人類癌癥相關(guān)的數(shù)據(jù)挖掘,其實(shí)GEO數(shù)據(jù)庫(kù)中也有很多動(dòng)植物相關(guān)的數(shù)據(jù),也可以用于數(shù)據(jù)挖掘然后發(fā)表SCI論文,這里給大家介紹一篇利用GEO數(shù)據(jù)庫(kù)當(dāng)中的公開(kāi)數(shù)據(jù),挖掘擬南芥中與重金屬響應(yīng)相關(guān)基因的文章。
2019年發(fā)表在PeerJ雜志上,IF=2.353,雖然分?jǐn)?shù)不高但是非常有借鑒意義。

1.數(shù)據(jù)來(lái)源
作者在GEO數(shù)據(jù)庫(kù)當(dāng)中找到了11組和重金屬(As, Au, Cd, Pb and Cu)相關(guān)的基因芯片表達(dá)數(shù)據(jù)用于查找擬南芥當(dāng)中與重金屬響應(yīng)相關(guān)的關(guān)鍵基因。

2.關(guān)鍵差異基因篩選分析
分別對(duì)這11組數(shù)據(jù)用limma包做差異表達(dá)分析,篩選條件為:corrected P-value < 0.05 and |log2FC| > 1。11組數(shù)據(jù)篩選了很多差異基因,這里就不再贅述分別是多少了。

查找共同的關(guān)鍵基因:作者用了一個(gè)RRA的分析方法用于查找11組數(shù)據(jù)中差異基因中關(guān)鍵的基因。該方法簡(jiǎn)單介紹:每個(gè)基因在每個(gè)實(shí)驗(yàn)中按照表達(dá)量進(jìn)行秩次排序,如果不是關(guān)鍵基因理論上應(yīng)該是隨機(jī)排序,但是,如果一個(gè)基因在所有實(shí)驗(yàn)中排名都很高,則該基因差異表達(dá)的與重金屬相關(guān)的可能性越大。根據(jù)這個(gè)篩選方法,作者共篩選到168 DEGs comprising 109 down-regulated and 59 up-regulated。其中差異表達(dá)最大的上調(diào)top20基因:AT3G46270, ATCSLB05, AT3G19030, COL9, BCAT4, ELF4,CYP83A1, AT1G76800, AT1G61740, CLE6, AT4G01440, AT1G72200, MOT1, AT5G52790,AT4G40070, AT4G25250, EXGE-A1, NR1, AT5G19970 and CYP735A2;下調(diào)top20基因:DIN2, WRKY75,AT4G15120, CYP81F2, AT1G73480, AT1G72900, PGPS1, AT5G06730, AT1G35910,CYP81D8, AT3G12320, ATERF6, AT1G12200, AT5G25450, AT4G28460, NILR1, HSP70,APRR9, Fes1A and AT3G02800。這些基因在不同數(shù)據(jù)中的表達(dá)熱圖如下:

3.差異基因GO和KEGG富集分析
利用GOATOOLS對(duì)差異基因進(jìn)行GO富集分析發(fā)現(xiàn):這些基因在生理過(guò)程(GO:0008150),細(xì)胞生理過(guò)程(GO:0009987),對(duì)刺激的生理響應(yīng)(GO:0050896),對(duì)生物/非生物脅迫的響應(yīng)(GO:0006950)有明顯的富集;

再利用KOBAS進(jìn)行代謝通路富集發(fā)現(xiàn)差異基因在 雌激素信號(hào)通路,玉米素生物合成,麻疹,抗原加工和呈遞,MAPK信號(hào)通路和氮代謝等代謝中富集。

4.蛋白互作網(wǎng)絡(luò)分析
利用STRING蛋白互作網(wǎng)絡(luò)數(shù)據(jù)庫(kù),構(gòu)建差異基因的蛋白互作網(wǎng)絡(luò)分析,再用cytoscape軟件分析互作網(wǎng)絡(luò)共找到9個(gè)關(guān)鍵hub基因。

5.RT-qPCR驗(yàn)證關(guān)鍵基因的表達(dá)情況
挑選了20個(gè)關(guān)鍵基因進(jìn)行實(shí)時(shí)定量表達(dá)驗(yàn)證,不同的基因在重金屬處理后表達(dá)模式不盡相同:

6.總結(jié)
作者通過(guò)對(duì)11組GEO數(shù)據(jù)進(jìn)行差異分析初步篩選,得到很多差異分析結(jié)果。不像以前的文章直接繪制維恩圖取交集得到關(guān)鍵的差異分析結(jié)果,本文作者通過(guò)RRA秩次檢驗(yàn)分析篩選關(guān)鍵的差異基因,方法新值得借鑒。另外,生信類文章投入產(chǎn)出比很高,作者只是做了定量PCR會(huì)有經(jīng)費(fèi)投入,其他都是生信分析不用投入任何經(jīng)費(fèi)。
參考文獻(xiàn):https://peerj.com/articles/6495/
更多技能學(xué)習(xí)鏈接:
http://m.study.163.com/provider/400000000234009/index.htm?share=1&shareId=1031484705
更多生物信息課程:
1. 文章越來(lái)越難發(fā)?是你沒(méi)發(fā)現(xiàn)新思路,基因家族分析發(fā)2-4分文章簡(jiǎn)單快速,學(xué)習(xí)鏈接:基因家族分析實(shí)操課程、基因家族文獻(xiàn)思路解讀
2. 轉(zhuǎn)錄組數(shù)據(jù)理解不深入?圖表看不懂?點(diǎn)擊鏈接學(xué)習(xí)深入解讀數(shù)據(jù)結(jié)果文件,學(xué)習(xí)鏈接:轉(zhuǎn)錄組(有參)結(jié)果解讀;轉(zhuǎn)錄組(無(wú)參)結(jié)果解讀
3. 轉(zhuǎn)錄組數(shù)據(jù)深入挖掘技能-WGCNA,提升你的文章檔次,學(xué)習(xí)鏈接:WGCNA-加權(quán)基因共表達(dá)網(wǎng)絡(luò)分析
4. 轉(zhuǎn)錄組數(shù)據(jù)怎么挖掘?學(xué)習(xí)鏈接:轉(zhuǎn)錄組標(biāo)準(zhǔn)分析后的數(shù)據(jù)挖掘、轉(zhuǎn)錄組文獻(xiàn)解讀
5.微生物16S/ITS/18S分析原理及結(jié)果解讀、OTU網(wǎng)絡(luò)圖繪制、cytoscape與網(wǎng)絡(luò)圖繪制課程
6. 生物信息入門到精通必修基礎(chǔ)課,學(xué)習(xí)鏈接:linux系統(tǒng)使用、perl入門到精通、perl語(yǔ)言高級(jí)、R語(yǔ)言畫(huà)圖
7. 醫(yī)學(xué)相關(guān)數(shù)據(jù)挖掘課程,不用做實(shí)驗(yàn)也能發(fā)文章,學(xué)習(xí)鏈接:TCGA-差異基因分析、GEO芯片數(shù)據(jù)挖掘、GSEA富集分析課程、TCGA臨床數(shù)據(jù)生存分析、TCGA-轉(zhuǎn)錄因子分析、TCGA-ceRNA調(diào)控網(wǎng)絡(luò)分析
8.其他課程鏈接:二代測(cè)序轉(zhuǎn)錄組數(shù)據(jù)自主分析、NCBI數(shù)據(jù)上傳、二代測(cè)序數(shù)據(jù)解讀。