怎么分析關(guān)注的功能基因集在轉(zhuǎn)錄組結(jié)果中表現(xiàn)如何?

怎么分析關(guān)注的功能基因集在轉(zhuǎn)錄組結(jié)果中表現(xiàn)如何?

拿到轉(zhuǎn)錄組數(shù)據(jù)之后,很多人最關(guān)心的恐怕就是差異基因的富集分析了,它闡明了實(shí)驗(yàn)中樣本差異在基因功能上的體現(xiàn)。

但有時(shí)候,我們?cè)谠O(shè)計(jì)實(shí)驗(yàn)的時(shí)候就已經(jīng)對(duì)某些特定功能的基因集特別關(guān)注了,那么如何分析這些基因集在實(shí)驗(yàn)不同比較組之間的表達(dá)情況呢?今天就給大家推薦個(gè)相關(guān)的分析方法。

基因集富集分析GSEA

GSEA(Gene Set Enrichment Analysis)是麻省理工和哈佛大學(xué)的broad institute 研究團(tuán)隊(duì)開(kāi)發(fā)的一個(gè)針對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行分析的工具。

GSEA在對(duì)基因表達(dá)數(shù)據(jù)分析時(shí),首先確定分析的目的,即選擇MSigDB中的一個(gè)或多個(gè)功能基因集進(jìn)行分析。然后基于基因表達(dá)數(shù)據(jù)與表型的關(guān)聯(lián)度(也可以理解為表達(dá)量的變化)的大小進(jìn)行排序,進(jìn)而判斷每個(gè)基因集內(nèi)的基因是否富集于表型相關(guān)度排序后基因列表的上部或下部,從而判斷此基因集內(nèi)基因的協(xié)同變化對(duì)表型變化的影響。

GSEA的優(yōu)勢(shì)

常規(guī)的基因富集分析主要關(guān)注差異基因,也就是對(duì)差異基因進(jìn)行功能富集分析,例如GO和KEGG,這容易遺漏部分差異表達(dá)不顯著卻有重要生物學(xué)意義的基因,忽略一些基因的生物特性、基因調(diào)控網(wǎng)絡(luò)之間的關(guān)系及基因功能等有價(jià)值的信息。

GSEA 方法關(guān)注的不是有限幾個(gè)發(fā)生顯著改變的差異基因,而是關(guān)注檢測(cè)基因的表達(dá)在定義的功能分組中是否有共同的表達(dá)趨勢(shì),是從另一個(gè)角度來(lái)解讀生物學(xué)信息,以闡述其中的生物學(xué)意義。

GSEA結(jié)果講解

GSEA分析結(jié)果最常見(jiàn)的是下圖:

1、圖最上面部分展示的是富集分?jǐn)?shù)(ES, enrichment score)值計(jì)算過(guò)程,從左至右每到一個(gè)基因,計(jì)算出一個(gè)ES值,連成線。在最左側(cè)或最右側(cè)有一個(gè)特別明顯的峰值就是基因集表型上的ES值。圖中間部分每一條線代表基因集中的一個(gè)基因,及其在基因列表中的排序位置。

2、最下面部分展示的是基因與表型關(guān)聯(lián)的矩陣,紅色為與第一個(gè)表型(MUT)正相關(guān),在MUT中表達(dá)高,藍(lán)色與第二個(gè)表型(WT)正相關(guān),在WT中表達(dá)高。

3、Leading-edge subset 對(duì)富集得分貢獻(xiàn)最大的基因成員。若富集得分為正值,則是峰左側(cè)的基因;若富集得分為負(fù)值,則是峰右側(cè)的基因。

4、FDR GSEA默認(rèn)提供所有的分析結(jié)果,并且設(shè)定FDR<0.25為可信的富集,最可能獲得有功能研究?jī)r(jià)值的結(jié)果。但如果樣品數(shù)目少,而且選擇了gene_set作為Permumation type則需要使用更為嚴(yán)格的標(biāo)準(zhǔn),比如FDR<0.05。

點(diǎn)擊查看原文

Bioinformatics

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 文獻(xiàn)時(shí)間 2005.08 摘要 RNA表達(dá)數(shù)據(jù)的分析越來(lái)越普遍,從中提取生物相關(guān)的信息是一個(gè)很大的挑戰(zhàn)。我們提供了...
    康君愛(ài)上了蕊醬閱讀 1,834評(píng)論 0 3
  • GSEA是一種無(wú)閾值方法,可根據(jù)其差異表達(dá)等級(jí)或其他分?jǐn)?shù)對(duì)所有基因進(jìn)行分析,無(wú)需事先進(jìn)行基因過(guò)濾。當(dāng)基因組中的所有...
    Mingyan_C閱讀 11,881評(píng)論 1 17
  • 1.為什么寫(xiě)? 網(wǎng)上教程一抓一大把,有的能重復(fù),有的不能重復(fù)不了,很多原因。別人能做的不代表你能復(fù)制,實(shí)踐出真知。...
    生物信息與育種閱讀 7,013評(píng)論 0 19
  • 試試看,發(fā)現(xiàn)一種需要并去滿足它。 想想為那些比你的處境更困難的人提供幫助,會(huì)給你、你的家庭以及你的事業(yè)帶來(lái)什么。
    薛誠(chéng)俊閱讀 169評(píng)論 0 0
  • 題西林壁(宋·蘇軾):橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同。不識(shí)廬山真面目,只緣身在此山中。 道理:是正向的說(shuō)教。對(duì)于心...
    潤(rùn)梅2018閱讀 479評(píng)論 0 7

友情鏈接更多精彩內(nèi)容