Ribosome profiling是一種新出現(xiàn)的實驗技術(shù),它結(jié)合了高通量測序技術(shù)的應(yīng)用,可以在全基因組水平上監(jiān)測蛋白質(zhì)的翻譯水平,給研究細(xì)胞內(nèi)蛋白質(zhì)的翻譯調(diào)控機制帶來了新的可能。
目前Ribo-seq建庫測序的原理主要是通過對細(xì)胞使用翻譯抑制劑,使正在翻譯的核糖體固定在mRNA序列或者起始位點上。裂解細(xì)胞后在細(xì)胞裂解液中加入RNase,消化不受核糖體保護的mRNA,分離單一核糖體并提取純化核糖體上未被消化的短片段mRNA,進行建庫測序和相應(yīng)的數(shù)據(jù)分析。
具體實驗原理和主要分析內(nèi)容如下:

1 Ribo-seq數(shù)據(jù)長度統(tǒng)計
? ?高質(zhì)量的ribo-seq文庫的讀長分布peaks主要集中在26-34nt左右范圍(峰值最高點對應(yīng)的RPF長度值隨樣本不同有差異),尤其是真核生物的細(xì)胞質(zhì)核糖體。這里,我們根據(jù)測序的mRNA的片段分布來評估實驗富集的效率。

2 reads gene feature分布圖
將比對到基因組上的reads在gene feature中的分布情況進行統(tǒng)計,定位區(qū)域分為5’UTR,CDS,3’UTR。

3 Principal Component Analysis 主成分分析
主成分分析(PCA)是一種無監(jiān)督特征學(xué)習(xí)的數(shù)據(jù)降維算法,通過樣本的表達數(shù)據(jù)展示數(shù)據(jù)的分類情況。 利用 PCA 分析可獲得樣本在實驗組和對照組之間的直觀分布情況,從而便于對離群樣本進行檢測和去除,并能找出相似度高的樣本集合。我們采用所有樣本中均數(shù)差別(ANOVA)顯著的基因(P value ≤ 0.05)做 PCA 分析,繪制得到 PCA 圖(無重復(fù)樣本使用全部 gene 做 PCA 圖)

PCA 結(jié)果展示了樣本間數(shù)據(jù)的分類情況,每種顏色代表各個分組,每個坐標(biāo)軸代表一種主成分。
4 Ribo-seq樣品間相關(guān)性分析
樣品間基因表達水平相關(guān)性是檢驗實驗可靠性和樣本選擇是否合理的重要指標(biāo)。相關(guān)系數(shù)越接近1,表明樣品之間表達模式的相似程度越高。若樣品中有生物學(xué)重復(fù),通常生物重復(fù)相關(guān)系數(shù)要求較高。

樣品相關(guān)系數(shù)Heatmap圖,藍色深淺代表相關(guān)性高低。
5 差異TE(Translation Efficiency翻譯效率)基因聚類分析
Ribo-C vs Ribo-T 顯著差異TE基因聚類示例。差異表達基因聚類圖。每行代表一個基因,每列代表一個樣本。紅色代表TE上調(diào)顯著差異基因,綠色代表TE下調(diào)顯著差異基因。
注:TE的計算需要同時做原樣本的RNA SEQ。

顯著差異TE基因聚類示例
6 差異顯著TE基因GO富集分析

差異表達基因的 GO 富集分析結(jié)果(Top 3)

GO 分析(BP、CC、MF)結(jié)果中差異最顯著的前 10 個 GO 條目 bar 圖。按照 p-value 從低到高排列,縱坐標(biāo)表示 p-value(-log10 ?轉(zhuǎn)化)。
7 差異顯著TE基因KEGG富集分析

前 5 個差異表達顯著基因的 Pathway 結(jié)果

Benjamini-Hochberg False Discovery Rate (FDR) 校正 p_value