由于基因表達調控機制的復雜性,多種組學數據的整合分析,從不同的層面探究生物問題越來越重要。從RNA-Seq層面,我們可以探究哪些基因具有顯著差異,上調或下調;從ChIP-Seq層面,我們可以研究某個特定轉錄因子的調控作用;從ATAC-Seq我們可以了解到染色質可及性的動態(tài)變化,由于染色質的可及性與調控元件或轉錄因子的結合密切相關,在轉錄調控中發(fā)揮著重要的作用。因此,整合分析可以進一步探究調控某一生物學過程的關鍵因子(包括順式調控元件和轉錄因子),以及哪個轉錄因子調控了感興趣的基因,以及感興趣的轉錄因子的靶基因等。
目前,好像并沒有標準化的方法用來整合比較這三種數據。不過在文獻中可以看到有很多相同的或不同的思路和方法做整合分析,大家可以在學習交流群中推薦文獻,一起解讀學習。
下面的內容主要介紹這一節(jié)課程中RNA-Seq和ChIP-Seq的整合分析中提到的兩種方法:
一是直接比較,即首先得到差異基因與ChIP-Seq靶基因的overlap,然后選擇一些關鍵基因比較一下譜圖。

Gao et. al, Nature 2014,doi: 10.1038/nature13921
課程中提到的另一種方法是使用BETA工具:
BETA (Binding and Expression Target Analysis)是 Shirley Liu實驗室開發(fā)的工具,通過整合轉錄因子或染色質調控因子的ChIP-Seq與差異基因的表達直接預測靶基因,而且有可能發(fā)現增強子區(qū)的蛋白質的靶基因。
BETA有三個功能:
- 預測轉錄因子的功能是激活還是抑制
- 預測轉錄因子的靶基因
- 鑒定轉錄因子的motif以及調控轉錄因子激活或抑制的其他因子
BETA包括三個命令取決于輸入數據格式和想要的輸出數據(可以參考嘉因的帖子ChIP-seq和RNA-seq整合分析,BETA最擅長 | 自己分析數據的完美解決方案)
- BETA basic: 預測轉錄因子的功能是激活還是抑制,直接檢測靶標
- BETA plus:BETA basic + 靶標區(qū)域的motif分析
- BETA minus:只基于結合數據的調控潛能的值預測TF靶基因

Nat Protoc. 2013 Dec; 8(12): 2502–2515.
工作原理
- 每個基因的調控潛能值是通過計算基因TSS的指定范圍內的所有結合位點來計算的
- 調控潛能是基因受因子調節(jié)的可能性,取決于TSS范圍的結合位點數以及與結合位點與TSS之間的距離
- BETA minus按照調控潛能值對基因排序來鑒定靶標
- BETA basic需要特定格式的差異分析結果和顯著性的結果。它使用CDF來判斷上調基因和下調基因是否與NON-DE不同,這是用來識別激活和抑制功能。使用調控潛能和差異統(tǒng)計量計算每一個基因的得分排序,該得分排序可以用于識別靶標。