ATAC-Seq簡(jiǎn)介
ATAC-seq(Assay for Transposase-Accessible Chromatin with high throughput sequencing) 是2013年由斯坦福大學(xué)William J. Greenleaf和Howard Y. Chang實(shí)驗(yàn)室開(kāi)發(fā)的用于研究染色質(zhì)可及性(通常也理解為染色質(zhì)的開(kāi)放性)的方法, 原理是通過(guò)轉(zhuǎn)座酶Tn5容易結(jié)合在開(kāi)放染色質(zhì)的特性,然后對(duì)Tn5酶捕獲到的DNA序列進(jìn)行測(cè)序。
真核生物的核DNA并不是裸露的,而是與組蛋白結(jié)合形成染色體的基本結(jié)構(gòu)單位核小體,核小體再經(jīng)逐步的壓縮折疊最終形成染色體高級(jí)結(jié)構(gòu)(如人的DNA鏈完整展開(kāi)約2m長(zhǎng),經(jīng)過(guò)這樣的折疊就變成了納米級(jí)至微米級(jí)的染色質(zhì)結(jié)構(gòu)而可以儲(chǔ)存在小小的細(xì)胞核)。而DNA的復(fù)制轉(zhuǎn)錄是需要將DNA的緊密結(jié)構(gòu)打開(kāi),從而允許一些調(diào)控因子結(jié)合(轉(zhuǎn)錄因子或其他調(diào)控因子)。這部分打開(kāi)的染色質(zhì),就叫開(kāi)放染色質(zhì),打開(kāi)的染色質(zhì)允許其他調(diào)控因子結(jié)合的特性稱為染色質(zhì)的可及性(chromatin accessibility)。因此,認(rèn)為染色質(zhì)的可及性與轉(zhuǎn)錄調(diào)控密切相關(guān)。
開(kāi)放染色質(zhì)的研究方法有ATAC-seq以及傳統(tǒng)的DNase-Seq及FAIRE-seq等,ATAC-Seq由于所需細(xì)胞量少,實(shí)驗(yàn)簡(jiǎn)單,可以在全基因組范圍內(nèi)檢測(cè)染色質(zhì)的開(kāi)放狀態(tài),目前已經(jīng)成為研究染色質(zhì)開(kāi)放性的首選技術(shù)方法。

Nat Methods, 2013. doi: 10.1038/nmeth.2688. Epub 2013 Oct.
ATAC-Seq與ChIP-Seq的異同
ATAC-Seq與ChIP-Seq的不同的是ATAC-Seq是全基因組范圍內(nèi)檢測(cè)染色質(zhì)的開(kāi)放程度,可以得到全基因組范圍內(nèi)的蛋白質(zhì)可能結(jié)合的位點(diǎn)信息,一般用于不知道特定的轉(zhuǎn)錄因子,用此方法與其他方法結(jié)合篩查感興趣的特定調(diào)控因子;但是ChIP-Seq是明確知道感興趣的轉(zhuǎn)錄因子是什么,根據(jù)感興趣的轉(zhuǎn)錄因子設(shè)計(jì)抗體去做ChIP實(shí)驗(yàn)拉DNA,驗(yàn)證感興趣的轉(zhuǎn)錄因子是否與DNA存在相互作用。ATAC-Seq、ChIP-Seq、Dnase-Seq、MNase-Seq、FAIRE-Seq整體的分析思路一致,找到富集區(qū)域,對(duì)富集區(qū)域進(jìn)行功能分析。
- ChIP-Seq是揭示特定轉(zhuǎn)錄因子或蛋白復(fù)合物的結(jié)合區(qū)域,實(shí)際是研究DNA和蛋白質(zhì)的相互作用,利用抗體將蛋白質(zhì)和DNA一起富集,并對(duì)富集到的DNA進(jìn)行測(cè)序。
- DNase-Seq、ATAC-Seq、FAIRE-Seq都是用來(lái)研究開(kāi)放染色質(zhì)區(qū)域。DNase-Seq是用的DNase I內(nèi)切酶識(shí)別開(kāi)放染色質(zhì)區(qū)域,而ATAC-seq是用的Tn5轉(zhuǎn)座酶,隨后進(jìn)行富集和擴(kuò)增;FAIRE-Seq是先進(jìn)行超聲裂解,然后用酚-氯仿富集。
-
MNase-Seq是用來(lái)鑒定核小體區(qū)域。
An overview of ChIP–seq, DNase-seq, ATAC-seq, MNase-seq and FAIRE–seq experiments
翻譯部分
下面這一部分是對(duì)HBC課程中ChIP-Seq Introduction這一節(jié)的介紹,主要包括的ChIP-Seq的實(shí)驗(yàn)設(shè)計(jì)和分析方法總體思路。原文鏈接:https://github.com/hbctraining/In-depth-NGS-Data-Analysis-Course/blob/master/sessionV/lessons/01_Intro_chipseq_and_setup.md。
ChIP-Seq Introduction
學(xué)習(xí)目標(biāo)
- 理解ChIP-Seq的實(shí)驗(yàn)設(shè)計(jì)
ChIP-Seq簡(jiǎn)介
ChIP實(shí)驗(yàn)(Chromatin immunoprecipitation)即染色質(zhì)免疫沉淀,根據(jù)DNA與蛋白質(zhì)相互作用的原理,分離富集與感興趣的蛋白相互作用的DNA。ChIP-Seq即對(duì)分離得到的DNA擴(kuò)增測(cè)序,然后通過(guò)分析得到DNA的富集區(qū)域也稱為peaks,同時(shí)可以鑒定過(guò)表達(dá)的序列motif以及進(jìn)行功能注釋分析。

下面這一部分將會(huì)介紹ChIP-Seq數(shù)據(jù)分析的整個(gè)流程,從實(shí)驗(yàn)設(shè)計(jì)到產(chǎn)生原始的測(cè)序reads,以及到最后的功能富集分析和motif查找。

實(shí)驗(yàn)設(shè)計(jì)和文庫(kù)構(gòu)建
文庫(kù)構(gòu)建包括以下5步驟:
- 蛋白質(zhì)與DNA的交聯(lián)
- 超聲打斷DNA鏈
- 加附有抗體的磁珠用于免疫沉淀
- 解交聯(lián),純化DNA
- DNA片段大小選擇和PCR擴(kuò)增
富集到的DNA片段只有一部分是真實(shí)的信號(hào)(感興趣的蛋白結(jié)合的DNA區(qū)域),這個(gè)比例取決于number of active binding sites, the number of starting genomes, and the efficiency of the IP.
ChIP-Seq富集序列存在以下特點(diǎn):
- 開(kāi)放染色質(zhì)區(qū)域比緊密區(qū)域更易打斷;
- 重復(fù)序列會(huì)出現(xiàn)似乎被富集的現(xiàn)象
- 序列在整個(gè)基因組上不均勻分布
因此,ChIP-Seq需要有合適的對(duì)照組,對(duì)照樣本需要滿足以下其中一個(gè)條件:
- 沒(méi)有IP(input DAN)
- 沒(méi)有抗體 ("mock IP")
- 沒(méi)有特定的抗體 (IgG "mock IP")


示例數(shù)據(jù)介紹
所用到的示例數(shù)據(jù)是來(lái)自于人類胚胎干細(xì)胞系(h1-ESC)中Nanog和Pou5f1(Oct4)兩個(gè)轉(zhuǎn)錄因子的結(jié)合圖譜。這兩個(gè)轉(zhuǎn)錄因子的功能涉及干細(xì)胞的多能性,該研究的目標(biāo)之一是探究這兩個(gè)轉(zhuǎn)錄因子在轉(zhuǎn)錄調(diào)控中單獨(dú)和相互的調(diào)控作用。
兩組重復(fù),每組重復(fù)包括3個(gè)實(shí)驗(yàn)樣本信息,共6個(gè)樣本,數(shù)據(jù)分析中只用到了12號(hào)染色體的信息。
Nanog IP
Pou5f1 IP
Control input DNA

分析流程
下面這幅圖給出了整個(gè)分析流程,和每一步需要的數(shù)據(jù)格式,后面會(huì)展開(kāi)介紹。
分析環(huán)境配置
這個(gè)課程提供了示例數(shù)據(jù)和分析代碼,可以參考這里連接他們的服務(wù)器,我沒(méi)有連接成功,不知道是不是打開(kāi)方式不對(duì),大家可以嘗試下,如果連接成功,這一部分就是配置服務(wù)器的環(huán)境,準(zhǔn)備數(shù)據(jù);如果也連接不上可以用自己的數(shù)據(jù)或者下載公共數(shù)據(jù)。

參考資料:
ATAC-seq:染色質(zhì)開(kāi)放性測(cè)序技術(shù)
Clifford A. et al. Nature review, 2014
HBC課程V : 01-Introduction to ChIP-Seq
