首先基因下游是什么?
我們知道上游很重要啊,因?yàn)榭赡軙?huì)調(diào)控轉(zhuǎn)錄,但注釋的時(shí)候,沒(méi)有上游這個(gè)東西,為什么呢?因?yàn)檗D(zhuǎn)錄起始位點(diǎn)TSS的上下游被定義為promoter,所以啊上游被包括在promoter中,也就沒(méi)有上游這個(gè)category了。
那么轉(zhuǎn)錄終止位點(diǎn)TTS的上下游呢?上游還在基因主體里,它可以是外顯子、內(nèi)含子、3'UTR這些,優(yōu)先拿這些來(lái)注釋,而下游呢?基因間區(qū)!基因間區(qū)就是各種不編碼蛋白的區(qū)域,當(dāng)然也可能編碼一些非編碼RNA之類的,這一塊從基因的角度來(lái)看,是比較‘沒(méi)用’的。但對(duì)于TTS后面緊接著的基因間區(qū),它可能對(duì)基因的轉(zhuǎn)錄還是有些影響的,所以單獨(dú)拿出來(lái),就是這里要說(shuō)的downstream了。
所以一個(gè)基因主體的immediate upstream,包含在promter里,而immediate downstream,我們也單獨(dú)拿出來(lái)注釋為downstream,這兩塊其實(shí)都在基因間區(qū),但被我們拿出來(lái)了,因?yàn)楹突蛑苯舆B接,很近的區(qū)域,可以說(shuō)這是近端基因間區(qū)。而其它的基因間區(qū),我們稱之為遠(yuǎn)端基因間區(qū),distal intergenic.
Does anyone know how to set the downstream range for the peak annotation? It seems the default setting of downstream is 3kb. I would like to set the downstream range from 3kb to 500bp. Thanks
這是Bioconductor上的問(wèn)題,https://support.bioconductor.org/p/103135/,事實(shí)上在早期的版本,這是hard coded的,寫死在里面,現(xiàn)在的版本是可以由用戶自己定義的,但我在寫這個(gè)的時(shí)候呢,我覺(jué)得annotatePeak已經(jīng)有很多參數(shù)了,我不想把參數(shù)列表搞得又臭又長(zhǎng),所以呢,就變成了黑魔法,使用options來(lái)設(shè)置。比如說(shuō)上面提問(wèn)者想要的500bp,就可以通過(guò)下面的指令來(lái)設(shè)置:
options(ChIPseeker.downstreamDistance = 500)