群體DNA甲基化分析1——基因組各個組分相關(guān)統(tǒng)計

寫于20201114
這部分,我是進(jìn)行了基因組各個組分的一些統(tǒng)計。詳細(xì)內(nèi)容如下:

  • 01.DMR和NSR在基因組中各個組分的占比
  • 02.基因組各個基因組成分(exon、intron、TE和intergenic)的核酸多態(tài)性
  • 03.各個亞群這些組分的核酸多態(tài)性分析
  • 04.DMR、DSR和NSR這些組分的核酸多態(tài)性
  • 05.DMR中各個組分的遺傳多樣性比較
  • 06.整體DMR遺傳多樣性比較
  • 07.DMR在基因組分上的分布(分Hyper和Hypo)
  • 08.總體PIM到CER和CER到BIGD甲基化水平的趨勢
  • 09.三種類型DNA甲基化circos圖
  • 10.6圈DMR一圈馴化,一圈染色體的整體DMR的圖譜
  • 11.DMR的頻率分布
    借鑒文章中的結(jié)果圖:

    1.
    圖1

    2.
    圖2

    3.
    圖3

    4.
    圖4

    5.
    圖5

    6.
    圖6-1

    7.
    圖6-2

    8.
    圖7

    9.
    圖8

    10.
    圖9

    11.
    圖10

    12.
    圖11

-------------------------------------------------------------------------------------

1.DMR和NSR在基因組中各個組分的占比
獲取基因間區(qū)序列,需要先獲取gene.bed和TE.bed,然后用bedtools complement 進(jìn)行找到互補(bǔ)區(qū)域
bedtools complement -i gene.bed -g genome.bed
但是注意的是,這個互補(bǔ)區(qū)域中每條染色體的第一個位置為0,這樣會對后面bedtools 操作造成報錯。

獲取TE、exon、intron和intergenic的bed后,用bedtools的intersect進(jìn)行取交集,反映出覆蓋了多少組分。
bedtools intersect -a exon.bed -b DOM.fin.bed -wb |awk '{print $4"\t"$5"\t"$6}' |less > temp.bed最開始我沒想到,會有重復(fù)的行,所以造成間區(qū)和TE的區(qū)域特別多,后來我想到這個問題,所以需要添加bedtools sort -i temp.bed > temp.s.bedbedtools merge -i temp.s.bed |awk '{sum+=($3-$2)}END{print sum}'|less
這樣得到DMR和DSR的組分信息。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容