gatk DepthOfCoverage \
--input ../duplicates_marked_sorted_fixed.BQSR.bam \
-L whole_exome_illumina_hg38.targets.interval_list \
-O test.coverage.csv \
--create-output-variant-index \
-R Homo_sapiens_assembly38.fasta \
--output-format CSV \
--print-base-counts \
--QUIET
DepthOfCoverage會輸出7個文本結果。其中一個是按照interval上的每個堿基,輸出一行統(tǒng)計信息,所以會比較慢:
.DepthOfCoverage.txt結果

image.png
DepthOfCoverage為基因組上的每個堿基輸出一行結果,這導致結果文件太大,而且運行速度極慢,如果不需要每個堿基,則可以設置--omit-depth-output-at-each-base,
.sample_interval_summary結果:

image.png
.sample_summary結果:

image.png
.sample_interval_statistics結果

image.png
.sample_statistics結果:

image.png
.sample_cumulative_coverage_counts結果:

image.png
另外如果可以將interval list拆分成更多的話,區(qū)間統(tǒng)計能夠合并,但是GATK不能輸出合并的結果
按照每個堿基的深度結果,可以寫腳本處理成為按染色體統(tǒng)計深度,和覆蓋度的表格:

image.png
最后用統(tǒng)計結果畫圖:

coverage and depth.png