利用samtools將sam格式的文件與bam格式的文件進行相互轉(zhuǎn)換

bowtie2是當今流行的序列比對軟件,其輸出結(jié)果為sam后綴名的文件

sam格式是一種通用的比對格式,用來存儲reads到參考序列的比對信息SAM是一種序列比對格式標準, 由sanger制定,是以TAB為分割符的文本格式。

主要應(yīng)用于測序序列mapping到基因組上的結(jié)果表示,當然也可以表示任意的多

重比對結(jié)果

而bam格式文件可以理解為時sam格式文件的二進制保存

在進行下一步的轉(zhuǎn)錄本組裝時要用到cufflinks軟件,而cufflinks只接受bam格式的文件作為輸入,所以我們要把sam格式的文件轉(zhuǎn)換為bam格式的文件以便進行下一步操作 samtools可以有效地幫我們解決這個問題

samtools view [-bhuHS] [-t in.reList] [-o output] [-f repFlag] [-F skipFlag] [-q minMapQ] [-l library]

[-r read]

-b 以BAM格式輸出,可以用于samtools的后續(xù)分析

-u 以未壓縮的BAM格式輸出,可以節(jié)約時間,一般在管道執(zhí)行時使用

-h 在結(jié)果中包含頭header

-H 只輸出頭? -S 輸入文件為SAM格式,如果確實@SQ頭,則需要-t選項

sam轉(zhuǎn)化為bam

samtools view -bS aln.sam > aln.bam

bam轉(zhuǎn)化為sam

samtools view -h -o aln.sam aln.bam

另外在利用cufflinks對轉(zhuǎn)錄本進行拼接時,cufflinks還需要我們把轉(zhuǎn)換后的bam格式文件進行排序


samtools sort aln.bam >aln.sorted_bam

建議使用tophat2+cufflinks的軟件組合進行轉(zhuǎn)錄組的比對和分析

具體教程會在后面更新

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容