bowtie2是當今流行的序列比對軟件,其輸出結(jié)果為sam后綴名的文件
sam格式是一種通用的比對格式,用來存儲reads到參考序列的比對信息SAM是一種序列比對格式標準, 由sanger制定,是以TAB為分割符的文本格式。
主要應(yīng)用于測序序列mapping到基因組上的結(jié)果表示,當然也可以表示任意的多
重比對結(jié)果
而bam格式文件可以理解為時sam格式文件的二進制保存
在進行下一步的轉(zhuǎn)錄本組裝時要用到cufflinks軟件,而cufflinks只接受bam格式的文件作為輸入,所以我們要把sam格式的文件轉(zhuǎn)換為bam格式的文件以便進行下一步操作 samtools可以有效地幫我們解決這個問題
samtools view [-bhuHS] [-t in.reList] [-o output] [-f repFlag] [-F skipFlag] [-q minMapQ] [-l library]
[-r read]
-b 以BAM格式輸出,可以用于samtools的后續(xù)分析
-u 以未壓縮的BAM格式輸出,可以節(jié)約時間,一般在管道執(zhí)行時使用
-h 在結(jié)果中包含頭header
-H 只輸出頭? -S 輸入文件為SAM格式,如果確實@SQ頭,則需要-t選項
sam轉(zhuǎn)化為bam
samtools view -bS aln.sam > aln.bam
bam轉(zhuǎn)化為sam
samtools view -h -o aln.sam aln.bam
另外在利用cufflinks對轉(zhuǎn)錄本進行拼接時,cufflinks還需要我們把轉(zhuǎn)換后的bam格式文件進行排序
samtools sort aln.bam >aln.sorted_bam
建議使用tophat2+cufflinks的軟件組合進行轉(zhuǎn)錄組的比對和分析
具體教程會在后面更新