雙端測序的mRNA-seq處理過程

1.從SRA數(shù)據(jù)庫選擇原始測序數(shù)據(jù)并下載【下載之前看一眼是single還是paired】

./fastq-dump --split-files SRR1186241 &

結(jié)果:在執(zhí)行命令的目錄下出現(xiàn)SRR1186241_1.fastq和SRR1186241_2.fastq

2.進(jìn)行測序數(shù)據(jù)的質(zhì)量檢測

 fastqc SRR*41_1.fastq

結(jié)果:主要看有沒有引物,(目前從SRA上下載的數(shù)據(jù)基本都去除了引物)
顯示有引物就用cutadapt去除

3.匹配基因組(hg19 human)

工具:HISAT2
(1)基因組索引,直接下載http://daehwankimlab.github.io/hisat2/download/#h-sapiens

深度截圖_選擇區(qū)域_20191225152252.png

(2)匹配基因組索引生成sam

hisat2 -x genome -1 1_1.fastq -2 1_2.fastq -S 1.sam &

4.對sam排序并轉(zhuǎn)換成bam

samtools view -F 4 -q 30 -b 1.sam > 1.bam &
samtools sort 1.bam -o 1_sort.bam

5.HTseq-count計數(shù)【-i參數(shù)影響輸出的基因名】

htseq-count -f bam -t exon -i gene_name 1_sort.bam gencode.v32lift37*gff3 > 1.txt &
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容