小麥misa+primer3設(shè)計SSR引物,并用e-PCR進(jìn)行篩選

1. 軟件下載并安裝

#下載misa軟件

wget http://pgrc.ipk-gatersleben.de/misa/download/misa.pl

#下載配置文件

wget http://pgrc.ipk-gatersleben.de/misa/download/misa.ini

#下載3個perl腳本

wget http://pgrc.ipk-gatersleben.de/misa/download/est_trimmer.pl
wget http://pgrc.ipk-gatersleben.de/misa/download/p3_in.pl
wget http://pgrc.ipk-gatersleben.de/misa/download/p3_out.pl

# 搜索并安裝primer3

conda search primer3
conda install -y primer3

#下載e-PCR并安裝

wget http://ftp.debian.org/debian/pool/main/e/epcr/epcr_2.3.12-1.orig.tar.gz
tar xvf epcr_2.3.12-1.orig.tar.gz
cd e-PCR-2.3.12
make -j 4
echo 'PATH=$PATH:/home/wdd/biosoft/epcr/e-PCR-2.3.12/' >>~/.bashrc
source ~/.bashrc 
 e-PCR --help

2. 分析SSR

準(zhǔn)備要提取的序列的bed文件chr5D_part2.bed,對應(yīng)的分別是fasta中的染色體號,起始位置,終止位置


提取序列的bed
bedtools getfasta -fi Chinese_Spring_v1.0.fasta -bed chr5D_part2.bed -fo chr5D_part2.fa

#目標(biāo)區(qū)段SSR分析

perl misa.pl chr5D_part2.fa

#提取SSR上下游各150bp的序列

cat chr5D_part2.fa.misa |awk 'NR>1 {print $1"\t"$6-150"\t"$7+150}' >chr5D_part2_ssr.bed

#使用bedtools工具提取重復(fù)序列

bedtools getfasta -fi chr5D_part2.fa -bed chr5D_part2_ssr.bed -fo chr5D_part2_ssr.fa

#再進(jìn)行一次SSR查找

perl misa.pl chr5D_part2_ssr.fa

接下來就是修改p3_in.pl文件,這樣使用它生成的文件就可以直接在primer3上面運(yùn)行了,修改的內(nèi)容可以參考primer3文件下的example文件,將p3_in.pl文件的輸出內(nèi)容和example的內(nèi)容一致,我現(xiàn)在使用的版本的修改內(nèi)容是:

print OUT "PRIMER_SEQUENCE_ID=$id"."_$ssr_nr\nSEQUENCE=$seq\n";
#改為
print OUT "SEQUENCE_ID=$id"."_$ssr_nr\nSEQUENCE_TEMPLATE=$seq\n";
perl p3_in.pl chr5D_part2_ssr.fa.misa 
#然后使用primer3進(jìn)行設(shè)計引物
primer3_core --default_version=1 -- output=chr5D_part2_ssr.fa.p3out chr5D_part2_ssr.fa.p3in
#primer3 引物結(jié)果輸出文件整理
perl p3_out.pl CS_2B_0M-80M_ssr.fa.p3out CS_2B_0M-80M_ssr.fa.misa

3. e-PCR

#提取輸出文件中的第一對引物作為e-PCR的輸入文件

cat chr5D_part2_ssr.fa.results |awk 'NR>1 {print $1"\t"$8"\t"$11"\t"$1}' >chr5D_ssr.txt

#e-PCR輸出文件

e-PCR  chr5D_ssr.txt D=100-500 ~/huxin/genome/Triticum_aestivum.IWGSC.dna.toplevel.fa N=2 G=2 T=3 > CS_2B_0M-chr5D_ssr_ePCR.txt

4. R語言

#篩查e_pcr的唯一結(jié)果

setwd("C:\\Users\\Desktop\\")#切換目錄
data0<-read.table("~/Home/TTD_chr7A_ssr_ePCR.txt",sep="\t",header=F,full=T)
data<-as.matrix(data0)
dup<-unique(data[duplicated(data[,2]),2])
num<-c()
for (k in 1:length(dup)) {
n<-which(data[,2]==dup[k])
num<-c(num,n)
}
res0<-data[-num,]
write.csv(res0,"chr5D_ssr_ePCR.csv",row.names=F)
txt讀入報錯, 加入 參數(shù)full=T

5. 在線檢測

將chr5D_ssr_ePCR.csv 與chr5D_part2_ssr.fa.results對應(yīng),提出第一對引物,在線檢測

小麥族多組學(xué)數(shù)據(jù)網(wǎng)站



5.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容