TRF軟件是基因組注釋中常用于檢測(cè)序列中串聯(lián)重復(fù)序列的軟件,無需安裝,使用簡(jiǎn)單方便。
1. 重復(fù)序列分為串聯(lián)重復(fù)序列和散在重復(fù)序列(轉(zhuǎn)座子);
串聯(lián)重復(fù)序列又包含衛(wèi)星序列 >100bp;小衛(wèi)星序列 10bp < <100bp;微衛(wèi)星序列 <=10bp;軟件有TRF,RepeatMasker
轉(zhuǎn)座子包含反轉(zhuǎn)座子(復(fù)制粘貼)和DNA轉(zhuǎn)座子(復(fù)制粘貼,剪切);反轉(zhuǎn)座子又包含LTR 長(zhǎng)末端重復(fù)序列;LINE 長(zhǎng)散在元件;SINE 短散在元件;
2. TRF安裝
trf下載地址:https://tandem.bu.edu/trf/trf409.linux64.download.html
mv trf409.linux64 trf
chmod a+x trf
3. 軟件運(yùn)行
命令格式:trf File Match Mismatch Delta PM PI Minscore MaxPeriod [options] (注:以上所有數(shù)字參數(shù)都為正數(shù))
File: 輸入文件,fasta格式
Match:匹配權(quán)重
Mismatch:錯(cuò)配懲罰分值
Delta:插入缺失懲罰分值
PM:匹配概率
PI:插入的概率
Minscore:報(bào)告中比對(duì)的分值最小值,相當(dāng)于篩選閾值
MaxPeriod:重復(fù)片段長(zhǎng)度的最大值
options: -m 將重復(fù)序列屏蔽,即轉(zhuǎn)為N表示;-f 表示輸出重復(fù)序列兩邊各500bp堿基,主要用于PCR;-d 生成另外的總結(jié)文檔,用于后續(xù)腳本分析等;-h 壓縮html輸出,默認(rèn)會(huì)自動(dòng)加上-d參數(shù);
一般設(shè)置參數(shù)為:trf sequence.fa 2 7 7 80 10 50 500 -m -f -d

4. 結(jié)果文件
除了會(huì)生成對(duì)應(yīng)的masked文件,就是將重復(fù)序列用N表示,還會(huì)生成dat文件,展示重復(fù)序列的詳細(xì)信息;masked文件可用于后續(xù)注釋軟件使用


此外還可參考http://www.chenlianfu.com/?p=1747
參考網(wǎng)址:http://tandem.bu.edu/trf/trf.unix.help.html
http://tandem.bu.edu/trf/trf.html
http://www.chenlianfu.com/?p=1747
http://tandem.bu.edu/trf/868y4Zg25ikZE.2.7.7.80.10.50.500.1.html
http://tandem.bu.edu/trf/trf.definitions.html#table