TRF--Tandem Repeat Finder

TRF軟件是基因組注釋中常用于檢測(cè)序列中串聯(lián)重復(fù)序列的軟件,無需安裝,使用簡(jiǎn)單方便。

1. 重復(fù)序列分為串聯(lián)重復(fù)序列和散在重復(fù)序列(轉(zhuǎn)座子);

串聯(lián)重復(fù)序列又包含衛(wèi)星序列 >100bp;小衛(wèi)星序列 10bp < <100bp;微衛(wèi)星序列 <=10bp;軟件有TRF,RepeatMasker

轉(zhuǎn)座子包含反轉(zhuǎn)座子(復(fù)制粘貼)和DNA轉(zhuǎn)座子(復(fù)制粘貼,剪切);反轉(zhuǎn)座子又包含LTR 長(zhǎng)末端重復(fù)序列;LINE 長(zhǎng)散在元件;SINE 短散在元件;

2. TRF安裝

trf下載地址:https://tandem.bu.edu/trf/trf409.linux64.download.html

mv trf409.linux64 trf

chmod a+x trf

3. 軟件運(yùn)行

命令格式:trf File Match Mismatch Delta PM PI Minscore MaxPeriod [options] (注:以上所有數(shù)字參數(shù)都為正數(shù))

File: 輸入文件,fasta格式

Match:匹配權(quán)重

Mismatch:錯(cuò)配懲罰分值

Delta:插入缺失懲罰分值

PM:匹配概率

PI:插入的概率

Minscore:報(bào)告中比對(duì)的分值最小值,相當(dāng)于篩選閾值

MaxPeriod:重復(fù)片段長(zhǎng)度的最大值

options: -m 將重復(fù)序列屏蔽,即轉(zhuǎn)為N表示;-f 表示輸出重復(fù)序列兩邊各500bp堿基,主要用于PCR;-d 生成另外的總結(jié)文檔,用于后續(xù)腳本分析等;-h 壓縮html輸出,默認(rèn)會(huì)自動(dòng)加上-d參數(shù);

一般設(shè)置參數(shù)為:trf sequence.fa 2 7 7 80 10 50 500 -m -f -d

未加-h參數(shù)

4. 結(jié)果文件

除了會(huì)生成對(duì)應(yīng)的masked文件,就是將重復(fù)序列用N表示,還會(huì)生成dat文件,展示重復(fù)序列的詳細(xì)信息;masked文件可用于后續(xù)注釋軟件使用

實(shí)際結(jié)果


表頭說明

此外還可參考http://www.chenlianfu.com/?p=1747

參考網(wǎng)址:http://tandem.bu.edu/trf/trf.unix.help.html

http://tandem.bu.edu/trf/trf.html

http://www.chenlianfu.com/?p=1747

http://tandem.bu.edu/trf/868y4Zg25ikZE.2.7.7.80.10.50.500.1.html

http://tandem.bu.edu/trf/trf.definitions.html#table

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容