用PLAM下的mcmctree做分歧時間估計

用mcmctree做分歧時間估計的時候遇到報錯:

MCMCTREE in paml version 4.9, March 2015

Reading options from mcmctree.ctl..

finetune is deprecated now.

Reading master tree.

(Bmor, ((Achi, Rpro), Nlug));

Reading sequence data..  3 loci

*** Locus 1 ***

ns = 4  ls = 621319

Reading sequences, sequential format..

Reading seq # 1: Achi     

Error in sequence data file: B at 621301 seq 1.

Make sure to separate the sequence from its name by 2 or more spaces.

問題是序列不符合phylip格式,每個名字沒有區(qū)分開

1.使用以下命令行將orthofinder處理好的多序列比對結(jié)果,fasta格式改為phylip格式,失敗

cat SpeciesTreeAlignment.fa |tr '\n' '\t'|sed 's/>/\n/g' |sed 's/\t/      /'|sed 's/\t//g'| awk 'NF > 0' >Aa.phy.tmp

awk '{print "  "NR"  "length($2)}'  supergene.phy.tmp|tail -n 1 | cat -  supergene.phy.tmp > Aa.phy
  1. 使用
cat SpeciesTreeAlignment.fa |tr '\n' '\t'|sed 's/>/\n>/g' |sed 's/\t/\n/'|sed 's/\t//g'| awk 'NF > 0' > Aa1.phy.tmp

轉(zhuǎn)換為正常的fasta(去掉換行等)

使用R包將fasta轉(zhuǎn)換為phylip格式

library(devtools)
library(ape)
library(phylotools)

data <- read.fasta("Aa1.phy.tmp")
dat2phylip(data, outfile = "out.phy")

還是得到相同報錯

報錯原因,查找可能是蛋白序列里帶有U,U不在常見密碼子當中,所以有些軟件不識別會報錯

sed 's/U/X/g' SpeciesTreeAlignments.fa > STA_delU.fa

再用得到的這個去除U fasta文件,執(zhí)行以上命令行,得到phylip格式文件。序列個數(shù)沒有問題。注意,千萬不要把U替換為空,會影響文件序列長度。應(yīng)該替換為X。

運行繼續(xù)報錯,但是距離成功不遠了。

ns = 4      ls = 621319
Reading sequences, sequential format..
Reading seq # 4: Rpro     
Sequences read..
Counting site patterns..  0:00
       56693 patterns at   621319 /   621319 sites (100.0%),  0:01
Counting frequencies..
56693 patterns, messy


*** Locus 2 ***


Error: seq err1: EOF.
seq file is not paml/phylip format.  Trying nexus format.

原來問題是,軟件自帶測試數(shù)據(jù)是3組數(shù)據(jù),而我們的數(shù)據(jù)只有一組!

所以非常簡單,修改mcmctree.ctl。改為ndata=1

 ndata = 1
       seqtype = 2  * 0: nucleotides; 1:codons; 2:AAs
       usedata = 3    * 0: no data; 1:seq like; 2:use in.BV; 3: out.BV
         clock = 3    * 1: global clock; 2: independent rates; 3: correlated rates
       RootAge = <1.0  * safe constraint on root age, used if no fossil for root.

運行成功。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Swift1> Swift和OC的區(qū)別1.1> Swift沒有地址/指針的概念1.2> 泛型1.3> 類型嚴謹 對...
    cosWriter閱讀 11,689評論 1 32
  • 1.ios高性能編程 (1).內(nèi)層 最小的內(nèi)層平均值和峰值(2).耗電量 高效的算法和數(shù)據(jù)結(jié)構(gòu)(3).初始化時...
    歐辰_OSR閱讀 30,286評論 8 265
  • 推斷物種系統(tǒng)發(fā)育關(guān)系以及分歧時間對探討物種起源與演化具有重要意義。通過最大似然法(ML)構(gòu)建物種進化樹以及估算物種...
    Mr_我愛讀文獻閱讀 27,391評論 31 71
  • 第2章 基本語法 2.1 概述 基本句法和變量 語句 JavaScript程序的執(zhí)行單位為行(line),也就是一...
    悟名先生閱讀 4,613評論 0 13
  • 久違的晴天,家長會。 家長大會開好到教室時,離放學(xué)已經(jīng)沒多少時間了。班主任說已經(jīng)安排了三個家長分享經(jīng)驗。 放學(xué)鈴聲...
    飄雪兒5閱讀 7,868評論 16 22

友情鏈接更多精彩內(nèi)容