格式轉(zhuǎn)換 腳本來源:https://github.com/edgardomortiz/vcf2phylip[https://github.com/edgardomortiz/...
格式轉(zhuǎn)換 腳本來源:https://github.com/edgardomortiz/vcf2phylip[https://github.com/edgardomortiz/...
格式轉(zhuǎn)換pop.list的第一列是個(gè)體名、第二列是種群名,tab分隔符. cat vcf.to.pomo.py 運(yùn)行iqtree
@Once_9dbc 1. ”沒有數(shù)據(jù)的窗口實(shí)在太多“,這就有可能是vcf中的SNP經(jīng)過太多過濾導(dǎo)致的,你可以直接從bam文件轉(zhuǎn)。 2. 在統(tǒng)計(jì)的時(shí)候,這種數(shù)據(jù)缺失的窗口是要丟掉的;我不知道你結(jié)果里面的NA是不是就是數(shù)據(jù)缺失太多導(dǎo)致的。 我們當(dāng)時(shí)做的時(shí)候最起碼有一半的窗口因?yàn)閿?shù)據(jù)缺失都丟掉了。 3. 至于你說的重大偏差,你先用bam轉(zhuǎn)了再看看
Dfoil - 推斷祖先基因流-2. 在一篇講泥炭蘚的MBE看到了dfoil的使用 《Extensive Genome-Wide Phylogenetic Discordance Is Due to In...
說明在這個(gè)窗口上就沒有序列或者沒有足夠的序列完成分析,沒有序列或者序列不足的窗口扔掉就行
Dfoil - 推斷祖先基因流-2. 在一篇講泥炭蘚的MBE看到了dfoil的使用 《Extensive Genome-Wide Phylogenetic Discordance Is Due to In...
@陶可愛_83e3 序列里面有*,說明有提前的終止密碼子,*不能刪除。可以刪掉這種出現(xiàn)提前終止密碼子的基因。
基于OrthoFinder的結(jié)果提取直系同源單拷貝基因建樹0.運(yùn)行Orthofinder略 1.建樹 https://github.com/yongzhiyang2012/Two_iron_wood_genome_analysis/...
@是山不是海 有審稿人讓我們刪除色體間的互作,原因和你說的一樣
僅作個(gè)人筆記 - 基于fithic的輸出結(jié)果統(tǒng)計(jì)染色體體間顯著互作的密度-1.更新于2025.4借助于GPT,這個(gè)功能一下子就可以實(shí)現(xiàn),下面展示GPT的成果輸出文件可以直接用pheatmap畫圖 cat interact_density_to_m...
注:腳本是用GPT生成的,請自己甄別。 perl gff3_to_bed12.pl in.gff > out.bed12 cat gff3_to_bed12.pl
ANGEs只能得到祖先染色體上基因的順序,得不到祖先染色體的序列。
比如_Q / _P表示基因的先后順序,你翻一下ANGEs的manual,有詳細(xì)解釋,我記不清了。
至于祖先染色體的序列,你如果是想拿到祖先整條染色體的序列,我不知道。
但是你如果是想重構(gòu)某個(gè)基因/某段序列等等,工具有很多:
https://github.com/veg/hyphy-analyses/tree/master/AncestralSequences;
Cactus也能構(gòu)建祖先序列, 基于比對塊, 但是沒有染色體的信息。
你說的這個(gè)負(fù)數(shù)的問題我一點(diǎn)印象都莫得了= =
使用Agora/ANGEs構(gòu)建祖先核型0.部分參考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
參考以下鏈接, 本教程僅作一個(gè)跑通的示例https://github.com/PengNi/ccsmeth[https://github.com/PengNi/ccsmeth...
@1fa8330d5604 不用合并。一一對應(yīng)來畫。
使用Agora/ANGEs構(gòu)建祖先核型0.部分參考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
@1fa8330d5604 是的。最后你得到的是祖先染色體在物種中的分布,所以是統(tǒng)一的。
使用Agora/ANGEs構(gòu)建祖先核型0.部分參考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
眾所周知ClusterProfiler是目前最 馬賽克 的富集軟件但是除了一些模式物種,大部分物種都沒有相應(yīng)的背景庫,非常痛苦 怎么辦呢?AnnotationForge這個(gè)R...
@大A子 我沒用過wgdi提供的這些腳本,輸入文件都是我自己準(zhǔn)備的
WGDI - 推斷祖先核型0.僅作個(gè)人筆記使用意思就是只考慮我能不能看懂具體每個(gè)參數(shù)的含義參照官方文檔, 這里全部用默認(rèn)參數(shù)https://wgdi.readthedocs.io/en/latest/...
@五個(gè)菠蘿八塊八 我用Agora跑完,CAR數(shù)量很多很多,然后我再投給ANGEs,CAR就只有23個(gè)了。
每條CAR上有多少基因我不太清楚,我的配置文件就是在簡書里面那個(gè)截圖,時(shí)間太久了原始文件找不到了- -
使用Agora/ANGEs構(gòu)建祖先核型0.部分參考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
那就沒法了,軟件只能做到這了,不死心的話可以看看每個(gè)CAR里面都有多少個(gè)基因。
比如,是不是大部分CAR,都只有1-2個(gè)基因,那這樣的可以不計(jì)入祖先核型數(shù)量。
使用Agora/ANGEs構(gòu)建祖先核型0.部分參考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
是只有一個(gè)基因。
從共同祖先到現(xiàn)在,有三個(gè)物種,這個(gè)基因在每個(gè)物種中都有一份,也就是你看到的3個(gè)物種的基因。
使用Agora/ANGEs構(gòu)建祖先核型0.部分參考https://doi.org/10.1093/molbev/msae239[https://doi.org/10.1093/molbev/msae239] 用了...
首先需要看一下軟件作者孫朋川老師的視頻,孫老師做了好幾次講座了,B站有錄屏。
以我的理解,核型就是自己根據(jù)共線性推的。
比如所有物種在X染色體上都有非常良好的共線性,那就認(rèn)為祖先的X染色體一直傳到現(xiàn)在都沒咋變,那我們就得到祖先核型的第一條染色體了。
具體選哪個(gè)物種放進(jìn)allspp.ancient.input.txt中,盡量挑各種結(jié)構(gòu)重排比較少的物種寫進(jìn)去。
比如A, B, C, D個(gè)物種,你通過共線性發(fā)現(xiàn)D在X染色體上有一個(gè)易位,再結(jié)合系統(tǒng)發(fā)育關(guān)系/最大簡約原則等等推斷出是D發(fā)生了易位,而不是ABC發(fā)生了相同的易位。那就別選D,ABC隨機(jī)選一個(gè)。
WGDI - 推斷祖先核型0.僅作個(gè)人筆記使用意思就是只考慮我能不能看懂具體每個(gè)參數(shù)的含義參照官方文檔, 這里全部用默認(rèn)參數(shù)https://wgdi.readthedocs.io/en/latest/...
主播,不能切片,全基因組call和切片call,切片會(huì)少很多SNP,不知道為什么
freebayes快速群體call snp流程優(yōu)化過濾和比對沒什么好說的,fastp + bwa足夠 重點(diǎn)是call snp這塊,GATK作為精度最高的東西,運(yùn)行速度也是最慢的,卡的要死。有人提出可以使用freebayes進(jìn)...
bash get.longest.gff.sh input.gff > longest.gff cat get.longest.gff.sh 有的時(shí)候還會(huì)遇到gtf格式,ba...