使用jcvi繪制微共線性(Microsynteny)

這篇文章更多是記錄性質(zhì)的,因為沒有詳細說明如何從WGDI, MCScan, MCscanX中獲取基因?qū)?,也沒介紹如何整理出記錄基因坐標的bed文件,因此如果閱讀此文的您看不懂,是我寫的問題,不是您的原因。

本文主要介紹如何使用JCVI的synteny子命令基于已有的共線性分析結(jié)果,展現(xiàn)局部的共線性。

需要準備的三個輸入文件

  • 記錄物種內(nèi)或者物種間的共線性基因?qū)?/li>
  • 記錄基因坐標的bed文件
  • 布局文件

第一步,基于已有的共線性分析結(jié)果(WGDI, MCscan, MCscanX等軟件的分析結(jié)果),整理出你需要展示的區(qū)間的基因?qū)?。注意分隔符是制表符,我們保存為blocks.txt

AL1G16390   AT1G06380
AL1G16400   AT1G06390
AL1G16410   AT1G06400
AL1G16420   AT1G06410
AL1G16430   AT1G06420
AL1G16440   AT1G06430
AL1G16450   AT1G06440
AL1G16460   AT1G06450
AL1G16470   AT1G06460
AL1G16480   AT1G06470
AL1G16490   AT1G06475
AL1G16510   AT1G06490
AL1G16520   AT1G06500
AL1G16530   AT1G06515
AL1G16540   AT1G06510
AL1G16550   AT1G06520
AL1G16560   AT1G06530
AL1G16570   AT1G06540
AL1G16580   AT1G06550
AL1G16590   AT1G06560
AL1G16600   AT1G06570
AL1G16610   AT1G06580

第二步,整理記錄基因坐標的bed文件。bed要求是6列,記錄基因的坐標和朝向,第五列填0即可。 我們命名為genes.bed

1   3631    5899    AT1G01010   0   +
1   6788    9130    AT1G01020   0   -
...
scaffold_9  1792941 1795545 AL9U12210   0   -
scaffold_9  1796870 1801565 AL9U12220   0   -
scaffold_9  1810180 1812874 AL9U12230   0   +
scaffold_9  1836100 1837535 AL9U12240   0   -

兩個要求:

  • 第4列的基因名必須對應(yīng)共線性對的基因
  • 文件里必須包含你需要展示物種的所有基因(至少是共線性區(qū)塊的基因)

第三步,提供布局文件, 命名為layout.csv

# x,  y, rotation,  ha,  va, color, ratio,  label
0.5, 0.4, 0, center,top,  ,  1, A.lyrata Chr1
0.5, 0.3, 0, center, top,  ,  1,  A.thaliana Chr1
# edges
e, 0, 1

該文件分為兩個部分:上半部分是track在圖中的相對位置(x,y)和旋轉(zhuǎn)角度(rotation),以及l(fā)abel的對齊方式, ha( left, center, right) va( top, button) 和顏色(color)

下半部分是不同track的共線性關(guān)系,e,0,1表示第一個和第二個track有關(guān)聯(lián)。

最后運行程序

python -m jcvi.graphics.synteny blocks.txt  genes.bed layout.csv

輸出結(jié)果為一個pdf,如下所示

兩個物種

因為我們的共線性基因里面是A.lyrata是第一列,所以畫圖的時候也是A.lyrata在第一行。

案例僅展示了2條序列之間的共線性,實際上jcvi.graphics.synteny是可以展示多條序列的結(jié)果,比如說jcvi案例展示graph, peach, cacao三者之間的共線性,提供的兩兩之間的共線性如下

GSVIVT01012261001 . .
GSVIVT01012259001 . .
GSVIVT01012258001 . .
GSVIVT01012257001 . .
GSVIVT01012255001 Prupe.1G290900.1 Thecc1EG011472t1
GSVIVT01012253001 Prupe.1G290800.2 Thecc1EG011473t1
GSVIVT01012252001 Prupe.1G290700.1 Thecc1EG011474t1
GSVIVT01012250001 Prupe.1G290600.1 Thecc1EG011475t1
GSVIVT01012249001 Prupe.1G290500.1 Thecc1EG011478t1
GSVIVT01012248001 Prupe.1G290400.1 Thecc1EG011482t1

通過調(diào)整布局(注意布局文件里面的坐標x,y, 以及edge)

# x,   y, rotation,     ha,     va, color, ratio,            label
0.5, 0.6,  0, center, top,   ,  1,  grape Chr1
0.3, 0.4, 0, center, bottom,  , .5, peach scaffold_1
0.7, 0.4,  0, center, bottom,   ,   .5, cacao scaffold_2
# edges
e, 0, 1
e, 0, 2

就能輸出如下效果的共線性

3個物種

參考資料

https://github.com/tanghaibao/jcvi/wiki/MCscan-(Python-version)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容