經(jīng)歷過(guò)OrthoMCL軟件包安裝的艱辛(然而,終究也沒(méi)安裝成功),就知道轉(zhuǎn)而用BPGA包是有多么香了。話不多說(shuō),來(lái)看看BPGA是如何安裝且使用的吧
一、BPGA下載和安裝
首先是GPGA的官方網(wǎng)站:https://iicb.res.in/bpga/index.html

- 接下里就是點(diǎn)擊左邊的
Downloads;
按照下圖所示進(jìn)行點(diǎn)擊進(jìn)入軟件包所在位置

我選擇的是Linux版本的軟件包

#下載
wget https://master.dl.sourceforge.net/project/bpgatool/BPGA-1.3-linux-x86_64-0-0-0.tar.gz?viasf=1 -O BPGA_V1.3_linux.tar.gz
#解壓縮
tar zxvf BPGA_V1.3_linux.tar.gz
#更改權(quán)限,進(jìn)入該軟件的bin/目錄下
chmod +x BPGA-Version-1.3
- 軟件的配置--usearch
該軟件的運(yùn)行還需要下載usearch軟件,后期聚類過(guò)程會(huì)用到
usearch網(wǎng)址:https://www.drive5.com/usearch/download.html,但是該軟件32位的是免費(fèi)的,64位的是收費(fèi)的,那只能選擇32的進(jìn)行下載了

#usearch下載
wget https://www.drive5.com/downloads/usearch11.0.667_i86linux32.gz -O usearch_linux32.gz
#解壓縮
gunzip usearch_linux32.gz
#賦予可執(zhí)行權(quán)限
chmod +x usearch
#將其添加到環(huán)境變量中
echo 'export PATH=/home/ahykdx/bio_tools:$PATH' >>~/.bashrc
source ~/.bashrc
前面說(shuō)到BPGA軟件的運(yùn)行需要usearch軟件的加持,且軟件使用說(shuō)明書(shū)里面明確需要將usearch軟件copy到BPGA的bin目錄下,因此:
cp /home/.../usearch /home.../BPGA-Version-1.3/bin
二、BPGA軟件的使用
那么安裝好了,肯定是要用起來(lái)的咯,首先從準(zhǔn)備文件開(kāi)始
首先是官網(wǎng)中給出了輸入文件的類型,你們看看

反正準(zhǔn)備好上述四種格式文件就可以,我根據(jù)自己的數(shù)據(jù)情況,選擇的是第四種格式。其實(shí)也就是一般的fasta文件格式就行。
如果有好幾個(gè)細(xì)菌的基因組,那就需要把對(duì)應(yīng)的每個(gè)個(gè)體的蛋白序列復(fù)制到一個(gè)文件夾下,然后以xx.fastafasta文件格式結(jié)尾,要全部統(tǒng)一成這種文件命名格式,否則后期運(yùn)行會(huì)報(bào)錯(cuò)
全部準(zhǔn)備好的話,就可以開(kāi)始運(yùn)BPGA軟件了
#首先要告知的是該軟件是從終端不斷按照指令輸入,類似于交互式執(zhí)行的方式,首先輸入以下命令
BPGA-Version-1.3 # 前面忘記寫(xiě)了,就是得把BPGA 軟件的bin目錄放到環(huán)境變量中去。
然后根據(jù)以下提示:

我選擇的是
3,一鍵完成1和2的內(nèi)容,是我喜歡的風(fēng)格-
接下來(lái)就是問(wèn)你輸入文件的格式
圖六 選擇輸入文件的格式
我選擇的是第四種文件格式。
-
接下來(lái)就是輸入文件所在的目錄就可以了
圖七 輸入文件所在的目錄
# 比如我準(zhǔn)備的幾種細(xì)菌的基因組蛋白序列是在/home.../bacteria/protein_fasta目錄下,那我就在Enter:后面將我的目錄paste后點(diǎn)擊Enter鍵就可以不管,讓軟件自己一鍵運(yùn)行就能完成。
Enter: /home.../bacteria/protein_fasta
寫(xiě)在最后
其實(shí)到這里,基本上BPGA軟件的介紹就結(jié)束了,感興趣的可以試一下,反正是暫時(shí)解決了我裝不上OrthoMCL軟件的煩惱。

