NCBI中編號/編碼說明

【NCBI編號】NCBI中編號/編碼說明

在日常分析中,我們在NCBI數(shù)據(jù)中常常見到AC、NC、NM、NR、NP、NG等各類編號,這類編號分別代表著怎樣的含義?我們該如何根據(jù)自己的需求來選擇正確的編號呢?

今天就來說一說常見的NCBI編號的意義。

1)AC_***:genomic mixed,一些可供選擇的注釋的基因組序列,主要用來標(biāo)記病毒和原核生物;

2)AP_***:protein mixed,AC_標(biāo)記序列對應(yīng)的蛋白產(chǎn)物;

3)NC_***:genomic mixed,完整的基因組分子序列,標(biāo)記的類別包括基因組、染色體、細(xì)胞器、質(zhì)粒;

4)NG_***:genomic mixed,不完整的基因組區(qū)域,提供NCBI基因組注釋途徑。比較有代表性有不轉(zhuǎn)錄的假基因或者哪些很難自行化注釋的基因組簇;

5)NM_***:mRNA mixed,轉(zhuǎn)錄組產(chǎn)物序列;成熟mRNA轉(zhuǎn)錄本序列;

6)NP_***:protein mixed,蛋白產(chǎn)物;主要是全長轉(zhuǎn)錄氨基酸序列,但也有一些只有部分蛋白質(zhì)的部分氨基酸序列;

7)NR_***:RNA mixed,非編碼的轉(zhuǎn)錄子序列,包括結(jié)構(gòu)RNAs,假基因轉(zhuǎn)子等;

8)NT_***:genomic automated,BAC或者鳥槍測序法的還未完全注釋的測序序列;

9)NW_***:genomic automated,BAC或者鳥槍法測序的還未完全注釋的測序序列;

10)NZ_ABCD1234***:genomic automated,收集的各種利用鳥槍法測序的測序計劃,ABCD?代表的是計劃名稱;

11)?XM_***:mRNA automated,轉(zhuǎn)錄產(chǎn)物;mRNA來自基因組注釋,序列相當(dāng)于基因組重疊群;

12)XP_***:protein automated,蛋白產(chǎn)物;序列相當(dāng)于基因組重疊群;

13)XR:RNA automated,轉(zhuǎn)錄產(chǎn)物;非編碼區(qū)來自基因組注釋,序列相當(dāng)于基因組重疊群;

14)YP_***:protein mixed,蛋白產(chǎn)物;不涉及到轉(zhuǎn)錄組,主要用來標(biāo)記細(xì)菌、病毒和線粒體;

15)ZP_***:protein automated,蛋白產(chǎn)物?;主要是用電腦自動注釋;

16)NS_***:genomic automated,未知生物分子基因組序列。

參考文章

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容