【NCBI編號】NCBI中編號/編碼說明
在日常分析中,我們在NCBI數(shù)據(jù)中常常見到AC、NC、NM、NR、NP、NG等各類編號,這類編號分別代表著怎樣的含義?我們該如何根據(jù)自己的需求來選擇正確的編號呢?
今天就來說一說常見的NCBI編號的意義。
1)AC_***:genomic mixed,一些可供選擇的注釋的基因組序列,主要用來標(biāo)記病毒和原核生物;
2)AP_***:protein mixed,AC_標(biāo)記序列對應(yīng)的蛋白產(chǎn)物;
3)NC_***:genomic mixed,完整的基因組分子序列,標(biāo)記的類別包括基因組、染色體、細(xì)胞器、質(zhì)粒;
4)NG_***:genomic mixed,不完整的基因組區(qū)域,提供NCBI基因組注釋途徑。比較有代表性有不轉(zhuǎn)錄的假基因或者哪些很難自行化注釋的基因組簇;
5)NM_***:mRNA mixed,轉(zhuǎn)錄組產(chǎn)物序列;成熟mRNA轉(zhuǎn)錄本序列;
6)NP_***:protein mixed,蛋白產(chǎn)物;主要是全長轉(zhuǎn)錄氨基酸序列,但也有一些只有部分蛋白質(zhì)的部分氨基酸序列;
7)NR_***:RNA mixed,非編碼的轉(zhuǎn)錄子序列,包括結(jié)構(gòu)RNAs,假基因轉(zhuǎn)子等;
8)NT_***:genomic automated,BAC或者鳥槍測序法的還未完全注釋的測序序列;
9)NW_***:genomic automated,BAC或者鳥槍法測序的還未完全注釋的測序序列;
10)NZ_ABCD1234***:genomic automated,收集的各種利用鳥槍法測序的測序計劃,ABCD?代表的是計劃名稱;
11)?XM_***:mRNA automated,轉(zhuǎn)錄產(chǎn)物;mRNA來自基因組注釋,序列相當(dāng)于基因組重疊群;
12)XP_***:protein automated,蛋白產(chǎn)物;序列相當(dāng)于基因組重疊群;
13)XR:RNA automated,轉(zhuǎn)錄產(chǎn)物;非編碼區(qū)來自基因組注釋,序列相當(dāng)于基因組重疊群;
14)YP_***:protein mixed,蛋白產(chǎn)物;不涉及到轉(zhuǎn)錄組,主要用來標(biāo)記細(xì)菌、病毒和線粒體;
15)ZP_***:protein automated,蛋白產(chǎn)物?;主要是用電腦自動注釋;
16)NS_***:genomic automated,未知生物分子基因組序列。