#BiocManager::install("org.Hs.eg.db")
#1、TCGA基因ID的轉(zhuǎn)換
library(stringr)
exp$Ensembl_ID <- rownames(exp)
exp$Ensembl_ID=str_sub(exp$Ensembl_ID,1,15)
library(clusterProfiler)
library(org.Hs.eg.db)
# 查看org.Hs.eg.db 包提供的轉(zhuǎn)換類型
keytypes(org.Hs.eg.db)
# 需要轉(zhuǎn)換的Ensembl_ID
Ensembl_ID <- exp$Ensembl_ID
# 采用bitr()函數(shù)進(jìn)行轉(zhuǎn)換
gene_symbol <- bitr(Ensembl_ID, fromType="ENSEMBL", toType=c("SYMBOL", "ENTREZID"), OrgDb="org.Hs.eg.db")
# 查看轉(zhuǎn)換的結(jié)果
head(gene_symbol)
gene_symbol= gene_symbol[match(exp$Ensembl_ID,gene_symbol$ENSEMBL),]#匹配到表達(dá)矩陣中
exp$SYMBOL <- gene_symbol$SYMBOL
#整理去重,把重復(fù)的取平均值
exp <- exp[,-(ncol(exp)-1)]
exp2<-avereps(exp,ID=exp$SYMBOL)
exp2 <- as.data.frame(exp2)
exp2 <- exp2[!is.na(exp2$SYMBOL),]#去除沒有匹配的
rownames(exp2) <- exp2$SYMBOL
exp <- exp2[,-ncol(exp2)]
```r
TCGA基因ID的轉(zhuǎn)換為基因symbol
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 接著上一個(gè)帖子,在總結(jié)出我說(shuō)可以通過(guò)爬蟲獲得兩個(gè)基因命名規(guī)則匹配的文本文件,但是肥肥讓我想到了一個(gè)辦法可以在網(wǎng)站上...
- ----前不久拿到公司給的轉(zhuǎn)錄組測(cè)序結(jié)果,Gene ID是以ENMUST開頭,查了一下,ENST為EMBL 核酸數(shù)...
- 下面以人類基因?yàn)槔?library('biomaRt')mart <- useDataset("hsapiens...
- 測(cè)序上游分析系列: mRNA-seq轉(zhuǎn)錄組二代測(cè)序從raw reads到表達(dá)矩陣:上中游分析pipelinemiR...
- 使用R語(yǔ)言獲取人類所有基因的名字,ID,symbol以及別名 參考https://vip.biotrainee.c...