PIVOT:轉(zhuǎn)錄組數(shù)據(jù)整合分析和可視化平臺
原標(biāo)題:platform for interactive analysis and visualization of transcriptomics data
原文地址: https://bmcbioinformatics.biomedcentral.com/articles/10.1186/s12859-017-1994-0
轉(zhuǎn)錄組分析是目前可以說最成熟的分析體系,并且已經(jīng)有有很多的R包可以用來進(jìn)行數(shù)據(jù)分析。但是使用這些R包需要你有一定寫腳本的能力,并且還要懂得如何對原始數(shù)據(jù)進(jìn)行處理。為了方便用戶使用, 作者整合了目前開源的R包,開發(fā)了一個(gè)網(wǎng)頁工具,相當(dāng)于給其他R包增加了可視化界面,用來滿足大家用鼠標(biāo)分析數(shù)據(jù)的渴望。
目前該工作有如下的分析模塊:
- 數(shù)據(jù)標(biāo)準(zhǔn)化
- 數(shù)據(jù)過濾
- 基本分析模塊
- 差異表達(dá)分析模塊:DESeq2, edgeR, SCDE, Monocle, Mann-Whitney U test
- 聚類: Hierarchical, K-means, SC3, Community detection, Classification with caret, Cell state ordering with Monocle2/Diffusion pseudotime
- 降維:PCA, t-SNE, Metric/Non-Metric MDS, penalized LDA, Diffusion Map
- 相關(guān)分析
- 基因集富集分析(Gene Set Enrichment Analysis):KEGG pathway analysis, Gene ontology analysis
- 互作網(wǎng)絡(luò)分析:STRING protein association network, Regnetwork visualization, Mogrify based trans-differentiation factor prediction
- 其他
作者文章還給了幾張很好看的圖,或許你會感興趣

我覺得要是你都知道如何正確使用這些工具,那你的數(shù)據(jù)分析能力也就合格了。所以感覺這個(gè)包不是給完全新手用,而是給那些寫代碼累了,用鼠標(biāo)點(diǎn)點(diǎn)休息娛樂下的人用。
安裝非常的簡單,由于PIVOT只是對已有的R包進(jìn)行整合開發(fā),所以僅僅只要保證你先安裝了R,之后就輸入如下命令,等待30分鐘左右即可。
# dependecies that need to be manually installed
install.packages("devtools")
library("devtools")
source("http://bioconductor.org/biocLite.R")
biocLite("BiocUpgrade")
biocLite("GO.db")
biocLite("HSMMSingleCell")
biocLite("org.Mm.eg.db")
biocLite("org.Hs.eg.db")
biocLite("DESeq2")
biocLite("SingleCellExperiment")
biocLite("scater")
biocLite("monocle")
# Install PIVOT
install_github("qinzhu/PIVOT")
biocLite("BiocGenerics") # You need the latest BiocGenerics >=0.23.3
如果你在Windows下安裝,你可能會遇到一些波折,請堅(jiān)持?。∠M銜吹竭@個(gè)界面

而我已經(jīng)因?yàn)橄旅孢@個(gè)問題而放棄了

TCGA-Assembler 2--獲取TCGA/CPTAC數(shù)據(jù)的好幫手
原標(biāo)題:TCGA-assembler 2: software pipeline for retrieval and processing of TCGA/CPTAC data
原文地址:https://academic.oup.com/bioinformatics/advance-article-abstract/doi/10.1093/bioinformatics/btx812/4764001?redirectedFrom=fulltext
The Cancer Genome Atlas (TCGA)項(xiàng)目里存放著大量的數(shù)據(jù)可供分析,但是下載數(shù)據(jù)一直是一個(gè)老大難的問題。尤其是2016年,TCGA的數(shù)據(jù)還轉(zhuǎn)移到了Genomic Data Commons (GDCs),并且還多了由CPTAC提供的TCGA的蛋白組學(xué)數(shù)據(jù)。
作者在開發(fā)過TCGA-Assembler方便進(jìn)行數(shù)據(jù)下載,為了能夠從新的數(shù)據(jù)庫中下載數(shù)據(jù),他更新了軟件版本,叫做TCGA-assembler 2 (TA2),能夠自動化從GDC和CPTAC里下載數(shù)據(jù)。
項(xiàng)目地址是:http://www.compgenome.org/TCGA-Assembler/
PS 這篇文章是2017年10月發(fā)的。