在發(fā)育過(guò)程中,細(xì)胞會(huì)對(duì)刺激做出反應(yīng),在整個(gè)生命過(guò)程中,從一種功能性“狀態(tài)”轉(zhuǎn)變?yōu)榱硪环N功能性“狀態(tài)”。處于不同狀態(tài)的細(xì)胞表達(dá)的基因不同,產(chǎn)生蛋白質(zhì)和代謝物的動(dòng)態(tài)重復(fù)序列,從而完成它們的工作。當(dāng)細(xì)胞在不同狀態(tài)間轉(zhuǎn)變時(shí),會(huì)經(jīng)歷轉(zhuǎn)錄重組的過(guò)程,其中一些基因被沉默,而另一些基因被激活。這些瞬時(shí)狀態(tài)通常難以表征,因?yàn)樵诟€(wěn)定狀態(tài)之間純化細(xì)胞是困難或不可能的。單細(xì)胞RNA-Seq可以使您在不需要純化細(xì)胞的情況下查看這些狀態(tài)。然而,要做到這一點(diǎn),我們必須確定每個(gè)細(xì)胞的可能狀態(tài)范圍。
今天給大家介紹的是基于Monocle2(目前Monocle已經(jīng)更新至3版本,該版本仍處在開(kāi)發(fā)階段)的擬時(shí)分析。Monocle不是通過(guò)實(shí)驗(yàn)將細(xì)胞純化成離散狀態(tài),而是使用一種算法來(lái)學(xué)習(xí)每個(gè)細(xì)胞必須經(jīng)歷的基因表達(dá)變化序列,作為動(dòng)態(tài)生物學(xué)過(guò)程的一部分。一旦它了解了基因表達(dá)變化的整體“軌跡”,Monocle就可以將每個(gè)細(xì)胞放置在軌跡中的適當(dāng)位置。Monocle依靠一種叫做反向圖嵌入的機(jī)器學(xué)習(xí)技術(shù)來(lái)構(gòu)建單細(xì)胞軌跡(算法參考文獻(xiàn):Reversed graph embedding resolves complex single-cell trajectories)。
Monocle2分析主要基于以下3個(gè)步驟:
1、基因篩選:Monocle尋找以“有趣”(即不只是嘈雜)方式變化的基因,并利用這些基因來(lái)構(gòu)造數(shù)據(jù)。
2、降低維度:一旦選擇了用于細(xì)胞排序的基因,Monocle就會(huì)對(duì)數(shù)據(jù)進(jìn)行降維處理。
3、pseudotime對(duì)細(xì)胞排序:通過(guò)將表達(dá)數(shù)據(jù)投影到較低維空間,構(gòu)建細(xì)胞間的分化軌跡。
結(jié)果解讀:

圖一:樹(shù)形結(jié)構(gòu)軌跡圖
圖中每個(gè)點(diǎn)代表一個(gè)細(xì)胞,具有相似細(xì)胞狀態(tài)的細(xì)胞被聚到一起,每個(gè)分支點(diǎn)代表著一個(gè)可能的細(xì)胞生物學(xué)過(guò)程決策點(diǎn)(該例圖中有2個(gè)分支點(diǎn))。左圖為按照細(xì)胞聚類信息進(jìn)行顏色標(biāo)注(如果您已經(jīng)對(duì)每個(gè)cluster進(jìn)行了細(xì)胞鑒定,也可以基于具體的細(xì)胞進(jìn)行著色),右圖為按照分化狀態(tài)(State)進(jìn)行顏色標(biāo)注。
當(dāng)細(xì)胞cluster或state數(shù)量過(guò)多時(shí),很難看出每個(gè)cluster或狀態(tài)落在樹(shù)上的哪個(gè)位置(如圖一左圖)。因此,我們還可以將每個(gè)cluster或狀態(tài)的軌跡圖分開(kāi)展示,便于對(duì)每個(gè)cluster或狀態(tài)進(jìn)行研究。

圖二:每類細(xì)胞(或State)軌跡圖
確定了分化起點(diǎn)后,Monocle可以模擬出每個(gè)細(xì)胞所處的分化時(shí)間(pseudotime,偽時(shí)間),并尋找隨著分化時(shí)間逐漸升高或降低的基因(圖四為擬時(shí)序變化相關(guān)基因(Top6)表達(dá)分布圖和top50基因熱圖,如果有特別關(guān)注的基因也可以基于關(guān)注的基因進(jìn)行繪制)。

圖三:每個(gè)細(xì)胞分化時(shí)間(pseudotime)軌跡圖

圖四:擬時(shí)序變化相關(guān)基因表達(dá)分布圖和熱圖