RNA velocity of single cells文獻學習

在之前的一個視頻學習系列筆記里,有一篇筆記提到了RNA velocity(Single cell RNA-seq data analysis with R視頻學習筆記(八)),但當時沒有仔細的去對RNA velocity進行詳細的了解。這篇文獻學習筆記就是對這個模型進行更詳細的了解。

文獻:RNA velocity of single cells
發(fā)表于2018年,Nature。
如果想下載這篇文獻,而又沒Nature官網(wǎng)權(quán)限的童鞋可以在這里下載:here

(筆記里很多補充圖沒有放上來,想看的可以從上面鏈接下載文章看)

【摘要】
RNA豐度是單個細胞狀態(tài)的一個強大的指標。單細胞RNA測序可以精確的、高通量的揭示RNA豐度。然而,這種方法只能捕捉某一個時間點的“快照”(snapshot),對于分析胚胎形成或者組織重建的這種需要觀測連續(xù)時間的“事件”就比較困難了。這里我們提出了“RNA velocity”(RNA速度),可以直接測定在單細胞測序結(jié)果中的“未成熟”mRNA和“成熟”mRNA。RNA velocity是一個高維度載體,可以預測單個細胞在時間軸上的“未來的”幾個小時的狀態(tài)。我們利用神經(jīng)嵴系驗證了RNA velocity的精確度,證明了它可以用在多種測序平臺上,利用它揭示了發(fā)育中的小鼠海馬體的分支譜系樹,并測定了人類腦胚胎的轉(zhuǎn)錄動力學。

【正文】
在發(fā)育過程中,分化過程發(fā)生在時間軸上的幾小時到數(shù)天不等。而未成熟的mRNA(unspliced)和成熟的mRNA(spliced)的相對豐度可以評估基因剪切和降解的速率。我們推斷這種信號可以在單細胞測序數(shù)據(jù)中被檢測到,從而可以揭示在動態(tài)的過程中,整個轉(zhuǎn)錄的速率和變化。

所有的單細胞RNA測序方法都是依賴于oligo-dT引物,通過富集帶有polyA的mRNA分子來得到測序材料。盡管如此,現(xiàn)有的測序平臺(SMART-seq2, STRT/
C1, inDrop and 10x Genomics)的測序結(jié)果中,都含有15-25%的reads包含未成熟帶有內(nèi)含子的序列(圖1a)。在常規(guī)bulk RNA-seq里含有14.6%的未成熟mRNA reads,單細胞測序中含有20%的未成熟mRNA reads。在10x Genomics文庫里,這一類mRNA的reads主要是由于PCR擴增時候產(chǎn)生的。

為了量化時間依賴的mRNA前提和成熟的mRNA,我們給轉(zhuǎn)錄動力學假定了一個簡單的模型,成熟的mRNA豐度由未成熟mRNA產(chǎn)生的spliced mRNA和降解的速度來決定(圖1b)。在這個動態(tài)的過程中,轉(zhuǎn)錄速率a上升,導致了unspliced的mRNA增加,從而導致成熟的mRNA的增多(圖1c),直到一個新的穩(wěn)定狀態(tài)。反之亦然。在基因表達的誘導過程里,未成熟的mRNA的存在超出了預期(圖1d)。這兩種mRNA的平衡是在未來狀態(tài)里成熟mRNA豐度的一個重要指標,也是意味著決定了細胞未來的狀態(tài)。

為了證明這個模型可以用來推斷在“未來時間里”成熟的mRNA豐度,我們用bulk-RNA-seq方法檢測了小鼠肝臟的日周期的一個時間過程。未成熟的mRNA水平在每一個時間點都與隨后一個時間點上成熟的mRNA水平相似(圖1e),許多與節(jié)律相關(guān)的基因也展示出了unspliced mRNA的上調(diào)的趨勢(圖1f,g)。這一模型可以讓我們在每一個周期里進行測定,準確捕捉晝夜節(jié)律周期發(fā)展的預期方向(圖1h)。

圖1

接下來,為了證明在單細胞水平上,這個模型也可以預測轉(zhuǎn)錄動力學,我們分析了近期發(fā)表的老鼠嗜鉻細胞的數(shù)據(jù),是SMARTseq2平臺測序的(圖2a)。在發(fā)育過程中,相當比例的嗜鉻細胞(即腎上腺髓質(zhì)的神經(jīng)內(nèi)分泌細胞)源自Schwann細胞前體,為我們的模型提供了一個簡單的測試,并可以通過譜系跟蹤來驗證。圖2b和c里綠色/灰色的圖代表著基因的表達情況,綠色代表表達水平高;而紅色/藍色圖則表達未成熟mRNA和成熟mRNA,說明Serpin2這個基因是處在一個被抑制的狀態(tài),而Chga基因處于被激活的狀態(tài)。RNA速度對單個細胞進行評估,準確地再現(xiàn)了該數(shù)據(jù)的轉(zhuǎn)錄動力學,包括細胞的分化,比如細胞向嗜鉻細胞方向發(fā)展(圖2d)。RNA速度還捕獲了嗜鉻的細胞-周期動力學,包括PCA分析和細胞周期相關(guān)基因的分析。

有很多的技術(shù)可以對velocity在低維里進行可視化。細胞狀態(tài)的推測可以嵌入一個低維空間里(比如PCA,圖2d)或者tSNE(圖2h)。在一個很大的數(shù)據(jù)集了,RNA velocity更容易被可視化(圖Fig. 2i)。因為細胞可以同時擁有多個獨立的RNA velocity存在,比如分化、成熟和增殖。

細胞特異性的RNA velocity評估提供了一個自然的基礎(chǔ)對細胞命運進行定量建模。有效的可推測的時間軸,取決于你要研究的生物過程。比如用EdU標記的嗜鉻祖細胞,我們可以推測的“未來”時間是2.5-3.8小時(圖Fig. 2f, g)。由于這種推測是線性的,所以推測時間軸也依賴于基因表達軌跡的形狀。

圖2

我們接著利用RNA velocity對小鼠的海馬體的風雨譜系的分支進行分析。去除血管、免疫細胞、GABAergic 和卡哈爾Retzius神經(jīng)元后,t-SNE圖揭示了一個復雜的分支(圖3a)。我們使用已知的標記基因鑒定了星形細胞、少突細胞前體 (OPCs)、齒狀回顆粒神經(jīng)元和錐體神經(jīng)元五個細胞群:the subiculum, CA1, CA2, CA3,hilus。單個基因的相位圖展示了特異的基因表達的誘導和抑制(圖3b)。采用馬爾可夫速度隨機游走模型可以自動識別分支的終端和root(圖3c),展示了RNA速度可以在沒有已知的發(fā)育過程的前提下,確定譜系的方向。

在微觀層面上,“命運”選擇是一個傾向于非決定性過程,這個過程涉及到基因的表達,一旦轉(zhuǎn)錄因子的反饋loop建立后,細胞的“命運”便被“鎖定”了。比較一個pre-OPC群里的細胞和一個處于過度期(narrow passage)的細胞的未來狀態(tài)的可能性分布,顯然后者更可能成為一個OPC細胞(圖 3d)。在圖3e里,單細胞分支譜系里,如果一個細胞的Prox1基因被激活,那么變形成granule神經(jīng)元,如果Prox1基因被抑制,那么細胞會分化成neuroblasts。

圖3

為了證明RNA速度可以在人體胚胎內(nèi)被檢測到,我們進行了基于液滴的單細胞RNA-seq的實驗,分析了在懷孕十周后人類前腦的發(fā)育過程,主要研究谷氨酸能神經(jīng)元譜系(圖4a)。我們發(fā)現(xiàn)由增殖的前體細胞狀態(tài)(radial glia)通過一系列中間成神經(jīng)細胞的狀態(tài)向更成熟的分化的谷氨酸能神經(jīng)元(表達SLC17A7)產(chǎn)生了一個很強的velocity模式。我們利用多重原位雜交實驗,驗證了皮質(zhì)神經(jīng)元發(fā)育的已知和新的標記物,(圖4b, c)。這些在組織中分層的基因(圖4c)與單細胞RNA-seq數(shù)據(jù)中基因的偽時間分布密切相關(guān)(圖4b)。

我們利用PCA來把細胞根據(jù)分化的“擬時間”進行排序,確定了未成熟mRNA始終先出現(xiàn)于成熟的mRNA(圖4d)。從4d里還可以看到不同的動力學特征。比如RNASEH2B基因?qū)儆趂ast動力學,因為它的unspliced和spliced RNA差不多。相反的,DCX,ELAVL4 和STMN2基因在剛開始有一個快速的轉(zhuǎn)錄,隨后的轉(zhuǎn)錄速度下降(藍色線下降),成熟的mRNA有一個明顯的滯后軌跡。

圖4

由于RNA速度是基于真實的轉(zhuǎn)錄動力學,這方法有望為我們的研究帶來更堅實的定量基礎(chǔ),幫助我們了解細胞在基因表達空間中的動態(tài)分化。RNA速度已經(jīng)可以用來進行詳細的對整個有機體的動態(tài)過程的研究,為譜系分析提供很大的便利,特別是在人類胚胎中。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。

友情鏈接更多精彩內(nèi)容