10x VDJ web summary troubleshooting

1.png

使用Cellranger vdj 流程能得到一個網(wǎng)頁版的報告,如上圖樣式.

今天將對這幾個指標(biāo)進行解釋說明,用于后續(xù)troubleshooting。

問題:在10X V(D)J 數(shù)據(jù)中使用哪些指標(biāo)來troubleshooting?

V(D)J網(wǎng)頁報告提供了一些關(guān)鍵的指標(biāo),能夠幫助排除V(D)J實驗中的某些問題,由于GEX和V(D)J數(shù)據(jù)集之間的細胞富集差而產(chǎn)生??梢詭椭鉀Q這類問題。

指標(biāo)1 :Estimated number of cells

描述和限制:

細胞數(shù)量,barcode的數(shù)量估計與表達靶向V(D)J轉(zhuǎn)錄本的細胞有關(guān)。這個值取決于預(yù)期的T/B細胞數(shù)量。

失敗的原因:

V(D)J細胞數(shù)量低于或高于預(yù)期可能是由于樣本質(zhì)量差、文庫質(zhì)量差或測序質(zhì)量差。

  • 如果細胞數(shù)量過高,建議cellranger multi刪除背景*。

  • 如果細胞數(shù)量過低,考慮查看Reads mapped to any V(D)J gene的值(如下),并聯(lián)系10x Genomics技術(shù)支持,獲得文庫富集溯源。

指標(biāo)2 :Reads mapped to any V(D)J gene

描述和限制:

部分或全部read比對到V(D)J基因片段的比例。

  • Ideal > 50% ; > 40% is an acceptable limit.

失敗的原因:

這可能與樣本中B細胞或T細胞的比例有關(guān)。低比例的樣本可能只有有限數(shù)量的B細胞或T細胞。這些樣品可能需要富集,請參考這篇文章中的方法。

  • 在一些其他的情況下,這可能是由于化學(xué)試劑用錯或reference使用錯誤。

指標(biāo)3 :Cells with productive V(D)J spanning pair

描述和限制:

被稱為是細胞的barcode的比例,每個受體對至少有一個鏈?zhǔn)莗roductive contig(參考引申問題)。

  • Ideal > 30% ; >20% is an acceptable limit

【引申問題】什么是productive contig呢?

使用cellranger vdjcontig_annotations.csv(或者filtered_contig_annotations.csv)結(jié)果中會有一列:Productive,

一個 productive contig必須滿足下列條件:

  1. 是跨過了V到J的區(qū)域,起始密碼子在leader region。

  2. 是否有一個帶有起始密碼子的可檢測的CDR3區(qū)域

  3. 在V-J跨越區(qū)域中沒有停止密碼子。

失敗的原因:

較低的值可能表明樣品質(zhì)量較差,富集較差或低,覆蓋較差或測序深度較低。捕獲或表達單鏈可能有如下幾個原因(參考引申問題)。

  • 在極少數(shù)情況下,也有可能是化學(xué)試劑用錯導(dǎo)致值低。

【引申問題】:為什么有些clonotype只有1個productive 鏈呢?

每個細胞都有一個TRA和TRB鏈,為什么有些clonotype只有1個productive 鏈呢?回答:Cell Ranger 流程沒有過濾掉只有1條鏈的contig。有很多原因:

  • 沒有檢測到mRNA轉(zhuǎn)錄本: 缺失鏈的mRNA轉(zhuǎn)錄本可能已經(jīng)存在于細胞中,但沒有被檢測到。對于低表達的轉(zhuǎn)錄本尤其如此。

  • 沒有contig組裝: 一些被檢測到的轉(zhuǎn)錄本可能無法組裝成contig。

  • 未被標(biāo)記為有效: 一些組裝的contigs可能無法被標(biāo)記為有效contig。過濾后的結(jié)果中只顯示productive鏈。在all_contig_annotations.csv文件中能查找未被標(biāo)記為有效的contig。

  • 在極少數(shù)情況下,細胞可能只表達一條鏈。

指標(biāo)4 :Median UMIs per cell for V(D)J gene

描述和限制:

每個細胞中分配給VDJ 基因{每條鏈}的contig的UMI數(shù)的中位數(shù)(鏈?zhǔn)侵窽RA/TRB或IGH/IGK/IGL)。

  • Ideal >0 UMIs

失敗的原因:

中位數(shù)越高,表明對該鏈表達的支持越高。

中位數(shù)為0的UMI往往表明TCR/BCR鏈表達較差,樣品質(zhì)量較差,或在某些情況下富集較差/低。在極少數(shù)情況下,缺失的鏈可能反映了樣本的生物學(xué)特性。

盡管表達水平與細胞類型有關(guān),但通常情況下TRA轉(zhuǎn)錄本的表達水平要低于TRB轉(zhuǎn)錄本。如果有GEX數(shù)據(jù),可以使用Loupe文件來識別T/B細胞的表達,步驟參考這里。

指標(biāo)5:Barcode Rank plot

描述和限制:

根據(jù)實驗,評估觀察到的barcode被稱為細胞的比例和每個條形碼的UMI計數(shù)范圍。

Y軸是UMI 數(shù),是在x軸上映射到每個barcode的過濾過的UMI數(shù)。圖的顏色基于與細胞相關(guān)的barcode的局部密度。

失敗的原因:

在rank plot中出現(xiàn)的凸起可以表明一組高表達的細胞類型。例如,在Ig數(shù)據(jù)的web_summary中,漿細胞可以導(dǎo)致這種表型。

在下面的另一個例子中,V(D)J庫中的細胞太少了,我們可以看到藍色的線尾隨到UMI很低的barcode中。

指標(biāo)6:Valid Barcodes

描述和限制:

barcode校正后與白名單匹配的reads的比例。

  • Ideal > 85%

  • Acceptable is >75%

失敗的原因:

如果這項出現(xiàn)有效barcode低的警告,可能發(fā)生以下幾種原因:

  • 通常與樣品質(zhì)量差、測序質(zhì)量差或測序參數(shù)不當(dāng)有關(guān)。

  • 在極少數(shù)情況下,這一警告可能是由于SPRI清洗過程中乙醇洗滌液去除不完全,可能導(dǎo)致不需要的產(chǎn)品放大,有時會導(dǎo)致有效barcode降低。請參考這篇文章。

指標(biāo)7:Top clonotype histogram

描述和限制:

histogram顯示了樣本中10個豐度最高的克隆型所占的細胞比例。在好的樣本中,大多數(shù)克隆型會同時擁有兩條鏈。

失敗的原因:

如果注意到一個多鏈的大克隆型部分,這是極有可能是ambient RNA(*下文解釋)。Cell Ranger v5及以上版本實現(xiàn)了一種更好的克隆類型分組算法。在多個克隆型中存在相同的鏈也表示為 ambient RNA。

*其他注意事項:10X的算法試圖過濾掉含有ambient RNA的乳細胞受到壓力或有一些鏈泄漏的barcode。如果有GEX文庫,這可以從高表達的核糖體(RPS/RPL)、線粒體(MT-/)和MALAT1基因(死亡和死亡細胞的關(guān)鍵特征)中確定。如果適用,請參閱關(guān)于死細胞去除方案的技術(shù)說明。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容