NGS 中 DNA?damage?的鑒別

背景

這是一篇文獻(DNA damage is a major cause of sequencing errors, directly confounding variant identification.)的簡單介紹。
NGS 用于腫瘤細胞的體細胞突變的檢測有著重要的意義。由于腫瘤細胞的異質(zhì)性以及正常細胞的背景,腫瘤細胞的用藥相關(guān)的基因突變往往是低豐度的。而低豐度的突變會受到PCR錯誤、測序錯誤、DNA損傷的影響,帶來很多假突變。其中DNA損傷帶來的影響尤為嚴重。

FFPE DNA, 時間久遠的DNA,ctDNA 都會受到損傷的影響。公共數(shù)據(jù)庫,1000 Genomes Project 和 TCGA 中的數(shù)據(jù)大部分也存在DNA損傷。

全局不平衡值(GIV) 衡量DNA Damage

為了檢測DNA損傷對突變檢測的影響,文章使用illumina 文庫準備流程,使用雙端測序。連上接頭序列的雙鏈模板DNA,在測序中讀為 R1,而他們的互補鏈則讀為 R2。

DNA損傷會造成DNA雙鏈中的一條鏈引入錯誤的堿基,從而導(dǎo)致R1中的某一種突變類型(例如:G-T) 遠遠超過R2。如圖:

Untitled.png

基于這種不平衡設(shè)計了一組 GIV 值來檢查DNA damge: https://github.com/Ettwiller/Damage-estimator

GIV_{G-T} = \frac {Rate_{R1_{G-T}::R2{C-A}}}{Rate_{R1_{C-A}::R2{G-T}}} = \frac {(\frac {C1v +C2v}{C1 + C2})}{(\frac {C1v\_RC+C2v\_RC}{C1\_RC+C2\_RC})}

  • C1v : R1 中G→T的突變數(shù)量;
  • C1 : R1 中G 的總量;
  • C2v: R2中C→A的突變數(shù)量;
  • C2: R2中C的總量;
  • C1v_RC: R1中C→A的突變數(shù)量;
  • C1_RC: R1中 C 的總量;
  • C2v_RC: R2中 G→T的突變數(shù)量;
  • C2_RC: R2中 G 的總量。

文章中,認為GIV 的值超過1.5表示有嚴重的損傷,暗示至少有三分之一的突變是錯誤的。沒有DNA損傷的話IGV值應(yīng)該是1。

DNA氧化損傷

使用DNA 修復(fù)試劑盒可以顯著降低損傷。同時,DNA 破碎的緩沖液環(huán)境也是避免氧化損傷的重要部分。

由DNA 損傷引入的測序錯誤,并不會降低測序的堿基質(zhì)量值,提高突變檢測的質(zhì)量值無法去除這些錯誤。

DNA 的氧化損傷沒有序列的特異性,在DNA上隨機發(fā)生。

氧化損傷影響的突變分度范圍

氧化損傷形成的假突變豐度大部分在5%以下,其中1%-5%區(qū)間的突變,對我們突變檢測的影響最大。因為這些突變有足夠的reads證據(jù)支持,容易保留。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容