背景
這是一篇文獻(DNA damage is a major cause of sequencing errors, directly confounding variant identification.)的簡單介紹。
NGS 用于腫瘤細胞的體細胞突變的檢測有著重要的意義。由于腫瘤細胞的異質(zhì)性以及正常細胞的背景,腫瘤細胞的用藥相關(guān)的基因突變往往是低豐度的。而低豐度的突變會受到PCR錯誤、測序錯誤、DNA損傷的影響,帶來很多假突變。其中DNA損傷帶來的影響尤為嚴重。
FFPE DNA, 時間久遠的DNA,ctDNA 都會受到損傷的影響。公共數(shù)據(jù)庫,1000 Genomes Project 和 TCGA 中的數(shù)據(jù)大部分也存在DNA損傷。
全局不平衡值(GIV) 衡量DNA Damage
為了檢測DNA損傷對突變檢測的影響,文章使用illumina 文庫準備流程,使用雙端測序。連上接頭序列的雙鏈模板DNA,在測序中讀為 R1,而他們的互補鏈則讀為 R2。
DNA損傷會造成DNA雙鏈中的一條鏈引入錯誤的堿基,從而導(dǎo)致R1中的某一種突變類型(例如:G-T) 遠遠超過R2。如圖:

基于這種不平衡設(shè)計了一組 GIV 值來檢查DNA damge: https://github.com/Ettwiller/Damage-estimator
- C1v : R1 中G→T的突變數(shù)量;
- C1 : R1 中G 的總量;
- C2v: R2中C→A的突變數(shù)量;
- C2: R2中C的總量;
- C1v_RC: R1中C→A的突變數(shù)量;
- C1_RC: R1中 C 的總量;
- C2v_RC: R2中 G→T的突變數(shù)量;
- C2_RC: R2中 G 的總量。
文章中,認為GIV 的值超過1.5表示有嚴重的損傷,暗示至少有三分之一的突變是錯誤的。沒有DNA損傷的話IGV值應(yīng)該是1。
DNA氧化損傷
使用DNA 修復(fù)試劑盒可以顯著降低損傷。同時,DNA 破碎的緩沖液環(huán)境也是避免氧化損傷的重要部分。
由DNA 損傷引入的測序錯誤,并不會降低測序的堿基質(zhì)量值,提高突變檢測的質(zhì)量值無法去除這些錯誤。
DNA 的氧化損傷沒有序列的特異性,在DNA上隨機發(fā)生。
氧化損傷影響的突變分度范圍
氧化損傷形成的假突變豐度大部分在5%以下,其中1%-5%區(qū)間的突變,對我們突變檢測的影響最大。因為這些突變有足夠的reads證據(jù)支持,容易保留。