Estimating Time to the Common Ancestor for a Beneficial Allele
2018 年發(fā)表在 Molecular Biology and Evolution 上。第一作者與通訊作者為芝加哥大學(xué) Department of Ecology and Evolution 的 Joel Smith。
接上篇:每日paper - 20211207 - smartmrca 推斷有利等位基因的 allele age(一)
研究者們開發(fā)的這一模型根據(jù)已有的樣品推算有利變異的最近共同祖先 TMRCA。對于有利突變,往回追溯,會發(fā)現(xiàn)其頻率的下降與選擇強(qiáng)度是成比例的;不同的攜帶該有利突變的單倍型往回追溯,最終會 coalescent。這對于初始個體數(shù)目少的群體的增長也是同樣的道理。
因此,受選擇位點(diǎn)的群體歷史往往是 “star-shaped”,就可以近似認(rèn)為,在選擇作用強(qiáng)時,lineages 之間是相互獨(dú)立的。但是這里也有一個需要強(qiáng)調(diào)的前提,就是有利等位基因出現(xiàn)后就立即受到選擇,否則就會存在多個祖先單倍型、譜系歷史不是 star-shaped。
將關(guān)注位點(diǎn)的上下游區(qū)域分開來考慮。

經(jīng)推導(dǎo)得公式:

對模擬數(shù)據(jù)的測試顯示,在選擇作用強(qiáng)、選擇的 reference panel 與待檢測群體的分化程度合適時,模型的準(zhǔn)確率高。有利變異的頻率對結(jié)果的影響不是很大,在頻率低時略微地更準(zhǔn)確一些。如果選擇的外群與待檢測群體的分化程度過高,會高估 TMRCA。

文中的 reference panel 分化時間 N 和 0.5N 分別近似于 Fst 0.4 和 0.2。
除了 reference panel 的分化時間以外,還存在另一個可能的 bias 的來源。一些重組事件可能并不能被觀察到,因?yàn)楫?dāng)有利等位基因頻率上升后,一些重組事件可能并不會導(dǎo)致 ancestral 和 background 之間的 transition(background 指的是有利等位基因攜帶的單倍型,ancestral 指的是沒有有利等位基因的單倍型)。一個可能的解決方案是將基于頻率的替換可能性考慮進(jìn)來(Chen at al., 2015)。
模型假設(shè)所有單倍型的進(jìn)化歷史是相互獨(dú)立的,在樣品量過大、TMRCA 較為久遠(yuǎn)、以及有利變異出現(xiàn)后經(jīng)歷了一段時間才開始受到選擇作用的情況下,這個假設(shè)往往是不成立的。
對變異和重組率的正確的判斷對于模型的準(zhǔn)確性有非常大的影響。在沒有可用的 fine-scale 重組圖譜的情況下,建議使用研究區(qū)域的 uniform 重組率。選擇合適的突變率也很重要。
startmrca 的 github 網(wǎng)址?https://github.com/jhavsmith/startmrca