每日paper - 20211229 - startmrca 推斷有利等位基因的 allele age(二)

Estimating Time to the Common Ancestor for a Beneficial Allele

2018 年發(fā)表在 Molecular Biology and Evolution 上。第一作者與通訊作者為芝加哥大學(xué) Department of Ecology and Evolution 的 Joel Smith。

接上篇:每日paper - 20211207 - smartmrca 推斷有利等位基因的 allele age(一)

研究者們開發(fā)的這一模型根據(jù)已有的樣品推算有利變異的最近共同祖先 TMRCA。對于有利突變,往回追溯,會發(fā)現(xiàn)其頻率的下降與選擇強(qiáng)度是成比例的;不同的攜帶該有利突變的單倍型往回追溯,最終會 coalescent。這對于初始個體數(shù)目少的群體的增長也是同樣的道理。

因此,受選擇位點(diǎn)的群體歷史往往是 “star-shaped”,就可以近似認(rèn)為,在選擇作用強(qiáng)時,lineages 之間是相互獨(dú)立的。但是這里也有一個需要強(qiáng)調(diào)的前提,就是有利等位基因出現(xiàn)后就立即受到選擇,否則就會存在多個祖先單倍型、譜系歷史不是 star-shaped。

將關(guān)注位點(diǎn)的上下游區(qū)域分開來考慮。

經(jīng)推導(dǎo)得公式:

對模擬數(shù)據(jù)的測試顯示,在選擇作用強(qiáng)、選擇的 reference panel 與待檢測群體的分化程度合適時,模型的準(zhǔn)確率高。有利變異的頻率對結(jié)果的影響不是很大,在頻率低時略微地更準(zhǔn)確一些。如果選擇的外群與待檢測群體的分化程度過高,會高估 TMRCA。

文中的 reference panel 分化時間 N 和 0.5N 分別近似于 Fst 0.4 和 0.2。

除了 reference panel 的分化時間以外,還存在另一個可能的 bias 的來源。一些重組事件可能并不能被觀察到,因?yàn)楫?dāng)有利等位基因頻率上升后,一些重組事件可能并不會導(dǎo)致 ancestral 和 background 之間的 transition(background 指的是有利等位基因攜帶的單倍型,ancestral 指的是沒有有利等位基因的單倍型)。一個可能的解決方案是將基于頻率的替換可能性考慮進(jìn)來(Chen at al., 2015)。

模型假設(shè)所有單倍型的進(jìn)化歷史是相互獨(dú)立的,在樣品量過大、TMRCA 較為久遠(yuǎn)、以及有利變異出現(xiàn)后經(jīng)歷了一段時間才開始受到選擇作用的情況下,這個假設(shè)往往是不成立的。

對變異和重組率的正確的判斷對于模型的準(zhǔn)確性有非常大的影響。在沒有可用的 fine-scale 重組圖譜的情況下,建議使用研究區(qū)域的 uniform 重組率。選擇合適的突變率也很重要。

startmrca 的 github 網(wǎng)址?https://github.com/jhavsmith/startmrca

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容