Holand2013 INLA

  1. Holand AM, Steinsland I, Martino S, Jensen H. Animal models and integrated nested Laplace approximations. G3 (Bethesda). [Internet]. 2013;3:1241–51. Available from: http://www.g3journal.org/content/3/8/1241.short

動物模型是在進(jìn)化生物學(xué)和動物育種中使用的廣義線性混合模型,以鑒定性狀的遺傳部分。集成嵌套拉普拉斯逼近(INLA)是一種用于對分級高斯馬爾可夫模型進(jìn)行快速,基于非抽樣的貝葉斯推理的方法。在本文中,我們證明了INLA方法可以用于許多版本的貝葉斯動物模型。我們使用INLA分析具有高斯,二項式和泊松似然性的合成案例研究和麻雀(Passer domesticus)群體病例研究的動物模型。使用馬爾科夫鏈蒙特卡羅方法將推斷結(jié)果與結(jié)果進(jìn)行比較。對于模型選擇,我們使用偏差信息標(biāo)準(zhǔn)(DIC)的差異。我們建議并展示如何通過將它們與模擬研究的抽樣結(jié)果進(jìn)行比較來評估DIC中的差異。我們還引入了一個R包,AnimalINLA,為使用INLA的貝葉斯動物模型容易和快速推理。


為了估計不同種類性狀的加性遺傳方差(以及遺傳力),生物學(xué)家和動物育種者經(jīng)常使用稱為動物模型的廣義線性混合模型(GLMM)。在動物模型中,個體i的性狀具有遺傳部分ui。值ui被稱為個體i的育種值。假設(shè)育種值是許多基因的影響的總和,并且來自中心極限定理,育種值被假定為具有由譜系給出的依賴性結(jié)構(gòu)的高斯分布。自20世紀(jì)80年代初以來,動物育種者成功地使用了限制最大可能性(REML)的頻率方法,例如增加牛的肉或牛奶產(chǎn)量(Simm1998)。然而,對REML的推論對于GLMM模型不是微不足道的。非高斯性狀的模型在育種值和其他參數(shù)估計的不確定性方面尤其具有挑戰(zhàn)性(Tempelman和Gianola 1994; Sorensen和Gianola 2002; Bolker等人2009; Fong等人2010)。流行的方法是用于計算育種值的最佳線性無偏預(yù)測(BLUP)(Henderson 1950)(Wilson等人2009)。然而,BLUP忽略了與估計相關(guān)的所有不確定性,并且不適合在進(jìn)化問題中的假設(shè)檢驗**(Postma 2006; Wilson等人2009; Hadfield等人2010)。另一種方法是在貝葉斯框架中執(zhí)行建模。所有參數(shù)都被認(rèn)為是隨機變量,并且(在理論上)直接考慮參數(shù)估計中的所有不確定性。這解決了推斷非高斯性狀的問題(Tempelman和Gianola 1994; Fong等人,2010),并解釋了育種值的估計不確定性。此外,貝葉斯建模還解決了關(guān)于育種值分析的許多問題,在Postma(2006),Wilson等人(2009),和Hadfield et al。 (2010),因為育種值和育種值的功能(例如,孵化年份的平均育種值)被認(rèn)為是隨機變量,因此考慮不確定性和依賴性。貝葉斯框架的這種靈活性使得貝葉斯動物模型越來越受歡迎。它們從1990年代早期開始用于動物育種,而最近才引入進(jìn)化生物學(xué)(Kruuk et al。2008; O'Hara et al。2008; Ovaskainen et al。2008; Hadfield 2010; Steinsland and Jensen 2010) 。參見Gianola和Fernando(1986)和Sorensen和Gianola(2002)討論貝葉斯動物模型。除了少數(shù)特殊情況,貝葉斯模型對于典型感興趣的數(shù)量(例如,后期均值)沒有閉合形式的分析表達(dá)式。因此,需要數(shù)值近似。貝葉斯模型的傳統(tǒng)近似程序是馬爾科夫鏈蒙特卡羅(MCMC)(Sorensen和Gianola 2002,Van De Wiel等人2013)。 MCMC是一種非常靈活的方法,可用于推斷任何貝葉斯模型,我們可以得到任何隨機變量或參數(shù)的后驗估計;少量,共同或功能。建立一個好的MCMC算法(快速收斂,良好的混合,計算速度快)和評估它(收斂和混合)是一個非專家的挑戰(zhàn)。最后,對于動物模型,這已經(jīng)改善,因為現(xiàn)在有可用于在R中使用MCMC(MCMCglmm; Hadfield 2010)和BUGS(Lunn等人2000)推斷這些模型的包。對于層級潛在高斯馬爾科夫隨機場模型,最近已經(jīng)引入了基于非抽樣的數(shù)值近似過程(Rue et al。2009)的集成嵌套拉普拉斯逼近(INLA)。使用INLA,我們可以計算所有參數(shù)和每個隨機效應(yīng)的邊際后驗,以及隨機效應(yīng)的線性組合的后驗。 INLA基于直接數(shù)字積分而不是模擬。 Rue和Martino(2007)展示了幾種模型和數(shù)據(jù)集,INLA比MCMC快得多,并且對于給定的計算預(yù)算更準(zhǔn)確。更快的推理鼓勵應(yīng)用研究者探索更多的模型。此外,這也打開了新的機會進(jìn)行模擬研究,例如可用于探索識別性問題和建立特定假設(shè)的測試。在GLMM之間執(zhí)行模型選擇不是一個簡單的任務(wù)(Skrondal和Rabe-Hesketh 2004),并且使用偏差信息標(biāo)準(zhǔn)(DIC)的差異已被質(zhì)疑(Fong等人2010)。我們建議使用模擬研究來評估DIC是否是模型選擇的適當(dāng)度量??焖倌M和推理方法對于計算可行的模擬研究至關(guān)重要。 INLA已被用于統(tǒng)計學(xué)的若干領(lǐng)域,例如生存分析(Martino等人2011),空間GLMM(Eidsvik等人2009)和疾病繪圖(Roos和Held 2011,Schr?dle等人2011)。本文通過證明這些模型適合INLA框架并且通過提供用于進(jìn)行推斷的R包,AnimalInLA,對高斯和幾個非高斯動物模型的更簡單和更快的貝葉斯推理做出貢獻(xiàn)。在材料和方法部分,我們介紹案例研究中使用的數(shù)據(jù)。然后我們簡要修改使用INLA的相關(guān)要求和INLA給出的可能性,并完全指定我們使用的動物模型。我們還提出了一個基于模擬的測試的框架DIC的差異的能力選擇有遺傳效應(yīng)和沒有遺傳效應(yīng)的模型。接下來,介紹了合成案例研究和麻雀案例研究的結(jié)果。使用INLA進(jìn)行推理,在一些情況下,將結(jié)果與MCMC進(jìn)行比較。文章以討論和結(jié)論為結(jié)束,討論了INLA框架在定量遺傳學(xué)中的結(jié)果以及機會和局限性。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容