2019-02-23 QTL(轉(zhuǎn)自知乎)

作者:Philip Yang

鏈接:https://www.zhihu.com/question/27695566/answer/40741777

來(lái)源:知乎

著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請(qǐng)聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請(qǐng)注明出處。

我是來(lái)順便整理一下自己腦子里的東西的。歡迎知友們?cè)u(píng)論指正。

一、QTL定位的基本思想

QTL全稱是Quantitative Trait Loci。顧名思義就是基因組上的一些位點(diǎn),對(duì)一些特定性狀具有某種量化的影響。這里的重點(diǎn)是,我們關(guān)心的性狀是一個(gè)有多個(gè)不同水平的可定量(Quantitative)的性狀,而不是定性(Qualitative)的性狀。后者最典型的例子就是疾?。ǖ貌?沒(méi)得病)。一般任何復(fù)雜性狀(由多個(gè)基因決定的性狀)都可以認(rèn)為是數(shù)量性狀(我其實(shí)覺(jué)得這里Quantitative翻譯成"數(shù)量"怪怪的,不過(guò)約定俗成了,大家明白就好),例如人的身高/體重/IQ,農(nóng)作物的株高/產(chǎn)量等。

QTL定位的基本原理,就是測(cè)定一群個(gè)體的某個(gè)數(shù)量性狀(表型),以及它們的基因型(就是基因組上的一些遺傳標(biāo)記,例如SNP/RFLP等等,但不一定是全基因組),然后尋找基因型表型的對(duì)應(yīng)關(guān)系。例如:

<img data-rawheight="476" data-rawwidth="681" src="https://pic4.zhimg.com/86ad0f0d98491fcb0df999be79be07e3_b.jpg" class="origin_image zh-lightbox-thumb" width="681" data-original="https://pic4.zhimg.com/86ad0f0d98491fcb0df999be79be07e3_r.jpg">

圖中x軸是數(shù)量性狀的值,y軸表示群體中有多少個(gè)體的數(shù)量性狀為對(duì)應(yīng)的x值。所以像最下面的圖就是c這個(gè)位點(diǎn)不論是什么狀態(tài)(?cc或者cc'),數(shù)量位點(diǎn)都大概呈現(xiàn)相同的正態(tài)分布。但b這個(gè)位點(diǎn)的基因型則與數(shù)量性狀有相關(guān)性。因?yàn)?b>bb?基因型的時(shí)候,數(shù)量性狀的值比較小,而bb'基因型的時(shí)候則相反。然后a這個(gè)位點(diǎn)與數(shù)量性狀的值的相關(guān)性則更為明顯。QTL定位本質(zhì)上就是要找基因組上哪些遺傳標(biāo)記跟數(shù)量性狀的相關(guān)性最強(qiáng)。注意這里一直說(shuō)的是“相關(guān)性”,它不代表著直接/決定作用,因?yàn)閍這個(gè)位點(diǎn)可能只是與有決定作用的基因連鎖在一起了。所以QTL定位之后,還需要設(shè)計(jì)進(jìn)一步的實(shí)驗(yàn)驗(yàn)證/尋找那個(gè)具有遺傳效應(yīng)的基因/位點(diǎn)。

二、影響QTL分析結(jié)果的主要因素

1.實(shí)驗(yàn)設(shè)計(jì)

一般而言,都是用若干個(gè)(數(shù)量性狀有明顯差異的)祖先個(gè)體,進(jìn)行各種雜交之后,用其后代進(jìn)行表型和基因型的測(cè)定,最后通過(guò)兩型的相關(guān)性進(jìn)行QTL定位。

與之相對(duì)的是Association study(關(guān)聯(lián)分析),一般直接抓來(lái)一群(野生的,不清楚遺傳背景的)個(gè)體就拿來(lái)測(cè)表型和基因型,然后看兩型的相關(guān)性。QTL定位比較傾向于用遺傳背景清楚的群體(就是那少數(shù)幾個(gè)祖先個(gè)體雜交而來(lái)的),因?yàn)槟菢観TL的結(jié)果不會(huì)受群體結(jié)構(gòu)(population structure)的影響。舉個(gè)例子,按關(guān)聯(lián)分析的方法,拉一堆白種人和黃種人來(lái)找身高的QTL,找到的估計(jì)基本上都是種族差異,而與身高沒(méi)有關(guān)系。(但關(guān)聯(lián)分析也有自己的優(yōu)勢(shì)。比如它能覆蓋更多的遺傳多樣性,不會(huì)僅限于那幾個(gè)祖先個(gè)體的基因型。另外也不是說(shuō)關(guān)聯(lián)分析的數(shù)據(jù)就不能用來(lái)做QTL定位,只是要非常非常小心)

2.統(tǒng)計(jì)功效(Statistical power)

QTL定位的統(tǒng)計(jì)方法,現(xiàn)在用得比較多的是Analysis of Variance (ANOVA) / Generalized Linear Model (GLM)吧。統(tǒng)計(jì)學(xué)方法有個(gè)常見(jiàn)的瓶頸——統(tǒng)計(jì)功效(Statistical Power)。

這個(gè)瓶頸在如今基因測(cè)序成本大降的時(shí)代尤其明顯。出于精確定位QTL的目的,大家會(huì)使用越來(lái)越多的遺傳標(biāo)記,結(jié)果就是統(tǒng)計(jì)的時(shí)候做的假設(shè)檢驗(yàn)太多(每個(gè)標(biāo)記都檢驗(yàn)一遍),多重檢驗(yàn)校正(multiple testing correction)一做下來(lái)就沒(méi)有幾個(gè)顯著的位點(diǎn)了。

另一方面,位點(diǎn)之間的相互作用也很重要,舉個(gè)例子:

<img data-rawheight="526" data-rawwidth="600" src="https://pic1.zhimg.com/48d6d19ecbd78bab21044c1152e802c0_b.jpg" class="origin_image zh-lightbox-thumb" width="600" data-original="https://pic1.zhimg.com/48d6d19ecbd78bab21044c1152e802c0_r.jpg">

假設(shè)圖中的星星是數(shù)量性狀取值高的個(gè)體,圓圈是數(shù)量性狀取值低的個(gè)體。x1和x2兩條軸代表兩個(gè)遺傳標(biāo)記的基因型。顯然這兩個(gè)位點(diǎn)放一起看,與數(shù)量性狀非常相關(guān),可是單獨(dú)看x1或者x2卻一點(diǎn)相關(guān)性都沒(méi)有。x1和x2就是存在相互作用的兩個(gè)QTL。如果基因組上有一萬(wàn)個(gè)位點(diǎn),你想找到這種相互作用就得做一億次假設(shè)檢驗(yàn)。這還只是兩個(gè)位點(diǎn)的相互作用,三個(gè)呢?

現(xiàn)在有不少人在想辦法解決這些問(wèn)題。增加群體中的樣本數(shù)目是一個(gè)顯然的方向,但效益不大。也有的人在想辦法以基因?yàn)閱挝粊?lái)檢驗(yàn)相互作用[PLOS Genetics: Gene-Based Testing of Interactions in Association Studies of Quantitative Traits]。也有人認(rèn)為相互作用不會(huì)像上面這幅圖這么“干凈”(x1和x2單獨(dú)都完全沒(méi)效果,x1和x2的相互作用卻很強(qiáng))。他們的思路就是先找單獨(dú)有作用的少數(shù)幾個(gè)位點(diǎn),然后再看這少數(shù)位點(diǎn)與其他所有位點(diǎn)的相互作用[PLOS Biology: Multiple Locus Linkage Analysis of Genomewide Expression in Yeast]。

3.重組/連鎖(recombination/linkage)

理想狀態(tài)下,如果所有做QTL定位時(shí),所有遺傳標(biāo)記都不連鎖,那么你應(yīng)該可以把QTL精確定位到一個(gè)特定的遺傳標(biāo)記上,因?yàn)樗舯诘腝TL是不會(huì)與數(shù)量性狀有相關(guān)性的。但實(shí)際上相鄰的遺傳標(biāo)記很大可能是連鎖的,結(jié)果就是一批相鄰的遺傳標(biāo)記看上去都是跟QTL有很強(qiáng)相關(guān)性——除非它們的連鎖被重組打斷了。增加重組的主要手段是提升雜交的代數(shù)(代數(shù)太多也不行,基因組可能變得太亂以至于遺傳標(biāo)記都對(duì)不回去原來(lái)的基因組了)

三、由QTL分析衍生出來(lái)的技術(shù)

1.從宏觀到微觀

QTL最初是用來(lái)分析宏觀的數(shù)量性狀的,像上面提到過(guò)的人的身高,農(nóng)作物的產(chǎn)量等?,F(xiàn)在越來(lái)越多人用來(lái)分析微觀層次的性狀,比如eQTL(expression QTL,關(guān)心的性狀是基因表達(dá)量),pQTL(protein QTL,蛋白質(zhì)表達(dá)量),sQTL(splicing QTL,選擇性剪接)等。

2.extreme QTL(xQTL)

[http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2862354/]

先用跟一般QTL定位類(lèi)似的雜交過(guò)程:兩個(gè)(或更多)祖先個(gè)體的雜交,若干代之后從大量后代中選擇出數(shù)量性狀特別高(extreme)的一部分個(gè)體,然后測(cè)定這批個(gè)體的基因型。因?yàn)榻?jīng)過(guò)了選擇,能提升數(shù)量性狀的那些基因型(等位基因)就會(huì)在經(jīng)過(guò)選擇的那一部分個(gè)體中頻繁地出現(xiàn)。而跟沒(méi)經(jīng)過(guò)選擇的群體則不會(huì)有這種現(xiàn)象。通過(guò)比較兩個(gè)群體里面不同等位基因出現(xiàn)的頻率的差異,就可以定位QTL。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容