Freimer 2004 使用譜系、同胞對和關(guān)聯(lián)分析常見疾病的遺傳作圖

Freimer N, Sabatti C (2004) The use of pedigree, sib-pair and association studies of common diseases for genetic mapping and epidemiology. Nat Genet 36:1045–1051. doi: 10.1038/ng1433

鑒定與常見疾病易感性相關(guān)的基因變體的努力使用三種方法:譜系和受影響的同胞對連鎖研究和群體樣品的關(guān)聯(lián)研究。這些研究設(shè)計的不同目的反映了它們源于生物學(xué)與流行病學(xué)傳統(tǒng)。然而,關(guān)于確定考慮結(jié)果具有統(tǒng)計學(xué)意義所需的證據(jù)水平的類似原理適用于連鎖和關(guān)聯(lián)研究。這種確定需要明確注意特定發(fā)現(xiàn)的先驗概率,以及對多重比較的適當校正。對于大多數(shù)常見的疾病,在研究中增加樣本大小是實現(xiàn)統(tǒng)計學(xué)顯著的遺傳作圖結(jié)果的關(guān)鍵步驟。最近的研究表明,技術(shù)和統(tǒng)計方法將很快可用于使用任何這些方法使得良好的研究可行。

直到最近,科學(xué)界已經(jīng)看到了遺傳調(diào)查常見疾病的結(jié)果?,F(xiàn)在,幾個廣泛宣傳的研究產(chǎn)生了相反的印象??茖W(xué)家的工作人員表示,“精神疾病的基因”的確定代表了2003年的一項頂尖的研究“突破”(參考文獻1)。 deCODE Genetics公司試圖全面鑒定冰島對常見疾病的遺傳貢獻,報告了幾種疾病潛在易感性的候選基因2-5??紤]到描述陰性或模棱兩可結(jié)果的更多的出版物,如何評估共同性狀遺傳學(xué)的當前狀態(tài)是不確定的。我們贏了戰(zhàn)爭,甚至幾場戰(zhàn)斗?或者,更悲觀的是,我們只是宣布勝利嗎?要回答這些問題,我們必須先問別人。是否有一種策略成為鑒定疾病基因的最佳方法?多少和什么樣的證據(jù)足以建立聯(lián)系和關(guān)聯(lián)?應(yīng)使用哪些樣品,以及需要多少標記進行基因分型?這些問題困擾著調(diào)查者和審稿人。
四個因素在該領(lǐng)域造成混亂:(i)不足的意識,預(yù)計不同的遺傳調(diào)查方法產(chǎn)生不同類型的調(diào)查結(jié)果; (ii)未充分認識到每種方法對適當技術(shù)和統(tǒng)計方法的可用性的依賴; (iii)解釋統(tǒng)計證據(jù)水平的標準不一致;和(iv)用于選擇和評價表型的非標準化策略。在這里我們討論每個因素,提出減少混亂的可能方法,并審查每種方法的當前狀態(tài)。

不同的方法應(yīng)該產(chǎn)生不同的發(fā)現(xiàn)

對于大多數(shù)常見疾病,文獻包括來自譜系和受影響的同胞對(ASP)連鎖研究和群體樣品的關(guān)聯(lián)研究的發(fā)現(xiàn)6。關(guān)于這些不同方法的效用的爭論源于不正確的印象,它們是彼此的完美替代。歷史上,不同的作圖方法源于不同的“傳統(tǒng)”,稀有和常見疾病之間存在著二分法。在前者中,孟德爾的實驗根產(chǎn)生了生物學(xué)取向,甚至在基因作圖時代之前。在后者中,流行病學(xué)取向占主導(dǎo)地位,例如精神分裂癥的研究。在二十世紀初,精神病學(xué)家認為精神病是一個單一的實體。 Kraepelin分離癡呆precox(現(xiàn)在的精神分裂癥)從躁狂抑郁性精神?。ìF(xiàn)在雙相情感障礙),主要是基于每個綜合征在不同家庭的聚合的觀察7。到二十世紀中期,雙胎研究建立了精神分裂癥的遺傳基礎(chǔ)8,9;許多遺傳流行病學(xué)調(diào)查的疾病一直持續(xù)到今天10。流行病學(xué)傳統(tǒng)促進了ASP和關(guān)聯(lián)方法的發(fā)展,這取決于流行病學(xué)數(shù)據(jù),用于估計親屬和人群中的疾病風(fēng)險。精神分裂癥家族研究11-13提供了風(fēng)險數(shù)據(jù)作為例子,用于闡明ASP基因組掃描常見疾病的理由14,15。
不同地圖繪制方法的目的也反映了生物學(xué)和流行病學(xué)傳統(tǒng)之間的二分法。高突變體變體在延伸的家系中分離;科學(xué)研究旨在確定這些變種以照亮生物學(xué)途徑和過程。群體樣本最適用于鑒定低外顯率變體;關(guān)聯(lián)研究旨在闡明這些變體對在群體中觀察到的疾病分布的貢獻。 ASP和關(guān)聯(lián)研究比系譜研究在確定和招募受試者方面更系統(tǒng),并且具有超越基因作圖的目的,例如鑒定環(huán)境和遺傳變量之間的相互作用

每種方法的適當技術(shù)和統(tǒng)計

特定方法的理論概念往往在技術(shù)和統(tǒng)計進步之前幾年才出現(xiàn),使得這種設(shè)計變得實用。一個有影響力的建議使用作圖的DNA標記物的孟德爾疾病的全基因組連鎖分析16,之后三年染色體定位的基因突變在亨廷頓病(HD,這是個單基因控制的疾病,但仍然沒有有效的療法來防止它)17,這表明這種作圖的可行性。 HD的作圖偶然使用少數(shù)DNA標記之一;這種和其他早期的連鎖發(fā)現(xiàn)促進了遺傳圖譜的發(fā)展,這使孟德爾疾病的連鎖研究常規(guī)。連鎖研究的后續(xù)增殖需要用于全基因組統(tǒng)計分析的計算上有效的方法,并促進統(tǒng)計遺傳學(xué)領(lǐng)域的增長分離第一個作圖基因的困難18-20促進了物理圖的發(fā)展以及連鎖不平衡(LD)分析(以前是基本種群遺傳學(xué)的工具)對精細尺度作圖的適應(yīng)20,21。
理論上正確的和技術(shù)可行性之間的類似的不匹配表征了最近的常見疾病作圖研究歷史。在20世紀80年代末,幾個聯(lián)系發(fā)現(xiàn)建立了擴展家系作為繪制共同疾病的主要范式的研究22-24。研究者開始質(zhì)疑這種方法,當發(fā)現(xiàn)不能被復(fù)制并被認為是假陽性時25,26。同時,理論統(tǒng)計研究建議ASP和關(guān)聯(lián)研究作為譜系研究的替代品14,15,27。在理論上對系譜方法的質(zhì)疑掩蓋了這樣一個事實:直到最近,大多數(shù)常見疾病的譜系研究功能不足,可能測試的標記太少。在過去幾年中,用比以前用于基因組掃描的更多數(shù)量的微衛(wèi)星進行基因分型便宜的大型家系變得可行,并且現(xiàn)在可用的統(tǒng)計程序允許有效計算連鎖,即使在復(fù)雜的家系28,29。這些進展允許基于系譜的連鎖研究大規(guī)模增加2,4,30-38。不充分的技術(shù)和統(tǒng)計方法同樣阻礙了基于譜系映射的替代品的實施。雖然仍然不確定如何設(shè)計和分析關(guān)聯(lián)研究,但是用于單核苷酸多態(tài)性(SNP)的高通量基因分型的技術(shù)正在快速成熟,伴隨著統(tǒng)計方法開發(fā)的激增。

統(tǒng)計證據(jù)水平

統(tǒng)計方法對技術(shù)可行性做出反應(yīng),這一事實指導(dǎo)了考慮連鎖和相關(guān)性結(jié)果的統(tǒng)計學(xué)意義所需的證據(jù)水平的確定。在前兆時代,當標記數(shù)量很少并且基因分型昂貴時,連鎖的顯著性截止(lod得分為3)基于兩個論點。首先,為了最小化樣品收集和基因分型的成本,Morton39提出了一個順序程序用于抽樣和分析譜系,直到有利于與標記(表示為似然比的對數(shù)基數(shù)10)的證據(jù)達到3的水平這個閾值對應(yīng)于P值為10-4,使用?2近似的可能性比率測試,并考慮到這是一個“單側(cè)”測試40。這種嚴格的標準對保證由順序抽樣程序引入的偏見的重要性。第二,Morton和其他人使用貝葉斯論證來表明,即使不采用順序程序,有必要要求這樣強有力的證據(jù)支持聯(lián)系;由于只有少數(shù)幾個標記的可用性,這些標記之一有一個非常小的先驗概率鏈接到興趣基因。需要大量的證據(jù)將這種低連鎖概率轉(zhuǎn)換為高后驗概率。例如,基于基因組長度和可以檢測到連鎖的基因座之間的距離的一個計算確定給定的目的基因座與隨機基因組位置之間的連鎖的先前概率為0.02。為了獲得一個后驗概率?0.95,所以當一個聲明鏈接時,有一個概率為0.05的錯誤,一個貝葉斯定理:

替代0.02的連接的先驗概率,將其與后驗概率0.95相等,并求解似然比Pr(Data | Linkage)/ Pr(Data | NoLinkage),該比率必須為?1000,對應(yīng)于lod分數(shù)最初,然后,lod分數(shù)或?qū)?yīng)于該分數(shù)的P值的嚴格閾值是為了防止太少的搜索,太少的譜系收集或太少的標記測試。孟德爾病癥的許多全基因組連鎖研究隨后證實了連接到任何預(yù)先選擇的單個基因座的低先驗概率。
當全基因組的映射標記集合可用時,問題變得逆轉(zhuǎn):搜索太多,而不是太輕微。全基因組數(shù)據(jù)集中的某些標記與目的基因座相連的在先概率為1.因為進行了這么多統(tǒng)計檢驗,至少一個檢驗可能產(chǎn)生假陽性結(jié)果;因此,必須校正多個比較。例如,考慮具有500個微衛(wèi)星的基因組掃描。為了在0.05水平上控制基因組中任何位置沒有連鎖的全局假設(shè),對于每個測試,可以使用0.05 / 500 = 10-4的校正水平,對應(yīng)于lod得分3.這樣的Bonferroni校正是當測試是依賴的時,如在用更密集的標記集進行的連鎖研究中的情況那樣太保守,其中標記間距離如此之小,以致連鎖統(tǒng)計在相鄰標記處獲取基本上相同的信息。幾個研究者使用高斯過程近似的連鎖統(tǒng)計,并確定使用密集標記集需要很少額外調(diào)整lod得分閾值,3-3.5(參考文獻43-45)。這些分析強調(diào)了這樣的事實,即適當?shù)男U腔诳赡艿莫毩y試的數(shù)量,而不是具體執(zhí)行的測試的數(shù)量。上面提到的幾個統(tǒng)計觀點提出了相同的lod分數(shù)截止值,確保了上述指定連接“顯著”的標準的普遍接受。
雖然該領(lǐng)域尚未達成關(guān)聯(lián)研究的顯著性截止值的一致性,但是對于連鎖研究來說,評估這樣的閾值需要考慮先驗概率和多重比較。迄今為止的大多數(shù)關(guān)聯(lián)研究已經(jīng)在一個或幾個候選基因中研究了少量變體。對于這樣的研究,需要糾正眾多的比較是一個小問題,一個事實,導(dǎo)致接受非緊密的重要臨界點。然而,在這種情況下,主要的問題是搜索太少。確定基因關(guān)聯(lián)研究的適當臨界值類似于確定在預(yù)先時間,當接受嚴格lod得分閾值防止假陽性基因連鎖結(jié)果傳播時的連鎖的顯著性。性狀與單個候選基因的關(guān)聯(lián)的先驗概率遠低于連接到這樣的基因的先前概率,因為締合在比連接更短的基因組間隔上延伸。如果進行保守的簡化假設(shè),從基因組中的30,000個基因中隨機挑選基因,先驗概率是給定候選基因與性狀相關(guān)的1/1 / 30,000。使用上面提到的相同的貝葉斯參數(shù)進行鏈接,可能性比率應(yīng)該為?550,000以考慮關(guān)聯(lián)性顯著;評估與?2檢驗的關(guān)聯(lián),該檢驗漸近近似似然比的自然對數(shù)的兩倍,這轉(zhuǎn)化為?2.6?10-7的P值。幾乎沒有候選人協(xié)會研究符合這個閾值;通常,研究者(和讀者)隱含地假定有意義的先驗證據(jù)指導(dǎo)候選基因的選擇(即,先前的結(jié)合概率高于1 / 30,000)。先驗概率的估計本質(zhì)上是主觀的和基于假設(shè)的; Morton提出的關(guān)于聯(lián)系的估計實現(xiàn)了接受,因為它的假設(shè)使用了孟德爾原理。對于關(guān)聯(lián)研究,沒有可比的形式的可以容易地以概率量化的先驗證據(jù)。不幸的是,該領(lǐng)域因此在很大程度上選擇忽略對基因關(guān)聯(lián)研究應(yīng)用嚴格臨界值的需要,使得許多甚至最高公開的結(jié)果可能是假陽性。
期刊可以通過要求對候選基因的先前證據(jù)進行明確,批判和標準化的描述來改善基因關(guān)聯(lián)結(jié)果的報告。調(diào)查員可以根據(jù)這些證據(jù)提出先驗概率的估計;讀者可以判斷這些估計是否合理。通常這種證據(jù)將包括類似關(guān)聯(lián)研究的結(jié)果。來自不同群體(即,要復(fù)制的結(jié)果)的明確肯定結(jié)果提高了先驗概率;來自類似研究的負結(jié)果降低了先驗概率。作者可以使用遺傳協(xié)會數(shù)據(jù)庫46提供與其出版物相關(guān)的先前關(guān)聯(lián)研究的完整摘要。位置候選基因位于在早期研究中顯示連鎖的區(qū)域。讀者可以判斷這樣的證據(jù)的程度 - 連鎖發(fā)現(xiàn)的強度,lod得分峰的寬度,區(qū)域中基因的數(shù)量,不同組家族之間的發(fā)現(xiàn)的異質(zhì)性程度以及是否連鎖和關(guān)聯(lián)樣品來自相似的種群?,F(xiàn)有的證據(jù)通常比“功能”候選基因更軟。例如,編碼5-羥色胺代謝中的關(guān)鍵蛋白的色氨酸羥化酶(TPH1)已被廣泛研究作為涉及異常行為表型的候選物。然而,最近發(fā)現(xiàn)TPH47的新同種型已經(jīng)對許多關(guān)聯(lián)研究產(chǎn)生懷疑,其研究了一種同種型,其現(xiàn)在已知在腦血清素能神經(jīng)元中甚至不表達。因此,對于功能候選者關(guān)聯(lián)性研究,作者應(yīng)該在假設(shè)大量先驗概率時特別謹慎。讀者必須能夠評估是否用于校正多重比較的選定候選基因的早期研究,或者是否有任何證據(jù)反對候選假說。一些作者進一步建議,關(guān)聯(lián)研究應(yīng)該計算每個結(jié)果的假陽性報告概率,包括先驗概率,觀察到的P值和分析的統(tǒng)計功效48。幾個因素(樣本大小,變異頻率和效應(yīng)大小)確定功率,并且將這種強調(diào)放在單個假陽性報告概率得分上的效用仍不清楚49。
全基因組關(guān)聯(lián)研究的出現(xiàn)將減少搜索的問題太少,并引入搜索太多的問題。仍然不能獲得確定這些研究的統(tǒng)計截止值所需的一些信息,特別是對于LD映射。我們不知道需要多少標記來使至少一個與疾病相關(guān)的標記的概率為1;與聯(lián)系不同,這個數(shù)字將因人口而異。此外,在附近標記物的結(jié)合的測試之間的依賴的結(jié)構(gòu)是不清楚的。目前的舉措,如國際HapMap項目和LD地圖建設(shè)努力,可能會減少這種不確定性50,51。提倡使用基因內(nèi)功能變異的直接關(guān)聯(lián)研究的提議52預(yù)想50,000-100,000個這樣的SNP將提供基因組覆蓋。這種估計為考慮統(tǒng)計截止提供了初步依據(jù);用Bonferroni校正,需要P值<5×10-7以實現(xiàn)顯著性。盡管如果在各種SNP的關(guān)聯(lián)測試之間存在顯著的依賴性,這個臨界值可能太保守,但是我們目前缺乏用于這種可能的依賴性的適當模型。鑒于基于關(guān)聯(lián)的基因組掃描旨在識別相對小效應(yīng)的多個基因,一些已經(jīng)提出實施全局誤差的較不嚴格的定義。 Bonferroni校正控制宣布至少一個假關(guān)聯(lián)的概率,稱為家庭智力錯誤率。控制假發(fā)現(xiàn)率的替代方法,所有已識別的關(guān)聯(lián)中錯誤關(guān)聯(lián)的比例53正在受到越來越多的關(guān)注54-56。
關(guān)聯(lián)研究中的另一個問題,即在關(guān)聯(lián)研究中沒有面臨的一個問題是,高通量SNP分析產(chǎn)生了對大量候選區(qū)域或一系列候選基因進行基因分型的可能性。這種情況具有搜索太少和搜索太多的特性。由于只評估基因組的有限節(jié)段,因此必須考慮低的先驗概率,但是考慮到可能的測試的數(shù)量,還必須校正多重比較。

選擇和評估表型

每種映射方法提供表型分析的優(yōu)點和缺點。研究譜系允許收集比在群體樣品中可行的更深的表型譜;與譜系成員的持續(xù)關(guān)系促進廣泛和縱向的評估。但是在單個譜系中評估的表型可能對該譜系或特定的clini家人是特異的;這限制了由不同研究組采集的譜系的組合分析的可行性。大規(guī)模合作ASP研究已經(jīng)促進了一種更系統(tǒng)的表型分型方法,允許研究組之間的表型定義和評估的可比性。在臨床環(huán)境中容易收集的關(guān)聯(lián)樣品可以是“便利樣品”,其中表型評估是表面的。當足夠的資源用于識別和表型受試者,然而,人口樣品,如在大型隊列研究57,58收集的那些樣品具有無可比擬的潛力,提供一個綜合的表型特征的一般性信息59,并使能評價表型和與基因型變異相關(guān)的環(huán)境變異。綜合表型數(shù)據(jù)庫為調(diào)查常見疾病提供規(guī)模經(jīng)濟,但在確定和表型受試者后,系統(tǒng)化程度將決定這些數(shù)據(jù)庫的效用。
在選擇表型進行連鎖和關(guān)聯(lián)分析時,研究者必須考慮低的先驗概率和多重比較,就像選擇標記一樣。 “候選表型”的低先驗概率類似于候選基因的低先驗概率??紤]涉及重要生物學(xué)途徑的基因中的功能變體,例如,血清素轉(zhuǎn)運蛋白啟動子區(qū)中的重復(fù)多態(tài)性,其已經(jīng)被測試與廣泛的行為表型相關(guān)聯(lián),基于它們的假設(shè)的生理學(xué)連接到血清素能途徑60。需要嚴格的統(tǒng)計截止值以抵消該變體在所有可能的表型中影響研究者選擇的表型的低先驗概率。雖然不清楚如何可以估計這個先驗概率,但對于一些表型,比其他表型有更好的先驗證據(jù)。例如,更可能的是5-羥色胺轉(zhuǎn)運蛋白變體影響先前顯示為可遺傳的表型,而不是不可遺傳的表型;對于后者,P <0.05的顯著性截止點幾乎肯定太自由。這種低的先驗概率可能影響這種變體對于復(fù)雜表型的最近關(guān)聯(lián)結(jié)果的解釋。例子包括響應(yīng)情緒刺激的功能性腦成像結(jié)果61和與壓力性生活事件相關(guān)的抑郁相關(guān)表型62。
增加表型數(shù)據(jù)的規(guī)模和種類引入了額外的統(tǒng)計問題。如果不預(yù)先指定用于考慮不同表型分類的分析計劃,則通過根據(jù)疾病定義最大化證據(jù)存在使似然比膨脹(對于連鎖或關(guān)聯(lián)測試)的風(fēng)險63。當研究人員在同一組樣品中研究多種表型時,發(fā)生多重比較的統(tǒng)計問題;當調(diào)查人員開始分析大量樣本的綜合表型數(shù)據(jù)庫時,這個問題將更加嚴重。基于評估的表型數(shù)量應(yīng)用Bonferroni校正可能導(dǎo)致非常保守的結(jié)論:通常表型(因此測試)將相關(guān),并且期望多于一種表型導(dǎo)致陽性作圖結(jié)果。在這種情況下,假發(fā)現(xiàn)速率方法可能特別有用,可能與重采樣過程耦合以考慮這種依賴性
當作者僅報告其數(shù)據(jù)中的一些可能的表型分類時,另一個統(tǒng)計問題出現(xiàn)。作者應(yīng)明確指出產(chǎn)生陰性作圖結(jié)果的表型組合,并說明它們?nèi)绾问褂帽硇托畔碇笇?dǎo)譜系的延伸。在沒有這樣的信息的情況下,讀者可以假定用于遺傳分析的表型是特異性的,并且難以與先前的連鎖或關(guān)聯(lián)的概率相關(guān)。如果讀者能夠更好地評估涉及多個表型分類的繪圖研究,如果它們提供有關(guān)在表型分型和表型 - 基因型分析的所有階段中使用的程序的細節(jié)。例如,在繪制中風(fēng)易感基因位點,deCODE獲得了最強的證據(jù)使用非常規(guī)表型分類3,64。如果作者在網(wǎng)站上提供詳細的表型信息,讀者可以判斷對這種方法的批評是否有效64,或者僅僅是生物學(xué)和流行病學(xué)方法之間的另一個例子65。

擴展譜系研究

最近的三個發(fā)展已經(jīng)恢復(fù)了對常見疾病的譜系研究的興趣。首先,理論研究表明,科學(xué)方法可能是最有力的確定數(shù)量性狀基因位點疾病表型(內(nèi)表型)66,67;這些數(shù)量性狀基因座可以具有比疾病診斷更簡單的遺傳構(gòu)造,并且因此可以更直接地映射。內(nèi)表型映射尚未在人類中實施足夠的規(guī)模來判斷其成功。第二,新方法可以有效地計算擴展家系28,29中的連接統(tǒng)計。第三,deCODE已發(fā)表了許多疾病的基于系譜的聯(lián)系發(fā)現(xiàn)。 deCODE獲得了冰島人口,其醫(yī)療記錄和家譜,并使用這種信息組裝大型家系。家譜能夠重建遠距離相關(guān)個體之間的大多數(shù)連接。醫(yī)療記錄提供了大多數(shù)家庭成員的廣泛的表型信息。 deCODE專注于與遠緣相關(guān)的受影響成員的大型家系,預(yù)期他們在疾病基因周圍共享更短的基因組片段,而不是在小系譜中更密切相關(guān)的受影響個體。因此,deCODE使用比大多數(shù)組使用更密集的標記集進行基因組掃描68,在整個譜系中用其科學(xué)家開發(fā)的程序分析連鎖69并且考慮這些分析中的表型信息的幾種不同組合
雖然deCODE的擴展譜系研究的規(guī)模是不尋常的,許多研究組正在使用類似的方法,主要是在相對封閉的群體的家庭70-75。這些人口存在于世界各地,其特點是在相對較小的地區(qū)移民少,移民和分布低,大多數(shù)受試者及其醫(yī)療記錄可供調(diào)查人員使用。從這些社區(qū)獲得幾乎完整的家譜是可行的,這是進行充分研究的關(guān)鍵步驟。
家譜研究的力量是當前最感興趣的話題。大多數(shù)deCODE的研究涉及使用> 1,000個標記對幾個受影響的個體進行基因分型。雖然每個研究產(chǎn)生了有趣的結(jié)果,導(dǎo)致精細繪圖和基因鑒定的努力,幾個沒有達到明確的統(tǒng)計意義2,5,37,38。 deCODE的經(jīng)驗表明,擴展譜系設(shè)計的兩個途徑。首先,對于不產(chǎn)生明確的連鎖的疾病導(dǎo)致大樣品,內(nèi)表型映射的實施可能是特別有吸引力的。第二,為了獲得足夠的力量,研究者可能需要組合來自不同國家,可能來自遺傳相關(guān)人群的譜系樣品76。
對于常見的疾病,擴展譜系方法迄今為止失敗,除了這些疾病的罕見的早發(fā)型,滿足其將識別照亮生物學(xué)途徑的高突變變體的期望77,78。這些疾病的常見形式的譜系研究已經(jīng)導(dǎo)致位置候選者相關(guān)性研究,其為可能在疾病易感性中起作用的變體提供了有趣的,但主要是統(tǒng)計學(xué)上等同的證據(jù);迄今為止鑒定的變體不具有大多數(shù)突變基于孟德爾病癥的生物學(xué)效應(yīng)2-5,79。在這方面,該領(lǐng)域急切地等待deCODE和其他人正在對幾種疾病進行精細繪圖研究的結(jié)果。

ASP研究

由于基于譜系的譜系研究需要良好的分界,穩(wěn)定的群體,并且由于大多數(shù)表型個體生活在其他環(huán)境中,遺傳學(xué)領(lǐng)域需要其他范式。 ASP戰(zhàn)略使許多研究者能夠獲得良好表型的臨床樣品來啟動連鎖研究。由于Risch的理論工作的影響,對相對少的標志物的需求和改進的統(tǒng)計分析程序的發(fā)展80,81,這種方法現(xiàn)在在常見疾病的全基因組圖譜中占主導(dǎo)地位。使用不足的樣本量可能解釋了為什么大多數(shù)已發(fā)表的ASP研究報告了陰性或模棱兩可的結(jié)果,特別是對于具有小效應(yīng)大?。ǖ突蛐拖鄬︼L(fēng)險)的表型。這么多欠奉的研究的啟動例證了該領(lǐng)域如何不正確地解釋理論研究的結(jié)論,而且反映了收集足夠的ASP樣品所需的大量資源。通過形成財團以獲得這樣的樣品,研究者開始獲得由Risch和其他人預(yù)測的結(jié)果??肆_恩病是一個例子。獨立ASP研究表明不同染色體上的幾個可能的位點參與克羅恩病82-84。許多,但不是所有的研究涉及染色體16上的位點;一些這些研究,自己,幾乎不強調(diào)這個地區(qū)。形成一個國際財團調(diào)查超過600 ASPs從這些幾個研究產(chǎn)生了一個明確的鏈接年齡在染色體16(IBD1;參考文獻85),這導(dǎo)致鑒定的基因IBD1與易感性的聯(lián)系的基因克羅恩?。–ARD15;參考文獻86)。這個例子表明,ASP設(shè)計非常適合組合來自不同國家的樣品。與擴展譜系方法不同,ASP研究在站點之間容易協(xié)調(diào),并且不依賴于譜系的努力。與關(guān)聯(lián)研究相比,ASP方法對研究人群的遺傳組成的差異是穩(wěn)健的。一個警告涉及ASP基因組掃描的比較。給定在這種掃描中使用的通常稀疏的標記集合(<500個標記),假陰性結(jié)果可能由基因組覆蓋中的過度間隙引起,例如,如果特定標記在數(shù)據(jù)集之一中失敗。由于不同的研究使用不同的標志物,如最近的類風(fēng)濕性關(guān)節(jié)炎的掃描87,88所示,這個問題更加嚴重。越來越多的興趣結(jié)合來自不同掃描的數(shù)據(jù)表明需要在未來的ASP研究中使用更密集,更均勻的標記集。
ASP設(shè)計的多站點項目的優(yōu)勢現(xiàn)在正在利用大型研究,將支持超越基因映射的研究。例如,GenomEUtwin project89,包括來自幾個國家?guī)缀跻话偃f雙胞胎,將是強大的ASP連鎖研究的幾個表型。收集的擴展縱向數(shù)據(jù)將允許評估眾多環(huán)境變量;即使是最豐富的譜系也不適合用于研究與基因 - 環(huán)境相互作用相關(guān)的問題,而且譜系成員的非獨立性使ASP中直接的統(tǒng)計分析變得復(fù)雜。

關(guān)聯(lián)研究

關(guān)聯(lián)研究是當前最受關(guān)注的焦點。鑒定常見疾病風(fēng)險變異的全基因組關(guān)聯(lián)研究迄今為止主要限于最近建立的群體分離物,其中微衛(wèi)星在高達幾厘米的距離上檢測LD 90,91。雖然一些仍然懷疑全基因組LD映射使用SNPs92,識別相同的哮喘相關(guān)的單核苷酸多態(tài)性在芬蘭和魁北克表明這種方法的巨大潛力,至少在人口分離93一些明確的候選基因關(guān)聯(lián),如載脂蛋白E4等位基因(ApoE4)和阿爾茨海默病之間的關(guān)系,說明了我們可以期望從成功的關(guān)聯(lián)研究的那種信息。許多研究表明ApoE4是阿爾茨海默病的最重要的危險因素94。盡管這一發(fā)現(xiàn)比通過譜系研究鑒定涉及罕見的孟德爾形式的阿爾茨海默病的基因78產(chǎn)生更少的生物學(xué)見解,但它改變了癡呆和相關(guān)表型的流行病學(xué)和臨床研究。因此,現(xiàn)在已知ApoE4與阿爾茨海默病的發(fā)病年齡95,“正常”衰老中認知衰退的過程96,在無癥狀個體中改變的磁共振成像發(fā)現(xiàn)97,98,在拳擊手中的慢性創(chuàng)傷性腦損傷的風(fēng)險99和創(chuàng)傷性腦損傷幸存者的臨床結(jié)果100。

結(jié)論

基因分型技術(shù)和統(tǒng)計方法的發(fā)展將很快使足夠動力的譜系,ASP和協(xié)會研究可行的大多數(shù)常見疾病。研究者旨在回答的特定生物學(xué)和流行病學(xué)問題將決定研究設(shè)計的選擇,并且由于它們方便或便宜,很難證明設(shè)計(例如候選基因關(guān)聯(lián)研究)的正當性。在這方面目前的實際步驟是供資機構(gòu)開始拒絕這種理由。他們還可能要求調(diào)查人員明確說明推理,推理的證據(jù)和用于解決先前概率,權(quán)力和多重比較的統(tǒng)計問題的程序;期刊可以采取與作者相同的立場。
現(xiàn)場對更嚴格的證據(jù)標準的堅持將鼓勵研究者使用任何映射方法來增加樣本量。在大多數(shù)情況下,該步驟將需要組合來自不同位點的樣品。站點之間的表型數(shù)據(jù)的不相容性可能會阻礙這一過程;資助機構(gòu)應(yīng)支持努力使這些新數(shù)據(jù)和現(xiàn)有數(shù)據(jù)標準化。組合樣本的可行性可以是特定于設(shè)置。例如,擴展的譜系研究將主要在分界良好的人群中進行,并且增加的樣本量可能需要鑒定合適的伴侶群體。研究之間的樣品組合也需要更大的努力以確保來自全基因組分析的標記數(shù)據(jù)是相容的,并提供完整的基因組覆蓋;這對于系譜和ASP研究已經(jīng)是顯而易見的,并且對于關(guān)聯(lián)研究將更加重要。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容