將同一屬內(nèi)不同種遺傳變異的泛基因組整合在一起構(gòu)建的超級(jí)泛基因組可以更好地代表整個(gè)屬的遺傳變異。稻屬包括亞洲栽培稻 ( Oryza sativa,Os) 和非洲栽培稻(O. glaberrima,Og)兩個(gè)栽培種,它們分別從普通野生稻和短舌野生稻馴化而來(lái)。組裝了251份高質(zhì)量的水稻基因組,構(gòu)建了目前植物中群體規(guī)模最大的、基因組充分注釋的、稻屬中最為系統(tǒng)的超級(jí)泛基因組。該圖譜的完成將極大地促進(jìn)水稻功能基因挖掘和水稻種質(zhì)資源利用。相關(guān)研究成果于2022年7月12日以 “A Super Pan-Genomic Landscape of Rice”為題發(fā)表在Cell Research(影響因子46.297)上。
Os由亞洲野生稻 ( O. rufipogon , Or ) 馴化而成,主要有兩種類型:Geng ( Os. japonica , Osj ) 和Xian ( Os. indica , Osi)。Osj早在9000 年前就被馴化了,而Osi形成較晚,從Osj的馴化等位基因滲入。
大約 3500 年前,Og是從O. barthii ( Ob ) 馴化而來(lái)的,而O. barthii (Ob)大約在 600,000 年前與Or分道揚(yáng)鑣。
對(duì)包括單核苷酸變異和結(jié)構(gòu)變異(SVs)在內(nèi)的一整套遺傳變異的鑒定,有助于研究栽培稻和野生稻的種群結(jié)構(gòu)和進(jìn)化動(dòng)態(tài),加深了對(duì)適應(yīng)、馴化、和物種形成。然而,應(yīng)該注意的是,遺傳變異通常是針對(duì)單個(gè)參考基因組進(jìn)行鑒定的;因此,與參考基因組不存在或高度分歧的 DNA 序列被忽略。泛基因組結(jié)合了多個(gè)基因組,試圖代表一個(gè)物種的整個(gè)基因集,可以幫助克服序列缺失的問(wèn)題。水稻是中國(guó)第一大糧食作物,中國(guó)也是世界上最早種植水稻的國(guó)家。在水稻基因組學(xué)研究上,中國(guó)也一直走在世界前列。20年前,中國(guó)科學(xué)家獨(dú)立繪制完成并成功“解讀”了水稻基因序列,這也是人類第一次在基因組層面認(rèn)識(shí)了水稻。5年間,中國(guó)科學(xué)家已完成構(gòu)建4個(gè)水稻泛基因組,包括使用453個(gè)亞洲栽培稻種質(zhì)的短讀長(zhǎng)構(gòu)建的泛基因組、使用53亞洲栽培稻和13個(gè)普通野生稻種質(zhì)的短讀長(zhǎng)迭代組裝的泛基因組、使用32個(gè)亞洲栽培稻和1個(gè)非洲栽培稻種質(zhì)的長(zhǎng)讀長(zhǎng)組裝而成的泛基因組和使用105個(gè)亞洲栽培稻和6個(gè)普通野生稻的長(zhǎng)讀長(zhǎng)組裝而成的泛基因組。
水稻馴化的過(guò)程中經(jīng)歷了高強(qiáng)度的人工選擇,導(dǎo)致栽培稻相對(duì)于野生稻祖先遺傳多樣性減少,成為目前培育水稻品種的制約因素之一
該研究通過(guò)地理分布來(lái)源、基因型和表型變異 精心選擇了具有高度代表性的202份亞洲栽培稻核心種質(zhì)材料,28份普通野生稻、11份非洲栽培稻 和 10份短舌野生稻。對(duì)所選擇的251份水稻核心種質(zhì)材料進(jìn)行長(zhǎng)讀長(zhǎng)納米孔(Nanopore)測(cè)序和 Illumina 短讀長(zhǎng)重測(cè)序,利用自主開(kāi)發(fā)的WTDBG軟件從頭組裝了251份高質(zhì)量水稻基因組序列,并對(duì)每個(gè)基因組做了充分的注釋。

然后,基于序列和蛋白相似性分別構(gòu)建了以非冗余序列和非冗余基因?yàn)榇淼姆夯蚪M。該研究將基于三代長(zhǎng)讀長(zhǎng)數(shù)據(jù)鑒定到的159,491個(gè)結(jié)構(gòu)變異信息整合為圖形化的變異圖譜(Variation graph)。這種變異圖譜形式的泛基因組能夠幫助研究人員利用已有的二代重測(cè)序數(shù)據(jù)獲取相應(yīng)水稻材料的結(jié)構(gòu)變異(Structural variation,SV)。為了方便在群體水平上準(zhǔn)確地比較等位基因在不同水稻材料中的遺傳變異,研究者還利用高質(zhì)量的群體基因組構(gòu)建了基于基因組序列比對(duì)的泛基因組圖譜,并對(duì)每個(gè)變異位點(diǎn)進(jìn)行了基因注釋和序列的整合,囊括了目前最全面的水稻基因序列的復(fù)等位信息。

該泛基因組圖譜可以幫助研究者充分挖掘與利用水稻功能基因遺傳變異??共』騈LRs(leucine-rich repeat genes)區(qū)域經(jīng)常存在復(fù)雜的SV,對(duì)不同水稻材料中的抗病基因的等位變異進(jìn)行鑒定和比較非常困難。研究人員利用泛基因組圖譜通過(guò)整合NLRs注釋信息,構(gòu)建了水稻泛NLRome,確定了泛NLRs家族基因的共線性。為抗病基因功能和進(jìn)化研究提供了基礎(chǔ),也給群體水平的復(fù)雜基因家族或者復(fù)雜的染色體區(qū)域研究提供了借鑒。

研究人員利用他們構(gòu)建的泛基因組序列和對(duì)應(yīng)的群體表達(dá)數(shù)據(jù),對(duì)兩個(gè)已知初定位QTL進(jìn)行重新分析,分別快速確定了產(chǎn)量相關(guān)性狀的候選基因,并通過(guò)實(shí)驗(yàn)驗(yàn)證了候選基因的功能。群體水平的泛基因組序列可以幫助研究者從群體的水平上對(duì)復(fù)雜QTL定位區(qū)間序列的單倍型精準(zhǔn)解析,大大加快功能基因挖掘的進(jìn)程。

該泛基因組圖譜為水稻比較基因組學(xué)和進(jìn)化基因組學(xué)研究提供了重要基礎(chǔ)。亞洲稻和非洲稻的比較基因組研究,揭示了亞洲栽培稻和非洲栽培稻重要農(nóng)藝性狀馴化和環(huán)境適應(yīng)的遺傳基礎(chǔ)。利用泛基因組序列解析了與水淹反應(yīng)相關(guān)的已知基因在5個(gè)不同水稻亞群中的單倍型分布和群體分化程度,發(fā)現(xiàn)非洲水稻和亞洲水稻中這些耐水淹基因可能發(fā)生了獨(dú)立的變異來(lái)適應(yīng)水淹環(huán)境。株型由野生稻匍匐生長(zhǎng)轉(zhuǎn)變?yōu)樵耘嗟局绷⑸L(zhǎng)是水稻馴化過(guò)程中的關(guān)鍵一步。前人研究表明,野生稻中都存在一個(gè)由多個(gè)串聯(lián)鋅指基因構(gòu)成的RPAD位點(diǎn),而在栽培稻基因組中僅有一個(gè)鋅指基因,分別是prog1和prog7。在亞洲栽培稻馴化過(guò)程中,PROG1功能喪失及與其緊密連鎖的110 kb片段缺失,導(dǎo)致亞洲栽培稻株型變直立。而在非洲栽培稻prog7基因組區(qū)域內(nèi)也存在130 kb左右大片段缺失,但是該缺失片段內(nèi)調(diào)控水稻匍匐生長(zhǎng)習(xí)性的基因并不清楚。利用泛基因組圖譜比較了普通野生稻和短舌野生稻RPAD位點(diǎn)的差異,發(fā)現(xiàn)其在種內(nèi)和種間均存在明顯的分化,并且在馴化過(guò)程中,非洲栽培稻與亞洲栽培稻都在RPAD位點(diǎn)發(fā)生了大片段缺失,但是非洲栽培稻與亞洲栽培稻分別保留了RPAD位點(diǎn)兩端的不同鋅指基因,該結(jié)果不僅揭示了非洲栽培稻株型馴化的分子機(jī)理,也為大片段結(jié)構(gòu)變異驅(qū)動(dòng)作物平行馴化提供了重要的分子證據(jù)。



為了高效方便地利用這些海量的基因組數(shù)據(jù),研究人員還構(gòu)建了數(shù)據(jù)庫(kù)RiceSuperPIRdb(http://www.ricesuperpir.com/)。通過(guò)數(shù)據(jù)檢索,可以高效地獲得特定水稻品種基因組序列及基因組注釋,還可以選擇任意樣本基因組為參考基因組,查看與所有材料的全基因組比對(duì)結(jié)果和基因組變異。該網(wǎng)站對(duì)利用這些基因組信息研究水稻基因功能研究和種質(zhì)資源利用具有重要的科學(xué)意義和實(shí)用價(jià)值。
Cell Research同期發(fā)表了圣路易斯華盛頓大學(xué)Kenneth M. Olsen教授對(duì)于該工作的評(píng)論文章。Olsen教授認(rèn)為基因組相關(guān)研究的貢獻(xiàn)不僅取決于單個(gè)基因組的組裝質(zhì)量,也取決于其包含的自然變異多樣性。Shang等人發(fā)布了第一個(gè)包含亞洲栽培稻和三個(gè)近緣物種在內(nèi)的水稻“超級(jí)泛基因組”,該研究極大促進(jìn)了我們對(duì)于水稻基因組的理解,相關(guān)種質(zhì)資源及數(shù)據(jù)對(duì)基礎(chǔ)研究有重要價(jià)值。
原文鏈接:https://www.nature.com/articles/s41422-022-00685-z
評(píng)論文章鏈接:https://www.nature.com/articles/s41422-022-00699-7
黃學(xué)輝 教授 (上海師范大學(xué))
泛基因組(Pan-genome)是指一個(gè)物種內(nèi)所有基因組信息的總和。相比單一參考基因組,泛基因組信息包含了豐富的遺傳多樣性,可有效降低參考基因組偏差對(duì)遺傳變異檢測(cè)的影響。該研究團(tuán)隊(duì)選取了251份來(lái)自不同類群的亞洲栽培稻、普通野生稻、非洲栽培稻及短舌野生稻材料,對(duì)它們進(jìn)行了長(zhǎng)讀長(zhǎng)測(cè)序、從頭組裝、基因組注釋和結(jié)構(gòu)變異鑒定,獲得了一份高質(zhì)量的水稻泛基因組圖譜。這套群體水平的超級(jí)泛基因組,無(wú)論是材料選擇、樣本大小還是組裝質(zhì)量都可圈可點(diǎn),是水稻基因組學(xué)研究中一項(xiàng)里程碑式的工作。
在此基礎(chǔ)上,該研究團(tuán)隊(duì)還開(kāi)發(fā)了這套數(shù)據(jù)的在線網(wǎng)站,提供給同行們進(jìn)行水稻組學(xué)資源的獲取和整合,這將極大地方便科研人員充分挖掘水稻品種中的各類等位變異,精確地鑒定復(fù)雜農(nóng)藝性狀的關(guān)鍵變異位點(diǎn)(QTN),進(jìn)一步推動(dòng)水稻功能基因組學(xué)研究。此外,結(jié)合高質(zhì)量的組學(xué)數(shù)據(jù),育種家還可以充分利用這251份水稻資源,進(jìn)行優(yōu)異基因聚合,創(chuàng)制新的育種材料,實(shí)現(xiàn)更高水平的分子設(shè)計(jì)育種。
田志喜 研究員(中國(guó)科學(xué)院遺傳與發(fā)育生物學(xué)研究所 )
種內(nèi)、種間多樣性是作物改良的基礎(chǔ)。隨著研究的深入,基于單一參考基因組解析物種多樣性的弊端逐漸顯現(xiàn),例如無(wú)法實(shí)現(xiàn)基因組復(fù)雜區(qū)域候選基因的精細(xì)解析等。在本文中,研究人員從稻屬材料中系統(tǒng)性收集了251份水稻核心種質(zhì),組裝了高質(zhì)量基因組,在進(jìn)行完整注釋后構(gòu)建了目前植物中群體規(guī)模最大的超級(jí)泛基因組。同時(shí),基于高質(zhì)量基因組的序列比對(duì)完成了泛基因組圖譜。該圖譜將群體材料每個(gè)變異位點(diǎn)的序列和基因注釋整合,展示了目前稻屬基因組序列最全面、最完整的復(fù)等位信息,為群體水平候選片段或等位基因的共線性分析及單倍型比較等研究提供新的切入點(diǎn)和突破口。研究人員以復(fù)雜基因家族——抗病基因NLRs為例,詳細(xì)介紹了基于水稻超級(jí)泛基因組開(kāi)展復(fù)等位基因研究的方法。通過(guò)提取泛基因組圖譜中NLRs信息,成功構(gòu)建了泛NLRome,在群體水平充分展示NLRs的共線性、重排等信息,不僅能夠?yàn)镹LRs進(jìn)化相關(guān)研究提供了參考,也為基于泛基因組研究復(fù)雜基因家族或者染色體區(qū)域提供了思路。
最后,作者將所得數(shù)據(jù)及分析結(jié)果在網(wǎng)站上進(jìn)行可視化,方便相關(guān)科研人員以任意研究樣本為參考基因組查看與所有材料的全基因組比對(duì)結(jié)果和基因組注釋,查看材料間變異信息。作為植物研究領(lǐng)域的頂級(jí)資源和研究成果,不僅是前沿科學(xué)挑戰(zhàn)的新突破,同時(shí)對(duì)水稻甚至其他植物的功能研究和分子育種具有不可估量的價(jià)值。