鸿运国际(中国)

新聞中心
NEWS
Nature Genetics項目文章|茶樹單體型基因組組裝揭示茶樹的演化史
2021-08-10 00:00

2021年7月15日,由福建農林大學、中國農業科學院(深圳)農業基因組研究所等多家單位共同合作在國際期刊Nature Genetics上發表「Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis」的文章,該研究利用自主開發的新算法破譯了高雜合鐵觀音的基因組組裝難題,並在此基礎上闡釋了等位特異性表達應對」遺傳負荷」的機制及茶樹群體進化和馴化歷史,為茶樹育種改良提供了新見解。鸿运国际(中国)為本次研究提供二代和PacBio三代建庫測序服務。


46.jpg


文章名稱:Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis

發表時間:2021年7月15日

發表雜誌:Nature Genetics

研究物種:茶樹(Camellia sinensis)

影響因子:38.330


研究背景


茶葉作為一種全球性的經濟作物,有很強的保健作用。茶樹是無性繁殖的,這種方式可以有效地維持因有性重組而分離或丟失的有價值的基因型。然而,這種繁殖方式也會積累大量有害突變,導致「穆勒棘輪」效應,致使作物遭受損失。茶樹是二倍體,含有15對同源染色體,嵌合式的基因組組裝(篩選同源染色體中的一份拷貝作為代表組裝到染色體水平)可能會錯過重要選擇性狀的等位變異,而分型組裝(不同親本的兩套同源染色體同時組裝到染色體水平)能更完整地呈現二倍體基因組的全部遺傳信息。本文通過對中國烏龍茶品種鐵觀音及幾個主要的茶樹品種和近緣物種進行測序及單體型組裝,探索地理上不同的茶樹群體之間的遺傳多樣性,為深入了解茶樹的馴化史和進化史提供依據。


樣本選擇


山茶植株芽、根、莖、花、幼葉和成熟葉


測序策略


DNA:

PacBio Sequel II平台基因組測序 114X

Illumina NovaSeq 150 bp雙端測序,DNA小片段文庫

Illumina NovaSeq,Hi-C文庫 99.4X

RNA:

PacBio Sequel II平台,Iso-Seq文庫


研究結果


1. 基因組組裝與注釋


鐵觀音的基因組大小約為3.15 Gb,雜合度為2.31%。利用PacBio長讀長對原始數據進行組裝得到初始contig,大小為5.41 Gb。將Khaper算法過濾產生的單倍體組裝結果掛載到15個染色體(圖1),得到單倍體參考基因組(monoploid reference genome),大小為3.03 Gb。同時利用ALLHiC算法得到鐵觀音單體型基因組(haplotype-resolved genome),大小為5.98 Gb。共線性分析顯示它們的基因順序高度一致。


1739518860498.jpg

圖1 鐵觀音基因組組裝和質量評估(a)單倍體參考基因組circos圖,呈現15條染色體特徵;(b)Hi-C熱圖呈現15條染色體組裝質量;(c)LAI(LTR Assembly Index)評估鐵觀音基因組和已發表茶樹基因組組裝質量;(d)鐵觀音單倍體參考基因組和單體型基因組的共線性比較


2. 等位基因特異性表達


利用鐵觀音不同組織的全基因組測序,分離得到14,691個等位基因(圖2),其中1,528個基因存在一致性的等位特異性表達(consistent allele-specific expression,  ASEGs),即一個等位基因在所有組織和樣本中的表達都高於另一等位基因。基因富集分析顯示這些基因參與核糖體等多個生物學基本過程,與克服有害突變的潛在機制相關。同時還發現了386個非一致的ASEGs,它們在不同組織的等位基因之間存在特異性表達。其中幾個基因與揮發性有機化合物的生物合成有關,包括黃酮和黃酮醇等的生物合成途徑,這與植物的適應性演化相關。結果表明,在鐵觀音基因組中,一致性的ASEG明顯多於不一致的ASEG(1,528 vs 386),這一趨勢與雜交水稻的結果正好相反,即在雜交水稻中,不一致的ASEG遠遠大於一致性的ASEG。這種現象或許可以用雜種優勢理論中的顯性效應解釋,長期無性繁殖的茶樹利用優勢等位基因應答不斷積累的遺傳負荷,以保持個體的適應度。


43.jpg

圖2 茶樹單倍型基因組等位不平衡(a) 兩個單倍型序列的比對(10 Mb非重疊的窗口);(b)等位基因CDS序列比較;(c)等位基因的選擇壓力分析;(d)等位基因的非同義替換位點數目分佈;(e)等位特異性表達基因(ASEGs)在茶樹葉片中的表達情況;(f)舉例說明一致性的ASEGs(CsSRC2);(g)舉例說明非一致的ASEGs(CsGGPS1)


3. 茶樹遺傳變異和群體


通過對161份茶樹種質資源重測序數據分析,發現樣本主要分為三類(圖3),分別為大理茶,大葉茶和小葉茶,與茶樹的形態學分類一致。另外大葉茶可以分類古大葉茶和栽培大葉茶;而小葉茶依據地理分佈可分為四個亞組,分別為SSJ(陝西,四川,江西),ZJNFJ(浙江和福建北部),SFJ(福建南部),HHA(湖北,湖南和安徽)。TreeMix分析發現這些茶樹之間存在顯著的基因流動,表明種內基因交流頻繁,其中一些與有記錄的茶樹雜交育種歷史相吻合。


44.jpg

圖3 茶樹群體系統進化與群體結構分析(a)重測序樣本的地理分佈;(b)群體系統發育樹;(c)PCA主成分分析;(d)群體遺傳結構分析(k=7)


4. 大葉茶和小葉茶的進化史和馴化史


對14種山茶屬植物的21株單株進行了全基因組測序,通過群體遺傳分析發現大葉茶和小葉茶具有不同的進化史。在Gelasian epoch時期(259-181萬年前),劇烈的氣候變化很可能導致了整個茶樹物種(包括大葉茶和小葉茶)的群體收縮;兩個變種分化後,僅小葉茶在Last Glacial Maximum時期(2.65-1.9萬年前)可能由於溫度驟降出現了再一次的群體收縮,但隨後適應了環境的小葉茶迅速擴張,群體規模得到恢復。該分析表明,大葉茶和小葉茶分化後的進化史不同(圖4)。通過對大葉茶和小葉茶馴化基因的分析,發現它們的馴化過程是並行的(即獨立馴化),這些馴化基因參與了一系列重要的生物學過程且受人工選育的偏好性影響。基於KEGG分析,在大葉茶馴化早期以參與氧化石墨烯苷轉運、糖苷轉運通路為主,後期品種改良主要集中在合成生物鹼和芳香化合物等。例如,研究人員鑑定到CsXDH基因在大葉茶品種改良階段受到強烈的人工選擇,該基因編碼黃嘌呤脫氫酶,是咖啡因合成通路的重要基因。而小葉茶品種的早期馴化與植物抵禦相關,改良過程主要集中在花發育的調控和對一氧化氮的響應,已有研究表明,NO的積累可以加速γ-氨基丁酸的消耗從而幫助植物抵禦冷脅迫,這表明篩選耐寒的品種也是人工選育的重要目標。


45.jpg

圖4 大葉茶和小葉茶的平行馴化(a)平行馴化模式圖;(b)全基因組的選擇性清除信號;(c-f)重要基因的人工選擇信號(XDH,CM,F3』H,BAS1,DWF4);(g)人工選擇基因的表達情況


小結


本研究成功組裝了兩套鐵觀音基因組(單倍體參考基因組和單體型基因組)。通過對等位基因特異性表達的分析,預測顯性效應可能是鐵觀音應對遺傳負荷的重要機制。通過對茶樹種群水平的遺傳分析,揭示了該物種的進化和人工馴化歷史。該成果為利用組學分析和分子生物學技術挖掘功能基因、解析其背後的遺傳調控機制,開展基於大數據驅動的基因組智能設計育種奠定了堅實的理論基礎,同時也為縮短育種周期、提高育種效率、降低育種成本提供了科學依據。


參考文獻:


Zhang X, Chen S, Shi L, et al. Haplotype-resolved genome assembly provides insights into evolutionary history of the tea plant Camellia sinensis [published online ahead of print, 2021 Jul 15]. Nat Genet. 2021;10.1038/s41588-021-00895-y.