本氏煙草(Nicotiana benthamiana)為一年生茄科煙草屬植物,由於其快速的瞬時轉基因分析,是一種廣泛應用於植物生物學和生物技術中的模式植物。2024年11月14日,北京大學現代農業研究院郭立團隊在Nature Plants上發表了題為「The complete genome assembly of Nicotiana benthamiana reveals genetic and epigenetic landscape of centromeres」的研究論文,本研究組裝了一個端到端完整的多倍體T2T植物基因組,同時對異源四倍體本氏煙草的着絲粒序列及其表觀特徵進行了深入解析。北京大學現代農業研究院郭立研究員為論文通訊作者,陳為凱副研究員為論文第一作者。北京大學現代農業研究院科研助理陳紹英、孫杰、王靖萱、孟點等人參與該研究。鸿运国际(中国)為該項目提供三代建庫測序服務。
研究背景本氏煙草(Nicotiana benthamiana)作為一種在植物生物學和生物技術領域廣泛應用的模式生物,基因組研究對於揭示其生物學特性和進化歷史具有重要意義。儘管先前的研究已對該基因組有所探索,但完整的基因組序列,尤其是着絲粒和端粒區域,仍未被完全解析。本氏煙草屬於異源四倍體,包含兩個亞基因組,研究其亞基因組和潛在的二倍體祖先,有助於揭示物種分化、雜交事件和基因組重排等演化過程。因此利用長讀長測序技術,如PacBio HiFi和Oxford Nanopore Technology(ONT)等解析多倍體煙草的基因組結構,同時對着絲粒、端粒序列進行探究將是一個有效的研究模型。
研究結果
高質量T2T本式煙草基因組組裝
研究人員採用多種先進測序技術實現了本式煙草(Nicotiana benthamiana)高質量的端到端(T2T)基因組組裝,包括PacBio HiFi測序(116.7×覆蓋度)、ONT超長測序(47.9×覆蓋度)、Illumina短讀測序(100×覆蓋度)、Hi-C染色質互作數據(150×覆蓋度)以及Bionano光學圖譜(329.6×覆蓋度)。最終組裝的基因組總長為2.849 Gb,共19條染色體,Contig N50達146.41 Mb,同時研究人員對該基因組的38個端粒和19個着絲粒區域進行了完整解析。質量評估顯示基因組具有98.8%的完整BUSCO基因、QV值為69.63、LTR評分為17.84,且光學圖譜和Hi-C驗證均證明其具有出色的連貫性和準確性。
圖 本式煙草T2T基因組圖譜構建
異源四倍體亞基因組的定位
研究人員通過差異性k-mer分析、主成分分析(PCA)和基因組共線性分析,對本式煙草(Nicotiana benthamiana)異源四倍體的亞基因組進行了精確劃分,並結合系統發育樹與基因組比對深入溯源其祖先來源。研究發現,19條染色體可分為SubA(11條)和SubB(9條)兩個亞基因組,其中SubA來源於N. glauca和N. attenuata的姐妹類群(母系),而SubB來源於N. sylvestris的姐妹類群(父系)。亞基因組分析揭示了廣泛的染色體重組和基因丟失現象。通過多方法驗證,該結果清晰揭示了本式煙草亞基因組的劃分與起源,為異源四倍體基因組的進化研究提供了重要依據。
圖 異源四倍體亞基因組定位
着絲粒和着絲粒衛星DNA的特徵研究
研究人員系統解析了本式煙草(Nicotiana benthamiana)19個完整着絲粒的遺傳與表觀遺傳情況,發現其分為三種主要類型:衛星型、Gypsy型和NUMTs型,並通過CENH3 ChIP-seq分析、重複序列注釋與表觀遺傳特徵研究揭示其不同的功能特性。衛星型着絲粒以核糖體DNA(45S和5S rDNA)片段為來源,通過串聯擴展形成功能性衛星DNA,並伴隨轉座元件侵入,逐步演化為成熟着絲粒;而Gypsy型着絲粒則以Ty3/Gypsy轉座元件為主。研究還發現衛星型着絲粒富集H3K4me3修飾,而Gypsy型缺乏顯著表觀遺傳標記,DNA甲基化模式也存在差異。這些結果揭示了本式煙草着絲粒的多樣性及其衛星DNA的起源與演化機制。
圖 着絲粒衛星DNA特徵研究
本式煙草着絲粒的遺傳特性及進化機制
研究人員通過對着絲粒線粒體DNA(NUMTs)分佈分析、CENH3 ChIP-seq精準定位和進化比較,系統揭示了本式煙草着絲粒的遺傳特性及進化機制。研究發現,NUMTs顯著聚集於母系亞基因組(SubA)的着絲粒區域,共識別出113個NUMTs,其中81個位於功能性着絲粒附近區域,部分直接成為CENH3結合位點,構成功能性核心。通過對19個着絲粒的表觀遺傳和成分分析,明確了Gypsy型和衛星型着絲粒的主要組成及差異,其中Gypsy型以CRM和Tekay轉座元件為主,衛星型則通過CEN33和CEN43等核糖體DNA衍生的衛星序列擴展形成。研究提出了着絲粒從「新生着絲粒」到「成熟着絲粒」的演化模型,衛星DNA的擴展和轉座元件侵入是關鍵驅動因素,而混合型着絲粒可能是這一過程的中間狀態。
本式煙草的進化史
研究人員發現,在大約2300至4400萬年前,煙草屬(Nicotiana)和茄屬(Solanum)物種經歷了一次共同的全基因組三倍化事件後開始分化。此後,在600萬至1000萬年前,煙草屬內的Sylvestres和Noctiflorae/Petunioides兩個分支發生了分化。大約500至600萬年前的上新世過渡期,Suaveolentes(包括本氏煙草)通過一次雜交事件形成。異源四倍體本氏煙草的基因組在形成後經歷了大規模的重排和重組,稱為「基因組衝擊」事件,隨後的長期基因組二倍化過程導致了染色體的分裂和融合,衛星序列的出現,以及新着絲粒的形成等事件,從而塑造了本氏煙草的現代基因組。
圖 本式煙草基因組染色體進化歷史
研究人員利用PacBio HiFi和Oxford Nanopore Technology(ONT)長讀長測序技術,成功組裝並注釋了本氏煙草(Nicotiana benthamiana)的完整2.85 Gb基因組,涵蓋了所有19條染色體的端到端序列。研究揭示了本氏煙草着絲粒的遺傳和表觀遺傳特徵,發現其着絲粒既有基於衛星序列的,也有富含Ty3/Gypsy逆轉錄轉座子的,提出了新着絲粒形成和衛星序列擴張的演化模型。此外,通過亞基因組分析確定了本氏煙草的兩個亞基因組,並推斷了其潛在的二倍體近緣祖先,重建了其基因組演化歷史,包括全基因組三倍化事件、物種分化、雜交事件以及基因組衝擊後的演化過程,為理解這一模式生物和多倍體植物基因組演化提供了寶貴的資源和新見解。
參考文獻
Chen, W., Yan, M., Chen, S.et al. The complete genome assembly of Nicotiana benthamiana reveals the genetic and epigenetic landscape of centromeres. Nat. Plants (2024). http://doi.org/10.1038/s41477-024-01849-y