鸿运国际(中国)

新聞中心
NEWS
項目文章 | 多組學聯合分析揭示桑果花青素含量的變化規律
2024-05-08 10:52

2024年4月23日,西南大學家蠶基因國家重點實驗室趙愛春團隊於Horticulture Research在線發表了題為」Haplotype-resolved Chromosomal-Level Genome Assembly Reveals Regulatory Variations in Mulberry Fruit Anthocyanin Content「的文章,鸿运国际(中国)為該研究提供三代PacBio HiFi建庫測序服務。文章通過基因組、轉錄組、代謝組、GWAS等多組學聯合分析的手段,對桑果花青素含量調控的關鍵基因和基因變化規律進行深度解析,為桑果遺傳規律的探索和新品種選育提供了重要理論指導。


image1_副本.png

水果、主食、傳統草藥的歷史傳承-桑果


作為桑科的一員,桑樹(Morus)在全球範圍廣泛分佈,常見於北半球的熱帶和亞熱帶地區。桑果因其美味的口感、醒目的顏色、豐富的營養和較低的熱量成為亞洲廣泛種植的水果之一。除作為食用水果外,桑樹還承載着主食和傳統草藥的歷史傳承。從桑果中提取的關鍵生物活性成分,如花青素和多糖等,已被證實具有各種生物活性,其中,花青素因其益於健康和抵抗衰老的特性受到廣大研究工作者的深度關注。


高質量單體型桑果樹基因組組裝與注釋奠定分析基礎


研究人員選擇了兩個具有代表性的桑樹品種ZS5801和ZZB,這兩個品種在桑果外觀和花青素含量上具有較大的差異。基於高深度的HiFi(98X和73X)和Hi-C(118X和79X)以及大量的Illumina二代數據,構建了2個桑樹品種的單倍型基因組,基因組大小分別為293.6-301.3Mb和309-314.9Mb,Contig N50為2.6Mb-8.9Mb。基因組評估表明兩個基因組分別具有97%和97.3%的BUSCO,二代數據的Mapping率和覆蓋度可達99% 以上。通過注釋,研究人員發現,單體型基因組的重複序列分別為151-159Mb和167-172Mb,占基因組大小約50%,基於多種工具和手段,單倍型基因組注釋到23,950-24,283個高可信度的蛋白編碼基因。綜上,研究人員結合二代測序和三代測序獲得了具有高精度、完整性和連續性的桑樹基因組並完成了注釋。


image2_副本.png

圖 兩個桑果品種高質量單體型基因組的構建


比較基因組學解釋桑樹品種ZS5801和ZZB的歷史演化


研究人員選擇了擬南芥、榕樹、已發表的若干桑樹基因組,桑樹品種ZS5801和ZZB,基於3,584個單拷貝基因組家族進行比較基因組學分析。研究發現,ZS5801和ZZB的物種分歧大概發生在距今1.84百萬年前,其中ZS5801有70個基因家族發生了擴張,183個發生了收縮,這些基因功能主要集中在蛋白泛素化,ATP依賴的酶和防禦反應等;對於ZZB有76個基因家族發生了擴張,142個發生了收縮,這些基因與花粉識別、鹽脅迫相關。此外,研究人員發現,這兩個桑樹品種的基因組都未發生全基因組複製事件,但含有較多的TE和LTR類型的重複序列,且表現出種間差異的插入事件。


image3_副本.png


圖 桑樹的比較基因組學分析


GWAS定位桑樹果實演化基因MaVHAG3


通過基於GEMMA的線性混合模型(LMM)對112個桑樹個體的基因型和表型數據來進行GWAS,研究人員想要闡明桑樹果實顏色演化的分子基礎。研究人員在5號染色體上定位到1個突出的關聯信號,命名為MaVHAG3,MaVHAG3屬於VHA亞基G基因家族,在桑樹果實成熟期間,其表達顯著上調。對MaVHAG3深度剖析,發現一個位於MaVHAG3最後一個外顯子的顯著SNP變異,與果實顏色變異高度相關。此外,還發現了一個位於MaVHAG3上游啟動子區域的5bp Indel,對基因的表達模式產生了影響。RNA-seq和qRT-PCR分析驗證了MaVHAG3在桑樹果實中花青素積累中的重要作用。綜上,MaVHAG3在桑樹果實顏色調控中發揮着重要作用,其自然變異是支持這一特徵的重要原因,而地理和環境因素可能也對其變異和選擇起到了影響作用。


image4_副本.png


圖 果實顏色演化的GWAS分析


轉錄組和代謝組重構果實顏色形成的過程


通過重構代謝途徑,研究人員成功識別了參與果實顏色形成的酶基因。同時比較ZS5801和ZZB的花青素合成途徑,預測花青素和黃酮類物質的生物合成酶。為了更深入了解果實顏色調控,研究人員進行了跨越多個發育階段的多組學調查。通過轉錄組和代謝組分析,發現ZS5801和ZZB在果實發育過程中呈現出明顯的顏色變化,其中ZS5801積累了花青素,而ZZB逐漸降解葉綠素;高花青素產量和低花青素產量樣本之間存在顯著代謝物差異,特別是在黃酮類物質含量方面;非靶向代謝分析發現了543種代謝物,包括碳水化合物、有機酸和氨基酸等,這些成分對果味產生了貢獻。通過分析來自五個果實發育階段的RNA測序數據,發現18,025個基因在五個組織和兩個品種間呈現差異表達。最後,利用確定的花青素途徑酶和轉錄因子,研究人員構建了兩個桑樹品種的時間序列基因共表達網絡,揭示了調控兩個品種果實顏色轉變的基因調控機制。總之,這些轉錄和代謝分析的結果為進一步探索花青素的調控機制奠定了深厚的基礎。


image5_副本.png

圖 桑果的轉錄和代謝研究