2023年9月16日,西北農林科技大學動物科技學院姜雨團隊在Genome Research上發表題為「A Chinese indicine pangenome reveals a wealth of novel structural variants introgressed from other Bos species」的研究論文。該研究通過高質量中國黃牛泛基因組學分析,揭示了中國南方黃牛的馴化和演化機制。鸿运国际(中国)為本研究提供三代PacBio HiFi測序服務。
01 研究背景
作為重要的現代飼養家畜之一,牛在人類文明發展的進程中對社會生產提升和人類文化進步做出了重要的貢獻。家養牛主要分為起源於印度河流域的瘤牛(Bos indicus)和近東流域的普通牛(Bos taurus)。隨着歷史文明的發展,這些牛逐漸被傳播,並分化為六個常見的牛群種類:歐洲普通牛、非洲普通牛、亞洲普通牛、印度瘤牛、非洲瘤牛和中國瘤牛。現代科學普遍認為中國瘤牛在3,500至2,500年前傳入中國。隨着群體的擴張,遺傳多樣性會喪失,但是中國瘤牛的多樣性至少是其它牛群的兩倍,且發現有部分來自野牛的遺傳性質。因此,探究中國瘤牛中雜交遺傳物質的數量、這些雜交對牛群遺傳多樣性的影響以及雜交畜群中的功能變異的貢獻是有趣的科學問題。
02 研究結果
10個代表性中國黃牛品種的高質量基因組的從頭組裝
研究人員基於18-24X的測序深度,利用hifiasm完成20個基因組的初步組裝,並使用RagTag完成掛載,獲得10個高質量的染色體水平的參考基因組。組裝完成的基因組大小在2679-2714 Mb之間,由110-367個contig組成,N50為18-91 Mb,平均BUSCO評估約95.5%。基於二代數據評估的基因組準確度QV值可達39.13%,鹼基準確度大於99.99%。染色體完整性評估發現,組裝基因組平均每個染色體包含962.18Kb的着絲粒序列和2.26Kb的端粒序列,高於已經發表的參考基因組。綜上,研究人員構建了高質量的牛泛基因組圖譜。
圖1 不同品種牛的地區分佈和高質量染色體水平基因組構建
構建中國黃牛的多重組裝圖譜
研究人員利用Hereford品種的線性參考基因組作為骨架,將之前組裝的20個單體型參考基因組進行組裝整合,構成多重組裝圖譜。在進行圖形泛基因組的構建中,使用minigraph工具,並忽略了同源區域,對足夠分散的子序列(長度大於50 bp)進行處理,創建新節點("bubbles")。多重組裝圖譜中包含了160,000個非參考節點,總跨度為148.5 Mb,其中包括約22.21%的泛基因組(即不被所有組裝基因組共享的靈活序列)。從圖形泛基因組中提取了74,907個非參考等位基因(長度大於100 bp),並與牛屬(Bos species)的整個基因組的重測序數據進行比較,發現有53.96%的新序列在其他瘤牛/普通牛種群中無法檢測到,其中包括26.21%在野生牛屬物種中特有的序列。
此外,研究人員發現了豐富的重複變異,其中LINE/L1佔主導地位,多等位性變異中以可變數串聯重複(VNTR)為主要類型。研究人員使用de novo和同源性的方法,進行新基因和基因結構的預測。結果表明,預測到1,153個完整的基因模型,其中有271個基因是新發現的基因,這些基因家族可能在嗅覺轉導、免疫應答、信號傳導、內源性逆轉錄病毒-K蛋白質以及核糖體蛋白等多個生物過程中發揮作用。
圖2 中國黃牛的多重組裝圖譜
中國黃牛結構變異的生成和特徵分析
研究人員使用多種SV檢測工具,建立了中國黃牛的結構變異(SV)目錄,並對SV進行了詳細的分類和特徵化。具體而言:通過合併從所有樣本中檢測到的高置信度SVs,構建了一個包含156,000個非冗餘的長度大於等於50 bp 的SVs目錄,其中包括73,889個刪除和82,120個插入。這些SVs覆蓋基因間區和內含子區域,且包括一小部分的外顯子重疊。接着,將中國黃牛的非冗餘SV目錄分為四個類別:共享(在所有樣本中都被發現的)、主要(在至少50%的樣本中被發現,但不是所有樣本)、多態(在1%至50%的樣本中被發現)、單一(只在一個樣本中被發現)。
SV分佈分析表明,大多數SV相對較短,其中包括兩個長度約為145 bp和285 bp的峰值,主要注釋為BOV-A2(SINEs),一個長度為1,295 bp的峰值對應ERV2-LTR-BT,而一個長度為8,500 bp的峰值對應LINE/L1,這表明轉座元件是牛中SV的重要來源。SV熱點分析鑑定了206個SV熱點,跨越了約195 Mb的基因組,其中61個位於染色體末端的最後5 Mb內。28個熱點與先前發佈的已鑑定到的熱點重疊,而其餘119個熱點是新的,此外,對SV熱點中檢測到2,533個蛋白質編碼基因的功能預測表明,這些基因主要與免疫系統和嗅覺傳導相關。
圖3 10個中國黃牛結果變異的特徵分析
不同牛品種對中國牛的遺傳貢獻
研究人員使用隱馬爾可夫模型,分析20個單體型的中國黃牛基因組,並將其與321個非中國黃牛的基因組進行比較。研究發現,中國黃牛的基因組中包含來自多個牛屬物種的古代引入的基因片段。不僅有來自野牛(banteng)的基因片段,還有另外的來源,如古代的林牛。
這些引入的片段涵蓋了中國黃牛基因組的大部分,佔總基因組的73.3%;相比於常染色體,X染色體中的古代引入元素明顯較少,這可能是由於更強的自然選擇或對不兼容外源等位基因的敏感性所致;對於遺傳多樣性,研究發現,引入的基因片段使中國黃牛的基因組具有更高的核苷酸多樣性(θπ),而在引入區域的變異數量也明顯高於非引入區域,這些觀察結果表明,引入的基因片段對中國黃牛的遺傳多樣性產生了積極影響;此外,研究估計了不同來源物種的基因引入發生的時間,結果顯示不同來源的基因引入發生在不同的時間和地點,其中野牛樣來源的基因引入發生時間最早,在約3,360-3,192年前。研究還發現,野牛樣和林牛樣基因片段的全局含量與海拔呈顯著負相關,表明不同牛群的棲息地可能導致了不同的遺傳結構或後續選擇壓力。
圖4 中國黃牛的基因滲入和演化分析
03 研究結論
研究人員使用了來自中國南部的10頭中國黃牛的PacBio HiFi測序數據,組裝了20個高質量的單體型基因組,並將它們整合到一個多組裝圖中,其中包含了148.5 Mb(5.6%)的新序列。研究還鑑定了156,009個高置信度的非冗餘結構變異(SVs)和206個SV熱點。此外,研究檢測到34,249個古代遺傳片段,覆蓋了中國黃牛基因組的73.3%,這些古代遺傳片段的來源包括了來自爪哇牛、林牛、大額牛、印度野牛等不同牛屬物種的遺傳物質,以及0.6%的未知來源的遺傳物質,多個不同的物種的遺傳物質可能為中國黃牛的遺傳多樣性做出了貢獻。總之,這項研究強調了不同物種間的遺傳物質遷移對於一個重要的家畜群體的基因組結構所起到的作用,並展示了異源基因組元素如何為選擇提供了可用的遺傳變異,對於動物進化研究和遺傳育種具有重要的參考意義。
參考文獻
Dai X, Bian P, Hu D, Luo F, Huang Y, Jiao S, Wang X, Gong M, Li R, Cai Y, Wen J, Yang Q, Deng W, Nanaei HA, Wang Y, Wang F, Zhang Z, Rosen BD, Heller R, Jiang Y. A Chinese indicine pangenome reveals a wealth of novel structural variants introgressed from other Bos species. Genome Res. 2023 Sep 15. doi: 10.1101/gr.277481.122. Epub ahead of print. PMID: 37714713.