2021年7月12日,福建省淡水水產研究所薛凌展團隊聯合福建師範大學、華中農業大學和維也納大學等單位,在Genome Biology在線發表題為Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair的論文,從染色體層面解析了大刺鰍基因組,對性染色體的起源及重組抑制進行了相關研究,構建了魚類Y染色體完整圖譜,提出動物性染色體近着絲粒起源的假說。鸿运国际(中国)在本研究中提供了三代測序、Hi-C輔助組裝以及RNA-Seq等多組學測序技術和服務。
文章名稱:Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair(魚Y染色體的端粒對端粒組裝揭示了年輕的性染色體對的起源)
發表時間:2021年7月12日
發表雜誌:Genome Biology(13.583)
樣本選擇
大刺鰍(Mastacembelus armatus)的肌肉組織、眼睛、大腦、皮膚和睾丸等不同組織樣本
測序策略
DNA:
PacBio Sequel II平台基因組測序,構建20 kb文庫
Illumina HiSeq X Ten測序,構建Hi-C文庫
Illumina NovaSeq 6000測序,構建DNA小片段文庫
RNA:
Illumina HiSeq X Ten測序,構建RNA文庫
研究背景
性染色體起源需要在原性染色體之間建立重組抑制。在許多魚類物種中,性染色體對是最近起源的同態染色體。要弄清重組抑制是如何在性染色體早期分化階段發生的,就需要合適的研究物種及其高完整度的基因組。
大刺鰍隸屬於合鰓目,具有性逆轉的現象。其Y染色體具有更早期的起源,這為研究Y染色體退化的早期階段提供了標本。然而Y染色體連接區域具有大量重複序列和異染色質化,很難通過二代測序的短讀長進行組裝拼接。通過三代測序CCS模式(環狀重複測序)產生的HiFi reads準確率超過99.5%,讀長達20 kb,且無需家系信息,可進行高準確度和完整度的基因組組裝。研究團隊選擇大刺鰍作為研究樣本,利用三代和Hi-C測序技術進行二倍體基因組組裝,期望通過年輕的性染色體對的單倍型基因組組裝解析性染色體分化的早期問題。
研究結果
單倍型解析的染色體水平組裝
研究團隊提取了雄性大刺鰍的肌肉組織DNA進行PacBio三代測序,產生30 G的HiFi數據,結合Hi-C數據進行基因組輔助組裝,獲得了高質量染色體水平的基因組。k-mer分析表明,HiFi讀取錯誤率僅為0.086%,基因組大小為600.1 Mb,contig N50為9.9 Mb。組裝獲得大刺鰍的基因組序列可獨立產生兩個染色體水平的單倍體基因組hap-X和hap-Y(圖1)。通過7個鱸形總目(Percomorpha)物種和一個外群物種Acanthochaenus luetkenii(一種基生棘鰭目魚類)的全基因組比對數據,確認了大刺鰍與亞洲沼澤鰻有密切的親緣關係,並估計它們在大約3,600萬年前彼此分化。
圖1 單倍型基因組組裝
着絲粒衛星的基因組和細胞遺傳學鑑定
大刺鰍高質量的基因組組裝有助於解析染色體複雜區域。為了鑑定着絲粒衛星DNA,團隊根據基因組注釋獲取了兩個拷貝數較大的衛星序列,單體長度分別為524 bp(命名為CEN-524)和190 bp(命名為Tel-190)。CEN-524通常出現在每條染色體上的一個位點上。在端着絲粒染色體中,它出現在染色體的一端,在中部和亞中部着絲粒染色體中,它出現在中間。因此Cen-524被驗證為候選着絲粒衛星。Tel-190隻出現在染色體的末端,Tel-190被認為與端粒有關。為了進一步驗證候選着絲粒衛星,利用熒光原位雜交對Cen-524和Tel-190探針進行雜交,發現它們在染色體上的位置與基因組組裝序列位置基本一致(圖2)。
圖2 着絲粒衛星的基因組和細胞遺傳學鑑定
年輕的性染色體分析
研究團隊使用雄性特異性標記來區分X和Y染色體,為了進一步劃分完全性連鎖區(sex-linked region,SLR),選用10個雄性和10個雌性個體進行重測序,並篩選與性別相關的變異,分析發現了年輕的性染色體。Y染色體上~7Mb序列被發現與性別有關,與假常染色體區(pseudoautosomal region,PAR)或常染色體相比,顯示出高密度的雄性特異性突變,雄性和雌性之間的分化增加。由此推測SLR跨越着絲粒,染色體的兩端是PAR。這表明物理上靠近着絲粒的位置可能是SLR缺乏重組的原因。
根據雄性特異性變異的密度和內含子序列的X-Y差異,將SLR分為R1和R2兩個區域。在這兩個區域中,X-Y序列差異接近1%,表明兩者起源很近。由於短臂異染色質位於着絲粒附近,推測短臂異染色質可能起源於着絲粒周圍異染色質(pericentromeric heterochromatin,PCH)。通過轉錄組分析,檢測雄性、雌性和間性個體(發生性逆轉個體)性腺中SLR基因的表達譜,獲得兩個特異性表達的基因SYCE3和HMGN6。SYCE3可能參與成熟睾丸的精子發生或其他生物學過程,而HMGN6是指導睾丸發育的性別決定候選基因。
圖3 性連鎖區域的鑑定
着絲粒周圍存在異染色質結構域
為了確定着絲粒周圍區域的邊界,研究團隊檢測了染色體重複豐度。着絲粒周圍區域(~4 Mb)具有較高的重複序列、較低的基因密度、較低的重組率和更頻繁的H3k9me3修飾,與PCH一致。大多數PCH長約4.2 Mb,其大小僅與染色體大小呈弱相關且不顯著。較小的染色體,特別是端着絲粒和近中着絲粒染色體,具有較大比例的PCH,包括XY染色體。在着絲粒周圍區域,較大物理距離上的染色質相互作用更為頻繁,與其較高的摺疊和壓縮程度特徵一致。着絲粒周圍區域比其他區域有更大比例的高表達水平和寬度的基因,與前人研究觀點一致,即H3K9me3在基因抑制中的作用有限,可能存在其他表觀遺傳修飾調節PCH中的基因表達(圖4)。
圖4 着絲粒周圍異染色質對基因組區室化的影響
文章小結
本文利用PacBio三代HiFi測序數據和Hi-C測序數據組裝出了大刺鰍高質量的染色體水平的基因組,從染色體層面解析了大刺鰍基因組。結合轉錄組數據分析,獲得SLR中兩個特異性表達的基因SYCE3和HMGN6,其中HMGN6是指導睾丸發育的性別決定候選基因。本文對性染色體的起源及重組抑制進行了相關研究,構建了魚類Y染色體完整圖譜,提出了動物性染色體近着絲粒起源的假說,為性染色體起源的研究提供了新線索。
參考文獻
Lingzhan Xue, Yu Gao, Meiying Wu, et al. Telomere-to-telomere assembly of a fish Y chromosome reveals the origin of a young sex chromosome pair[J]. Genome Biology. 2021, 22(1): 203.