鸿运国际(中国)

新聞中心
NEWS
分子育種第五講|全基因組選擇疑問解答!你想知道的都在這裏
2023-12-29 09:08

新鮮出爐!全基因組選擇FAQ解答大揭秘!小夥伴們,經過前幾期的介紹,想必大家已經對全基因組選擇產生了較深的印象,是不是也產生了一些好奇的地方呢?今天小編就為你解答一些常見問題,趕緊來看看吧!


問題1:全基因組選擇中,訓練群體和預測群體分別指什麼?二者之間有什麼關係?

答:訓練群體是指有基因型和表型信息的群體,根據訓練群體的數據進行建模。預測群體是指只有基因型的群體。訓練群體和預測群體二者之間需要具有一定的親緣關係,才可以提高預測準確度。換言之,訓練群體和預測群體的遺傳背景需要統一,以玉米為例,如果溫帶和熱帶玉米在訓練群體和預測群體中分佈不均,並且表型是從溫帶地區收集的,則熱帶玉米的表型可能無法充分體現。


問題2:可以使用一個群體作為參考群,去預測另一個群體的育種值嗎?

答:這需要看兩個群體的親緣關係,如果一個群體中有很多都是另一個群體的親本或者祖先,那麼評估的準確性就比較高,如果親本或者祖先較少,那麼評估的準確性就比較低。極端情況下,兩個群體沒有關係,評估的準確性很差,參考價值不大。


問題3:如何進行模型的選擇?

答:交叉驗證是在建立模型和驗證模型參數時常用的辦法,一般被用於評估一個模型的表現。通常情況下,我們先應用多個模型進行預測,再根據交叉驗證來進行最優模型的選擇。


問題4:全基因組選擇準確性的影響因素有哪些?

答:(1)訓練群體:訓練群體是用於構建模型的數據集,其規模大小、群體結構、有效群體大小及與預測群體的遺傳關係都影響着預測能力和準確性。(2)預測性狀的遺傳力:遺傳力越高,育種值的準確性越高;低遺傳力性狀需要更多數量的基因型和表型數據才能獲得較高的準確性。(3)表型性狀測定的準確性:數量性狀受環境影響較大,只有通過多年多點實驗,平衡環境差異,同時提高測定指標的精度和準度,獲得的表型數據用於建模和預測才會有較好的效果。(4)SNP的密度與位置:覆蓋全基因組的標記密度越高,則與影響目的性狀基因的LD值越高,準確性越高;SNP的位置對全基因組估計育種值的準確性影響較小,但是對基因型填充卻很重要,總之,在應用任何密度的晶片時!測序深度同樣起着至關重要的影響。(5)統計模型:統計模型是全基因組選擇的核心,對預測能力、準確性和效率有重要影響。由於性狀形成的遺傳調控機制複雜,沒有固定模型算法能適用所有性狀。


問題5:SNP密度、預測模型對商業化育種體系全基因組選擇應用影響有多大?

答:已有文獻報道,標記密度到了一定程度後,再多的話,就是多餘和重複了。而預測模型,考慮到不同的群體和表型性狀,交叉驗證的結果會很清楚的告訴我們哪個方法最好。


問題6:全基因組選擇在種業方面可以有哪些方面的應用?能夠幫助解決哪些實際問題?

答:全基因組選擇在種業方面的應用主要有優異性狀個體篩選和雜交組合的高效選配兩個方面。


問題7:如何評價GS的應用效果?

答:短期是在目標選擇群體中正向選擇後跟隨機選擇產生的無偏見的遺傳增益,中長期可看的是子代是否進行高級階段、商業化階段。


問題8:自交作物與雜交作物在全基因組選擇的應用上有什麼不同?

答:全基因組選擇是根據基因型和表型來建模,自交作物的應用主要是優異性狀個體篩選,而雜交作物的應用主要是雜交組合的高效選配。


問題9:整合不同來源的數據,是否要統一標記的物理位置?

答:是的,需要。


問題10:全基因組選擇中,什麼是最重要的?

答:最重要的是表型和基因型數據的準確性,只有這些數據的準確性提高了,預測準確性才可靠。同時,也有研究表明,如果基因型數據質量較差,會大大影響分析結果。


問題11:rrBLUP和GBLUP哪個好?是使用兩步法(先估算SNP效應值, 再計算育種值)還是使用一步法(直接估計育種值)好呢?

答:其實rrBLUP和GBLUP兩種方法是等價的,使用rrBLUP估計方差組分比較容易,GBLUP計算比較容易。


問題12:鸿运国际(中国)目前可以做幾種模型呢?

答:包括GBLUP、rrBLUP、BayesA、BayesB、BayesC、Bayesian Lasso、BRR、SVM、CNN、深度學習等10餘種模型。