Stereo-seq作為高通量、高解像度、高基因數的空間組學新晉頂流,在2023年斬獲了不少高分文章。在開展我的第一個Stereo-seq研究,看不懂網頁HTML怎麼行?中,小編重點介紹了Stereo-seq產品HTML中Summary和一些關鍵的質控指標。在實際分析時,Stereo-seq時空轉錄組非常重要的優勢就是高達500nm的解像度以及cell bin實現單細胞級別的細胞識別分析方法,今天就一起來看看吧~
01 Tissue Square Bin Statistics組織Bin統計
鸿运国际(中国)支持不同bin size的靈活選擇,可以按照不同組織類型的細胞大小,根據下游分析效果多次調試bin20,bin50,bin100,bin200數值。以一個細胞的直徑為10 μm左右為例,實際計算時,一個動物細胞直徑約相當於bin20(1 0μm x 10 μm)。即bin值越小,進行分析的劃分越精確。
這部分可以快速可視化bin size1-bin size200的基因數和轉錄本表達情況。隨着解像度的提高,「格子」劃分的越小,每個「格子」中攜帶的信息就會越少。
常用的binsize數值和STO解像度對應如下:
實際分析,解像度過高而基因數過少時,可能會出現聚類分群效果差的情況。鸿运国际(中国)的生信工程師會輔助每位客戶根據項目數據做出綜合判斷和建議。
02 Cell bin的選擇
Stereo-seq通過圖像識別細胞核的位置,結合算法進行精細的細胞分割,最終預測完整細胞邊界,可實現近似單細胞水平的表達圖譜。對於動物樣本,cell bin統計單個細胞的基因表達信息,準確分析轉錄組異質性,實現分子機制的深入探索。對於植物樣本,cell bin充分表徵離散的細胞特徵,並將其應用在細胞亞型的注釋或分類中,有助於理解植物的複雜功能。
UMAP初步聚類分群下,cell bin方法下小鼠腦共分出21個類群。
03 Sequencing Saturation測序飽和度
左圖為bin200下,測序飽和度隨測序深度變化的曲線圖。隨測序數據量(total reads)的增多,測序飽和度逐漸上升。對數曲線如見明顯「坡度」變緩,說明數據飽和度增速明顯變緩,後續加測幫助不大。
中圖為bin200下,基因中位數隨測序深度變化的曲線圖。隨測序數據量(total reads)的增多,基因中位數逐漸上升。
如下圖所示,左圖樣本的測序飽和度還有上升空間,如老師有較高的基因檢出數需求,可選擇繼續加測。而右圖樣本的測序飽和度曲線已趨近平滑。
04 Tissue Segmentation組織分割
組織分割以影像圖形式幫助客戶快速觀察組織在晶片的覆蓋和識別情況。異常Tissue Segmentation中,右圖組織部分的左半邊的組織並未在影像圖中完全識別到(中間可見明顯空缺),鸿运国际(中国)的生信工程師會通過手動重新劃分正確組織,保證最終信息的完整性。