研究領域:空間組學, 多切片整合對齊, 多尺度, 動態圖卷積神經網路
董弘禹| 作者
論文題目:SANTO: a coarse-to-fine for spatial omics
論文來源:Nature Communications
論文連結:https://www.nature.com/articles/s41467-024-50308-x
隨著空間組學技術的蓬勃發展,對2D 切片進行對齊與拼接,進而形成3D 空間模型以發現全局特徵,已成為空間組學分析中不可或缺的步驟。然而,現有的方法在處理大規模空間組學資料集時面臨挑戰,尤其是基於螢光與影像技術產生的數據,在分析時往往耗時過多,分析結果也不盡準確。
鑑於此,來自阿卜杜拉國王科技大學和耶魯大學的研究人員提出了一種針對空間組學的從粗到精的兩階段對齊策略—— SANTO。 SANTO 分為兩個階段(圖1),首先在粗調階段,透過計算相關係數快速匹配識別兩切片重疊區域;隨後在精調階段,透過使用動態圖卷積神經網路(DGCNN) 整合空間特徵與基因表現特徵,進一步將兩切片進行精細化對齊。
圖 1 SANTO 的演算法示意圖
研究者們透過廣泛實驗驗證了 SANTO 相比現有方法的卓越性能。首先,他們在各種資料集上同已發表的各種方法實施了基準測評(圖 2),測評結果顯示 SANTO 在對齊任務與拼接任務的精確度和穩健性都超過了現有方法。
圖 2 SANTO 與其他現有方法的基準測評比較
驗證了 SANTO 模型的高效能後,研究人員使用此工具開展了豐富的下游應用。具體而言,他們對來自同一組織(乳腺癌樣本)的跨平台的切片(10x Xenium 和Visium)進行了對齊和拼接(圖3),確定了更多樣化的細胞類型組成,並通過空間細胞通訊分析,更精細探索了腫瘤微環境,為臨床治療提供新的指引。
圖 3 SANTO 成功拼接乳癌樣本的跨平台切片,探討腫瘤微環境
研究人員進一步將模型應用於對齊三維時空組學數據,進而揭示組織發育進程。透過對齊兩個小鼠胚胎樣本(三維樣本,分別為E14.5 和E15.5 時期,每個樣本由連續4 片二維切片構成),模型能夠揭示肝臟、肺、心臟等器官的時空演化路徑,有助於老化和癌症進化的研究(圖4)。
圖4 利用SANTO 實現3D-to-3D 的時空對齊
最後,研究者使用SANTO 將基因表現和組蛋白定序兩種模態的切片對齊,實現了跨模態整合,展現了SANTO 能夠進行多樣廣泛的對齊任務(圖5)。
圖 5 利用 SANTO 實現跨模態對齊
總之,在本研究中,研究人員研發了一個通用框架— SANTO,來解決空間組學的對齊和拼接問題。全面的基準測試揭示了模型在準確性,穩健性和可用性方面的卓越性能,透過跨平台拼接、3D-to-3D 時空對齊和跨模態對齊等任務,進一步展示了SANTO 在各種具有挑戰性的應用中的強大功能。
生命複雜性讀書會招募中
Jizhi Club kooperiert mit Tang Leihan, Lehrstuhlinhaber der School of Science und Interdisciplinary Science Center der Westlake University, Chang Cheng und Li Yang, assoziierten Forschern des National Protein Science Center (Beijing), Tang Qianyuan, Assistenzprofessor des Hong Kong Baptist Lin Yihan und Tang Shijie, Postdoktorand am Center for Excellence in Molecular Cell Science der Chinesischen Akademie der Wissenschaften, und Forscher am Institute of Frontier Interdisciplinary Studies der Peking-Universität, waren Co-Sponsoren des Buches „Complexity of Life: Principles of Der Buchclub „Composition of Complex Life Systems“ befasst sich mit den Lebenswissenschaften von der mikroskopischen Zellskala über die mesoskopische Gewebe- und Organskala bis hin zur makroskopischen Skala des menschlichen Körpers. Wichtige Themen und wichtige Daten auf diesem Gebiet sollen einen intensiven Austausch zwischen Statistikern fördern Physiker, Methodenforscher des maschinellen Lernens und Omics-Forscher knüpfen interdisziplinäre Kooperationsbeziehungen und regen neue Forschungsideen und Kooperationsprojekte an. Der Leseclub startet am 6. August 2024 und findet jeden Dienstagabend von 19:00–21:00 Uhr statt, mit einer voraussichtlichen Dauer von 10–12 Wochen. Freunde, die sich für dieses hochmoderne Gebiet interessieren, das die Lebenswissenschaften, die Physik, die komplexen Wissenschaften und die Informatik tief miteinander verbindet, sind herzlich willkommen, sich anzuschließen!
以上是Nat. Commun. 速遞:面向空間組學的兩階段對齊與拼接方法的詳細內容。更多資訊請關注PHP中文網其他相關文章!