![]()
過去幾年,空間組學(xué)技術(shù)爆發(fā):空間轉(zhuǎn)錄組、原位蛋白質(zhì)組、空間代謝組、周期性免疫組化……技術(shù)花樣繁多,數(shù)據(jù)量和分辨率都在飆升。問題也隨之顯現(xiàn):這些不同來源、不同尺度的數(shù)據(jù)像散落在桌面上的拼圖,缺少一種既能放大細(xì)節(jié),又能把碎片拼成全景的「工作臺」。
考慮到工作者的實(shí)際需要,美國波士頓大學(xué)(Boston University)與西奈山伊坎醫(yī)學(xué)院(Icahn School of Medicine at Mount Sinai)等介紹了一套模塊化軟件包 Giotto Suite,它提供可擴(kuò)展的端到端解決方案,用于多尺度和多組學(xué)數(shù)據(jù)分析、集成和可視化。
他們的研究成果以「Giotto Suite: a multiscale and technology-agnostic spatial multiomics analysis ecosystem」為題,于 2025 年 10 月 1 日發(fā)布在《Nature Methods》。
![]()
論文鏈接:https://www.nature.com/articles/s41592-025-02817-w
一個「技術(shù)無關(guān)」的數(shù)據(jù)框架與模塊化包組
現(xiàn)有的空間組學(xué)軟件通常偏向某一類技術(shù)或某一層級分辨率,比如說專門處理 spot-based 的序列化空間轉(zhuǎn)錄組,或?qū)iT做圖像分割/可視化的工具。諸如此類工具在面對研究者的整合需求(RNA、蛋白、形態(tài)學(xué)特征以及注釋信息跨尺度)時,就顯得有些麻煩。
這些麻煩不僅體現(xiàn)在需要在不同工具間頻繁轉(zhuǎn)換數(shù)據(jù)格式、手動對齊坐標(biāo)或編寫大量 glue 代碼,更頭疼的地方在于,工具生態(tài)碎片化也阻礙了社區(qū)共享與復(fù)用。
![]()
圖 1:Giotto Suite 生態(tài)系統(tǒng)和核心數(shù)據(jù)框架。
Giotto Suite 的目標(biāo)正是變「工具林」成「生態(tài)圈」,減少重復(fù)造輪子,讓下游分析更順手、更可復(fù)現(xiàn)。
先來看看其設(shè)計的三條關(guān)鍵思路。
1.技術(shù)無關(guān)的數(shù)據(jù)框架—— 它把空間數(shù)據(jù)用統(tǒng)一的數(shù)據(jù)結(jié)構(gòu)表示(例如 giottoPoints、giottoPolygon、giottoLargeImage),能同時承載點(diǎn)狀(transcripts)、矢量(注釋區(qū)域)和柵格(組織切片圖像)等多種空間單元,保留原始信息并支持多尺度聚合。這個框架的核心讓不同技術(shù)生成的數(shù)據(jù)可以在同一「語言」下互通。
2.模塊化、可擴(kuò)展的 R 包生態(tài)—— Giotto Suite 不是一個單體程序,而是一組 R 包和接口,強(qiáng)調(diào)可插拔、與 Bioconductor 等生態(tài)互操作,同時提供交互式可視化與高性能計算支持,方便開發(fā)者在其上構(gòu)建自定義流水線與方法。
3.多模態(tài)與多尺度的耦合分析能力—— 它不僅能做單細(xì)胞級的分子分析,還能把細(xì)胞級信息匯聚到組織結(jié)構(gòu)(region/zone)或柵格層次,支持從亞細(xì)胞到組織的跨尺度問題建模與可視化。
總體思路就是,先用一個強(qiáng)壯的、技術(shù)無關(guān)的數(shù)據(jù)底座把信息屋架搭好,然后在上面放各種分析、可視化與擴(kuò)展組件。對用戶而言,等于把「數(shù)據(jù)轉(zhuǎn)換+格式對齊」的時間換成「真正做生物學(xué)問題」的時間。
開箱即用
為了展示 Giotto Suite 的能力并突出其空間技術(shù)無關(guān)性,與它靈活且可拓展的實(shí)現(xiàn)方式,它的研究團(tuán)隊(duì)展示了在以下由一些最新空間技術(shù)生成的特定數(shù)據(jù)集上的各種應(yīng)用。
多尺度與泛用框架
Giotto Suite 的核心框架可以促進(jìn)任何級別的聯(lián)合數(shù)據(jù)表示和分析,譬如說 MERFISH FFPE 人類乳腺癌數(shù)據(jù)集的一個子集。MERFISH、編碼原位雜交、免疫組化圖像及質(zhì)譜成像等不同技術(shù)的數(shù)據(jù)被接入統(tǒng)一框架,并完成了跨層級的聯(lián)合分析(把轉(zhuǎn)錄水平和蛋白分布映射到相同組織結(jié)構(gòu)中)。
![]()
圖 2:多尺度分析。
除了通常將每個細(xì)胞視為基本單元的常見分析管道外,Giotto Suite 的框架還允許用戶進(jìn)行亞細(xì)胞分析。詳細(xì)點(diǎn)說,根據(jù)任何預(yù)定義的空間單元查詢單個轉(zhuǎn)錄本位置,并用于識別在亞細(xì)胞器上空間富集的基因或基因集,或檢測優(yōu)先在細(xì)胞邊界內(nèi)或外部發(fā)現(xiàn)的轉(zhuǎn)錄本。
多模態(tài)數(shù)據(jù)分析
Giotto Suite 為新型技術(shù)提供了重要補(bǔ)充,其中一點(diǎn)體現(xiàn)在支持多模態(tài)數(shù)據(jù)分析和集成,以獲得更全面的細(xì)胞狀態(tài)表征方面。這通過添加核心框架促進(jìn)的特定功能而實(shí)現(xiàn)。
![]()
圖 3:使用 Giotto Suite 框架進(jìn)行多組學(xué)數(shù)據(jù)分析。
拓展性與交互性
Giotto Suite 能夠輕松包含來自數(shù)百萬個細(xì)胞的時空和表達(dá)信息,即使是高性能計算基礎(chǔ)設(shè)施也常常難以用傳統(tǒng)方法處理這些數(shù)據(jù)集。這其中實(shí)現(xiàn)了優(yōu)化的并行編碼、延遲磁盤計算和數(shù)據(jù)投影策略等幾個互補(bǔ)工具,用以緩解可拓展分析的挑戰(zhàn)。
![]()
圖 4:可擴(kuò)展的數(shù)據(jù)分析、平鋪方法和應(yīng)用。
在 Giotto Suite,用戶可以在細(xì)胞級別鉆取,也能把注意力拉遠(yuǎn)看組織分區(qū)或立體切片堆棧的模式,工具鏈支持交互式探索,適合科學(xué)家與臨床同事共同討論切片/圖譜。
研究團(tuán)隊(duì)重做了 Giotto 的 S4 類設(shè)計、增加單元測試與持續(xù)集成,強(qiáng)調(diào)向外部開發(fā)者開放接口,使社區(qū)能在它上面貢獻(xiàn)新方法或插件(利于長期生態(tài)建設(shè))。
工程化落地
把技術(shù)與數(shù)據(jù)「放在一個桌面上」帶來的好處很多,不單單是更快速地將基因表達(dá)模式與蛋白分布、細(xì)胞形態(tài)聯(lián)系起來,面向 FAIR 原則的框架使得數(shù)據(jù)與分析流程更易共享與審查。可復(fù)現(xiàn)的實(shí)驗(yàn)與開放 API 等設(shè)計使得 Giotto Suit 更像是一個平臺而非產(chǎn)品,便于形成社區(qū)插件與方法互補(bǔ)。
空間多組學(xué)是未來生物醫(yī)學(xué)與基礎(chǔ)生物學(xué)的重要方向,但它需要的不僅是更高分辨率的技術(shù),而是一套能把不同尺度與模態(tài)連通起來的工程與軟件哲學(xué)。Giotto Suite 正是沿著這條路線做出的工程化落地。
對整個領(lǐng)域來說,這比多出一個分析方法更重要——它可能決定未來幾年空間生物學(xué)研究能否真正從「各自為戰(zhàn)」走向「協(xié)同進(jìn)化」。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.