- 目標(biāo):十年內(nèi)測(cè)序所有真核生物!
- 本文來源于海潮天下(Marine Biodiversity)
關(guān)鍵信息導(dǎo)讀:
GenomesonaTree(GoaT)是地球生物基因組計(jì)劃(EBP)的核心協(xié)作和數(shù)據(jù)管理工具,由惠康桑格研究所開發(fā),旨在作為一個(gè)強(qiáng)大的搜索引擎和數(shù)據(jù)門戶。它通過索引所有已命名的真核生物物種的公開基因組元數(shù)據(jù)(如基因組大小、測(cè)序狀態(tài)),并將這些信息與系統(tǒng)發(fā)育樹結(jié)構(gòu)關(guān)聯(lián)起來,從而能夠通過推算來填補(bǔ)數(shù)據(jù)空白。GoaT的關(guān)鍵作用在于,它為EBP旗下全球分散的測(cè)序項(xiàng)目提供了實(shí)時(shí)的進(jìn)度追蹤、目標(biāo)規(guī)劃和質(zhì)量控制的統(tǒng)一平臺(tái),確保這項(xiàng)宏大的“生命編目”工作能夠高效、協(xié)調(diào)且系統(tǒng)地進(jìn)行。
本文約1800字,閱讀約4分鐘
![]()
▲上圖:地球生物基因組計(jì)劃(EBP)的宏偉目標(biāo)。圖源:EBP
地球生物基因組計(jì)劃(EBP)被譽(yù)為生物學(xué)的“登月計(jì)劃”,其目標(biāo)相當(dāng)宏偉:要在十年左右的時(shí)間里,把地球上已知的近190萬(wàn)種真核生物的基因組全都測(cè)一遍,編目并解析出來。這項(xiàng)工作,是為了給理解、利用和保護(hù)全球生物多樣性打下最扎實(shí)的基因組學(xué)基礎(chǔ),畢竟,人類現(xiàn)在對(duì)地球生命的遺傳密碼知之甚少。
想完成這樣大規(guī)模的全球協(xié)作,真正的難點(diǎn)并不完全是測(cè)序技術(shù),而在于管理和協(xié)調(diào)。全球有數(shù)十個(gè)專注于特定地區(qū)或特定物種的項(xiàng)目都在EBP旗下同步推進(jìn),怎么確保大家不重復(fù)勞動(dòng)、進(jìn)度如何追蹤,成了整個(gè)計(jì)劃的核心挑戰(zhàn)。
為了解決這個(gè)問題,EBP引入了一項(xiàng)關(guān)鍵的幕后工具:Genomes on a Tree(GoaT)。
![]()
上圖:GoaT數(shù)據(jù)管理流程示意圖
▲上圖:GoaT數(shù)據(jù)管理流程示意圖。該流程分為兩個(gè)主要階段:(A)從多個(gè)來源和格式中檢索分類群(Taxon)和基因組組裝(Assembly)的元數(shù)據(jù);(B)對(duì)檢索到的元數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,統(tǒng)一轉(zhuǎn)化為表格格式并準(zhǔn)備導(dǎo)入規(guī)范文件。在準(zhǔn)備過程中,核心工作包括對(duì)數(shù)據(jù)值進(jìn)行規(guī)范化處理、翻譯屬性術(shù)語(yǔ)、將列映射到GoaT已有的屬性,以及定義缺失值估算的傳播方法,確保所有數(shù)據(jù)都能夠被系統(tǒng)有效索引和追蹤。圖源:Challis R et al. (2023)
GoaT由惠康桑格研究所的“生命之樹”項(xiàng)目團(tuán)隊(duì)開發(fā),本質(zhì)上是一個(gè)強(qiáng)大的數(shù)據(jù)聚合器、一個(gè)門戶。它的主要職責(zé)就是把所有跟基因組有關(guān)的元數(shù)據(jù)、測(cè)序計(jì)劃和項(xiàng)目狀態(tài)都索引并搜索出來。
這個(gè)系統(tǒng)厲害的地方在于,它不只是簡(jiǎn)單記錄已經(jīng)測(cè)好的數(shù)據(jù)。GoaT基于Elasticsearch數(shù)據(jù)庫(kù),將所有公開的基因組元數(shù)據(jù)都和物種的分類樹(Tree of Life)掛鉤。它甚至能利用物種間的進(jìn)化關(guān)系,對(duì)那些缺乏直接測(cè)量數(shù)據(jù)的物種(比如基因組大小)進(jìn)行估算和推算。這么一來,GoaT就成了一個(gè)可以為生命樹進(jìn)行規(guī)劃和預(yù)測(cè)的分析引擎。目前,GoaT追蹤著近150萬(wàn)真核生物物種的幾十項(xiàng)分類和基因組裝配屬性。
![]()
攝影 ?Linda Wong | 海潮天下(Marine Biodiversity)
GoaT最直觀的價(jià)值,體現(xiàn)在它能實(shí)時(shí)展現(xiàn)EBP的貢獻(xiàn)。通過它,我們可以清晰看到“EBP傘形項(xiàng)目”(BioProject PRJNA533106)在各個(gè)分類等級(jí)上的測(cè)序進(jìn)展。數(shù)據(jù)顯示,EBP網(wǎng)絡(luò)已經(jīng)為從屬到綱、目、科、屬、種等多個(gè)層次的數(shù)千個(gè)分類單元生成了基因組組裝。
再看看最新的進(jìn)度,EBP在2025年持續(xù)發(fā)力。數(shù)據(jù)顯示,截至當(dāng)年8月,EBP附屬項(xiàng)目在物種級(jí)別上的每月產(chǎn)出是穩(wěn)定且高效的,高峰期單月完成了超過800個(gè)物種的組裝。雖然這些成果的組裝質(zhì)量(從初級(jí)的contig到最終的chromosome級(jí)別)不盡相同,但整個(gè)計(jì)劃在科(family)這一分類級(jí)別上的產(chǎn)出也保持著每月50個(gè)左右的穩(wěn)定速度。
![]()
?海潮天下(Marine Biodiversity)
讀而思
【思考題】學(xué)而時(shí)習(xí)之
Q1、數(shù)據(jù)的“燈塔”能否照亮“黑暗物種”?上面講到,GoaT通過索引現(xiàn)有數(shù)據(jù)和系統(tǒng)發(fā)育推算來估算物種的基因組信息,但,它如何確保這些間接推算結(jié)果在多大程度上具備實(shí)際科學(xué)準(zhǔn)確性?尤其是對(duì)于那些缺乏近親參考、生態(tài)和地理信息稀缺的“黑暗物種”(Dark Taxa),GoaT的建模能力是否可能導(dǎo)致固化過去的認(rèn)知偏差、而非真正填補(bǔ)知識(shí)空白呢?
Q2、從倫理角度講,GoaT如何確保數(shù)據(jù)來源的公平性?GoaT作為全球協(xié)調(diào)中心,加速了基因組測(cè)序的進(jìn)程,但大量生物樣本和物種多樣性,主要還是集中在“全球南方”國(guó)家。那么,GoaT在追蹤項(xiàng)目進(jìn)度的同時(shí),是否設(shè)立了足夠的機(jī)制,來確保數(shù)據(jù)和樣本的獲取過程完全遵循惠益分享和原住民的“事先知情同意”原則(FPIC)、防止基因組資源流向少數(shù)富有國(guó)家或商業(yè)機(jī)構(gòu),從而加劇科研資源的分配不公?你怎么看?
Q3、GoaT設(shè)定了高標(biāo)準(zhǔn)的基因組組裝質(zhì)量(如染色體級(jí)別),以確保數(shù)據(jù)的長(zhǎng)期價(jià)值。那么,GoaT的高質(zhì)量要求是否會(huì)限制多樣性?這種追求“高質(zhì)量”的統(tǒng)一標(biāo)準(zhǔn),有沒有可能在無(wú)形中,擠壓那些資源有限、但擁有獨(dú)特物種的項(xiàng)目或?qū)嶒?yàn)室的生存空間?
全球環(huán)境治理·前沿
海潮天下
GLOBAL BIODIVERSITY GOVERNANCE
![]()
聲明:本文僅代表資訊,供讀者參考,不代表平臺(tái)觀點(diǎn)。
編譯 | 王芊佳
日期 | 2025年11月
![]()
- 「海潮天下」(Marine Biodiversity)致力于成為全球環(huán)境治理與生物多樣性保護(hù)的先鋒平臺(tái)。我們以科學(xué)為錨點(diǎn),深度解讀生態(tài)系統(tǒng)的運(yùn)行密碼,追蹤最新國(guó)際前沿研究,分享創(chuàng)新保護(hù)實(shí)踐——從海洋到濕地,從深海基因庫(kù)到氣候智慧型農(nóng)業(yè),從瀕危物種拯救到生態(tài)修復(fù)技術(shù),從可持續(xù)漁業(yè)到BBNJ談判,從塑料污染條約到減塑撿塑以及綠色金融政策……
- 我們追求前沿、最新、有價(jià)值。這里是資訊窗口。用專業(yè)守護(hù)生命網(wǎng)絡(luò),重塑人與自然的關(guān)系~
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.