作者 | 曾響鈴
文 | 響鈴說
毫無疑問,在充裕的糧食自給率面前,中國老百姓早已經(jīng)不用擔(dān)心“餓肚子”問題。幾個(gè)月前,加拿大數(shù)字媒體公司發(fā)布了一份權(quán)威的糧食自給率數(shù)據(jù)榜單,擁有14億人口的中國已經(jīng)高居全球第三。
![]()
但是,我們看到的可能只是一種食物的“結(jié)果”,在整個(gè)農(nóng)業(yè)產(chǎn)業(yè)鏈條中,這種“結(jié)果”之前的育種環(huán)節(jié),我們所面臨的挑戰(zhàn)實(shí)際上并不小。2025年,中央一號文件提出繼續(xù)推進(jìn)生物育種產(chǎn)業(yè)化,這也是“生物育種”連續(xù)第五年走進(jìn)中央一號文件,其背后是育種產(chǎn)業(yè)的重要性和發(fā)展的緊迫性。
農(nóng)安天下,種為基石,種子是農(nóng)業(yè)的“芯片”,是現(xiàn)代農(nóng)業(yè)的基石,更是確保國家糧食安全的源頭,關(guān)系著國計(jì)民生。
而過去許多年,國際種業(yè)巨頭在我國市場來勢兇猛,包括全球種業(yè)前十強(qiáng)在內(nèi)的70多家國際種企進(jìn)入中國,我們的田間地頭已經(jīng)種下了一大批洋種子,糧食自給自足的背后是種子嚴(yán)重依賴國外。
雖然這些年在國家大力扶持以及相關(guān)主體的積極努力下,我國種業(yè)也在快速發(fā)展并取得了一些突破,研發(fā)能力逐步增強(qiáng),市場占有率也穩(wěn)步提升,但不得不承認(rèn)的是,中國種業(yè)與發(fā)達(dá)國家存在代差。
端穩(wěn)中國飯碗,還必須培育中國種子。
![]()
好消息是,已經(jīng)有人在行動(dòng)。作為國家重要的農(nóng)業(yè)實(shí)驗(yàn)室,崖州灣國家實(shí)驗(yàn)室主要從事種業(yè)研究,與華為攜手,正在積極通過AI提升育種的效率和效果,實(shí)現(xiàn)農(nóng)業(yè)智能化與可持續(xù)發(fā)展。
![]()
AI普惠帶來的育種革命,但撞上了“數(shù)據(jù)墻”
崖州灣國家實(shí)驗(yàn)室相關(guān)專家在一次活動(dòng)上分享育種AI實(shí)踐時(shí),曾回顧了全球育種行業(yè)過去的發(fā)展。與很多傳統(tǒng)行業(yè)一樣,這個(gè)領(lǐng)域過去長期依賴經(jīng)驗(yàn),雖然經(jīng)過多個(gè)階段的進(jìn)化,但從技術(shù)來說一直是一個(gè)概率事件:
第一代的馴化育種直接從大自然挑好種子;
第二代雜交育種帶有極強(qiáng)的隨機(jī)性,需要長期蹲守,期待、等待好的結(jié)果;
到了第三代分子水平育種,有分子標(biāo)記但也只是進(jìn)行了提前的篩選,本質(zhì)上是提高了第二代雜交育種獲得成果的概率;
到了第四代,也就是全基因組學(xué)習(xí)階段,分子標(biāo)記變成基因識別和標(biāo)記,概率、效率近一步提升。
可以看出,只要是不能真正預(yù)測育種行為結(jié)果的,都無法擺脫被動(dòng)“拼概率”的命運(yùn)。
這造成了一個(gè)來自時(shí)間的壁壘——那些起步早的西方國家,靠著長期依賴不斷試錯(cuò)、博概率的積累,在育種方面積累了中國很難短期內(nèi)同樣用概率追趕的優(yōu)勢(從雜交組合到性狀篩選,往往需要數(shù)年甚至數(shù)十年的周期),尤其是我們的育種技術(shù)還存在代差,獲得成果的“概率值”還比不上西方時(shí)。
怎么辦?
如果能有一種方法,突破“拼概率”,在田間育種進(jìn)行前就能提前預(yù)測到結(jié)果,毫無疑問育種就能實(shí)現(xiàn)彎道超車。
這也正是第五代育種——智能品種設(shè)計(jì)階段帶給中國的機(jī)遇。
中國的AI普惠如火如荼,正在眾多領(lǐng)域推進(jìn)效率升級甚至是模式革命,它不僅是“工具的革命”,更是“革命的工具”。在育種領(lǐng)域,AI for Science新的研究范式,讓育種可以通過 AI 模型快速分析基因與表型之間的關(guān)聯(lián),預(yù)測作物的產(chǎn)量、抗逆性等關(guān)鍵性狀,大幅縮短研究周期,幫助我國育種產(chǎn)業(yè)實(shí)現(xiàn)趕超。
![]()
然而,當(dāng)崖州灣國家實(shí)驗(yàn)室擁抱AI、積極投身智能品種設(shè)計(jì)時(shí),卻遭遇了嚴(yán)峻的數(shù)據(jù)挑戰(zhàn)。
眾所周知,當(dāng)下AI已經(jīng)從拼模型的時(shí)代進(jìn)入到數(shù)據(jù)的時(shí)代,數(shù)據(jù)的質(zhì)量很大程度上決定了模型效果,西方國家發(fā)布的AI戰(zhàn)略已經(jīng)把科學(xué)數(shù)據(jù)定為國家戰(zhàn)略資產(chǎn)。但是,我國農(nóng)業(yè)領(lǐng)域能夠用于育種的數(shù)據(jù)卻很難支撐AI育種的需要——在數(shù)量和分布上,我國農(nóng)業(yè)數(shù)據(jù)分散在全國各地且共享困難;在質(zhì)量上,農(nóng)業(yè)數(shù)據(jù)的標(biāo)準(zhǔn)也很難統(tǒng)一,“數(shù)據(jù)格式、質(zhì)量標(biāo)準(zhǔn)混亂”。
這時(shí)候,建立一個(gè)底層數(shù)據(jù)體系,統(tǒng)一數(shù)據(jù)規(guī)范、數(shù)據(jù)標(biāo)準(zhǔn),為AI應(yīng)用奠定數(shù)據(jù)基礎(chǔ),就成為崖州灣國家實(shí)驗(yàn)室的當(dāng)務(wù)之急。
高質(zhì)量數(shù)據(jù)集的匯聚、共享和流動(dòng),奏響育種數(shù)據(jù)交響樂
在數(shù)據(jù)挑戰(zhàn)面前,崖州灣國家實(shí)驗(yàn)室選擇聯(lián)合華為,構(gòu)建面向下一代生物育種技術(shù)的AI數(shù)據(jù)湖基座。
要解決問題,先要更充分地認(rèn)識問題。
打造數(shù)據(jù)基座,首先必須對什么才是“好的數(shù)據(jù)”也即高質(zhì)量的數(shù)據(jù)集有統(tǒng)一的認(rèn)識。在崖州灣國家實(shí)驗(yàn)室與華為的合作中,雙方對數(shù)據(jù)構(gòu)建的目標(biāo)進(jìn)行了五級劃分,從符合FAIR原則(即可查找、可訪問、可互操作、可復(fù)用),到滿足通用模型,再到強(qiáng)化推理支撐,再到針對科學(xué)問題的數(shù)據(jù)集建立,最后到即插即用的統(tǒng)一數(shù)據(jù)集,一個(gè)數(shù)據(jù)基座的目標(biāo)體系或者說質(zhì)量控制體系就此構(gòu)建起來。
在這樣的“行動(dòng)綱領(lǐng)”引導(dǎo)下,基于OceanStor Pacific全閃分布式存儲,華為與崖州灣國家實(shí)驗(yàn)室共同打造起AI數(shù)據(jù)湖基座,匯集了過去分散在全國各地的農(nóng)業(yè)科研數(shù)據(jù)、國外公開數(shù)據(jù)、企業(yè)托管數(shù)據(jù)、學(xué)校自采集數(shù)據(jù)等,通過數(shù)據(jù)分類共享機(jī)制(分為對外公開、受限開放、內(nèi)部機(jī)密等級并設(shè)置安全策略)實(shí)現(xiàn)了數(shù)據(jù)的有序共享和流通,做到了全局文件系統(tǒng)的統(tǒng)一調(diào)度。
當(dāng)然,數(shù)據(jù)基座不僅僅是一個(gè)既有數(shù)據(jù)融通共享與利用的體系,在數(shù)據(jù)質(zhì)量源頭方面,雙方還制定了統(tǒng)一的農(nóng)業(yè)數(shù)據(jù)采集標(biāo)準(zhǔn),讓分散在各地的育種數(shù)據(jù)有了“通用語言”,不管是來自實(shí)驗(yàn)室還是田間,各種數(shù)據(jù)都能無縫納入AI 數(shù)據(jù)湖。
![]()
在這樣的數(shù)據(jù)基座支撐下,農(nóng)業(yè)數(shù)據(jù)“散、亂、差”的痛點(diǎn)得到解決,全國育種數(shù)據(jù)可視、可管和有序共享,面向育種的高質(zhì)量語料庫建立起來,原本難以共享的數(shù)據(jù)資源也能夠成為可復(fù)用、可流轉(zhuǎn)的“國家戰(zhàn)略資產(chǎn)”。
最終,在智能融合、數(shù)據(jù)全域流通下,農(nóng)業(yè)數(shù)據(jù)分散式、數(shù)據(jù)割裂難利用的情況被徹底改變,實(shí)現(xiàn)全局?jǐn)?shù)據(jù)統(tǒng)一目錄,EB級數(shù)據(jù)秒級檢索,隨時(shí)隨地按需共享等。崖州灣國家實(shí)驗(yàn)室智慧育種成功打造了國家級精準(zhǔn)育種技術(shù)體系,支撐起一個(gè)總部+5個(gè)基地+N個(gè)分支、超1000科學(xué)家的育種體系。
從試驗(yàn)田到數(shù)據(jù)基座,將育種革命進(jìn)行到底
一旦數(shù)據(jù)基座建立,AI育種的工作也開始加速推進(jìn)。
例如崖州灣國家實(shí)驗(yàn)室還打造了基于Nexent的農(nóng)業(yè)AI工具社區(qū),智能體系統(tǒng)和數(shù)據(jù)系統(tǒng)打通,實(shí)現(xiàn)數(shù)據(jù)自動(dòng)推薦和智能體自主交互。
AI數(shù)據(jù)湖高效支撐各類育種AI工具的運(yùn)行,科研工作者不再像過去那樣必須費(fèi)勁找到“指定數(shù)據(jù)”才能開展工作。在崖州灣國家實(shí)驗(yàn)室的期望中,未來與華為深入合作,要構(gòu)建起一個(gè)基于多智能體的AI科學(xué)家系統(tǒng)或AI育種系統(tǒng),去服務(wù)農(nóng)業(yè)科學(xué)家群體以及企業(yè)群體。
從這個(gè)意義上看,當(dāng)AI數(shù)據(jù)基座建設(shè)起來,數(shù)據(jù)問題的解決只是一個(gè)開端,更重要的是傳統(tǒng)育種工作模式的改變。
本質(zhì)上,華為AI數(shù)據(jù)湖并非孤立的技術(shù)產(chǎn)品,它與農(nóng)業(yè)智能體系統(tǒng)、育種工具平臺深度融合,做到了“數(shù)據(jù)采集-分析-決策-執(zhí)行”的閉環(huán)。
過去,提到育種,很多人腦海第一印象可能是田間地頭的“泥腿子”奔波。但當(dāng)下及以后的育種工作,更可以是完全現(xiàn)代化的工作范式——科研人員通過 VR 眼鏡、無人機(jī)等前端設(shè)備獲取田間信息,數(shù)據(jù)實(shí)時(shí)傳入 AI 數(shù)據(jù)湖,經(jīng)過 AI 分析后生成的育種決策,能直接下發(fā)給機(jī)器狗、智能農(nóng)機(jī)執(zhí)行,讓傳統(tǒng)“靠天吃飯、憑眼判斷”的育種模式升級為精準(zhǔn)可控的智慧育種。
![]()
由此可見,華為AI數(shù)據(jù)湖與生物育種的結(jié)合,看似是技術(shù)層面的創(chuàng)新,實(shí)則是AI普惠、科技服務(wù)國計(jì)民生的一次深入實(shí)踐。它用數(shù)據(jù)打通了科技與農(nóng)業(yè)的“最后一公里”,讓AI不再是實(shí)驗(yàn)室里的“高精尖”,而是扎根田野、服務(wù)民生的“好幫手”。
未來,隨著這一數(shù)據(jù)基座的不斷完善,有理由相信,中國育種行業(yè)將加速突破代差,培育出更多適應(yīng)環(huán)境、高產(chǎn)優(yōu)質(zhì)的農(nóng)業(yè)品種。
*本文圖片均來源于網(wǎng)絡(luò)
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.