![]()
中國工程院院士、之江實驗室主任王堅
AI for Science(AI4S)再次迎來新突破。
最近,在杭州舉辦的021科學基礎模型創新合作大會上,浙江之江實驗室首次全面展示021科學基礎模型及系列領域科學模型研發的進展,包括全球首個百億級人類基因組基礎模型Genos。
021模型構筑形成跨學科知識、跨領域推理、跨語言理解(覆蓋204種語言)三大基石,具備出色的科學推理能力,能夠深入分析、推導、驗證多類科學問題。
“021”就是“從0到1”,其中包含著之江實驗室對科學基礎模型的理解和發展規劃。
在中國工程院院士、之江實驗室主任王堅看來,“如果基礎模型是人工智能的皇冠,那么科學基礎模型就是人工智能皇冠上的明珠。”
之江實驗室科學模型總體部技術總師薛貴榮認為,科學數據涵蓋時間、空間、能量等多個維度,是對復雜物理系統演變規律的高維表征。為解決科學問題,科學界需要突破語言空間的局限,研發科學基礎模型,構建“科學空間+語言空間”于一體的更高維空間,建立跨學科數據之間的深層連接,變革科學研究范式。
為此,之江實驗室研發團隊探索將科學數據和文本語料編碼到統一的高維空間,讓模型能夠識別、處理科學數據,認識并解決復雜科學問題。經過近萬次實驗,團隊形成了模型訓練框架,包括預訓練、后訓練、強化學習等,并完成了2360億參數規模的021科學基礎模型訓練。
021,不僅是“zero to one”的簡寫,也是AI正在從輔助科研轉向重構科研的符號。
在AI4S的道路上,之江實驗室通過與科學合作伙伴共同舉辦“種子班”來培養團隊,讓不同學科背景的人才聚集在一起,由專家級班主任帶領,共同碰撞創新,在實戰中完善、升級。截至目前,之江實驗室已累計舉辦22期種子班,培育了900余名緊缺型AI人才。
![]()
圖片來源:之江實驗室
這并不是021模型第一次落地,在本月正式發布前,其在諸多科學領域已有成果展示。
其中引人關注的,是生命科學領域的全球首個百億級人類基因組基礎模型Genos。
10月23日,之江實驗室與華大生命科學研究院在第二十屆國際基因組學大會上聯合發布并開源了這款大模型。該模型支持多達百萬堿基對的超長上下文分析,并實現單堿基分辨率的精準識別。
Genos整合了人類泛基因組參考聯盟(HPRC)和人類基因組結構變異圖譜計劃(HGSVC)等資源,基于636個“端粒到端粒”級別高質量人類基因組數據進行訓練,覆蓋全球不同人群。
Genos模型采用混合專家(MoE)架構,通過“按需激活”機制降低推理成本,在致病性突變解讀任務中準確率達92%,結合科學基礎模型后提升至98.3%。它提供12億和100億參數兩個版本,已在GitHub、Hugging Face及魔搭等平臺開源,并集成至DCS Cloud云平臺提供免費推理服務。
在地學領域,之江實驗室向全球開源了地球科學大模型GeoGPT。
該模型基于021科學基礎模型研發,目前已進行了數次迭代,支持圖像描述總結、圖像信息提取、地理空間推理、地學分析推理等典型任務,通過融合深時地球數據與智能算法,提升地學研究效率。
同時受到矚目的,還有之江實驗室聯合中國科學院國家天文臺研發的天文領域科學大模型OneAstronomy。
該模型同樣基于021基礎模型打造,能夠實現跨模態融合推理,重構數據處理范式,釋放望遠鏡自主觀測潛力,推動實現“觀測即發現”,今年9月被列為全球科技公共產品,服務于開放科學行動。
此外,在材料學領域,021打造出了多孔合金材料模型OnePorous,可根據材料性能需求,逆向生成新型多孔結構,目前已應用于3D打印衛星主體結構制造。
事實上,自去年諾貝爾化學獎和物理學獎,均授予了與AI密切相關的研究者后,AI4S就已被普遍認為是AI大模型的又一進階之路。
各大高校和科研院所對AI4S探索步伐加速的同時,政策也在持續加碼。其中引人關注的是,今年11月,美國總統特朗普還曾簽署行政令啟動AI“創世紀計劃”。該計劃試圖利用人工智能變革科學研究方式、加速科學發現,生物技術、關鍵材料、先進制造業等均是重點領域。
不止于學術界,包括谷歌、微軟、Meta等全球科技巨頭,也在這一領域進行了重點布局。其中,谷歌DeepMind的Alpha系列大模型一直被視為領軍者,該模型近年來在蛋白質結構預測方面的突出表現,已成為了AI4S的典型案例。
不過,目前大模型對科研領域的助力,覆蓋范圍還有所局限。在這一方向上,人才、科學數據的搜集整合、不同前沿學科的交融等問題亟待解決,并且極度缺少既往成功經驗和案例可參考。某種程度上,這更凸顯了打造新的基礎科學大模型的重要性,這也正是021科學基礎模型被開發及面世的意義。(作者|胡珈萌,編輯|李程程)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.