《科學(xué)革命的結(jié)構(gòu)》一書認(rèn)為,范式是科學(xué)研究的方法論,而范式的突破則會(huì)帶來(lái)一系列科學(xué)革命。
今天,科學(xué)研究又站在一個(gè)關(guān)鍵的歷史節(jié)點(diǎn):當(dāng)算力、數(shù)據(jù)、AI大模型等技術(shù)快速交織發(fā)展之際,人工智能正推動(dòng)科研范式加速?gòu)臄?shù)值模擬、大數(shù)據(jù)分析向科學(xué)智能(AI for Science,以下簡(jiǎn)稱AI4S)演進(jìn),這標(biāo)志著科學(xué)研究的基本方式和邏輯體系將迎來(lái)全面重塑。
在此背景下,如何支撐起科研范式快速、高效地演進(jìn),就成為當(dāng)下科學(xué)界與產(chǎn)業(yè)界的焦點(diǎn)。近日,中科曙光正式發(fā)布國(guó)內(nèi)首個(gè)科學(xué)大模型一站式開發(fā)平臺(tái)OneScience,成功填補(bǔ)產(chǎn)業(yè)發(fā)展的空白,并大膽提出用“三小時(shí)開發(fā)一個(gè)模型”,助力科研人員叩響智能時(shí)代科研探索的大門。
正如中科曙光高性能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理李柳所言:“OneScience平臺(tái)的核心思路是解決目前科研領(lǐng)域所面臨的各種共性問(wèn)題,通過(guò)將數(shù)據(jù)、模型乃至知識(shí)、經(jīng)驗(yàn)打包到OneScience平臺(tái)之中,從而提升科研人員的科學(xué)模型研發(fā)效率、縮短研發(fā)周期和加快科研探索。”
![]()
中科曙光高性能計(jì)算產(chǎn)品事業(yè)部總經(jīng)理李柳
AI4S 的共性挑戰(zhàn)不容忽視
AI for Science是通過(guò)人工智能技術(shù)解決傳統(tǒng)科研難題、加速科學(xué)發(fā)現(xiàn)的新型研究范式。
《Nature》雜志的《AI for Science 2025》報(bào)告指出,現(xiàn)代科學(xué)研究所面臨的維度和復(fù)雜性挑戰(zhàn)巨大,是數(shù)值模擬、大數(shù)據(jù)分析等傳統(tǒng)科研范式很難有效應(yīng)對(duì)的;而借助深度學(xué)習(xí)、大模型等人工智能技術(shù),AI for Science將徹底重塑科研流程并加速科學(xué)發(fā)現(xiàn)。
AI for Science具備數(shù)據(jù)融合、模型融合、知識(shí)引導(dǎo)、科學(xué)實(shí)驗(yàn)與AI系統(tǒng)閉環(huán)等關(guān)鍵特征。這其中,科學(xué)大模型又至關(guān)重要。科學(xué)大模型通過(guò)不斷借鑒和應(yīng)用成熟的通用大模型,模型參數(shù)量持續(xù)增加,不僅帶來(lái)科研場(chǎng)景的效率與精度大幅提升之外,還能有效降低計(jì)算成本、研發(fā)周期,便于輔助科研人員發(fā)現(xiàn)科學(xué)內(nèi)的規(guī)律和科學(xué)智能體系的建立。
與此同時(shí),當(dāng)下科研大模型部署與應(yīng)用所面臨的共性挑戰(zhàn)也不容小覷。例如,科學(xué)數(shù)據(jù)是極其多樣化和碎片化的,如何為科學(xué)大模型建立起高質(zhì)量科研數(shù)據(jù)集尤為關(guān)鍵;另外,不少模型的訓(xùn)練機(jī)制、參數(shù)細(xì)節(jié)和優(yōu)化過(guò)程并不公開,導(dǎo)致科研人員在模型能力驗(yàn)證、獲取與選擇等面臨困難;加上開發(fā)工具鏈分散、軟件環(huán)境復(fù)雜,導(dǎo)致科學(xué)大模型在真實(shí)的科研場(chǎng)景中就像一輛陷入泥潭的跑車,空有一身本領(lǐng),卻難以盡情施展。
基于此,中科曙光推出OneScience,為科研人員帶來(lái)覆蓋全場(chǎng)景、全流程的統(tǒng)一科學(xué)大模型開發(fā)平臺(tái)。
“三小時(shí)一個(gè)大模型”成為可能
《科學(xué)智能全球發(fā)展觀察與展望》報(bào)告指出,AI for Science 正加速推動(dòng)科研從“作坊模式”加速走向“平臺(tái)模式”。
所謂“平臺(tái)模式”,并非要限制科研人員的創(chuàng)造力;相反,通過(guò)平臺(tái)的力量,科研人員不僅能從繁瑣的“體力勞動(dòng)”束縛中解放出來(lái),還能實(shí)現(xiàn)不同工具、科研人員之間的高效協(xié)同,在科學(xué)探索中充分發(fā)揮創(chuàng)造力;更能實(shí)現(xiàn)數(shù)據(jù)、資源的高效利用,甚至讓跨學(xué)科研究大幅前進(jìn)。
![]()
毫無(wú)疑問(wèn),中科曙光科學(xué)大模型一站式開發(fā)平臺(tái)OneScience就是科研“平臺(tái)模式”下的代表產(chǎn)品。它不僅可將零散模型與科研場(chǎng)景整合為統(tǒng)一科研智能平臺(tái),還能覆蓋多學(xué)科領(lǐng)域從模型訓(xùn)練到推理應(yīng)用的全流程,更可讓科研人員“開箱即用”,“一鍵”開啟科學(xué)大模型研發(fā)。
具體來(lái)看,OneScience目前支持多個(gè)領(lǐng)域、數(shù)十個(gè)科學(xué)熱點(diǎn)模型,并提供涵蓋單卡、單節(jié)點(diǎn)多卡以及多節(jié)點(diǎn)多卡訓(xùn)練等配置,以便于用戶進(jìn)行科學(xué)大模型性能優(yōu)化、參數(shù)調(diào)優(yōu)以及跨場(chǎng)景對(duì)比分析。其次,OneScience提供氣象與海洋預(yù)報(bào)、生命信息、材料化學(xué)等領(lǐng)域的高質(zhì)量、高擴(kuò)展的數(shù)據(jù)集,以及豐富的數(shù)據(jù)前處理工具和接口,為科研人員的大模型開發(fā)帶來(lái)極大便利;同時(shí),OneScience對(duì)國(guó)產(chǎn)算力進(jìn)行充分優(yōu)化,系統(tǒng)性地開展多個(gè)學(xué)科模型的訓(xùn)練與推理實(shí)踐,在國(guó)產(chǎn)算力下支持模型參數(shù)擴(kuò)展到10億級(jí)別以上;最后,OneScience集成了眾多主流的模型訓(xùn)練框架與工具,滿足科研人員在不同算力環(huán)境下高效構(gòu)建與優(yōu)化高性能模型的需求。
中科曙光OneScience平臺(tái)研發(fā)負(fù)責(zé)人劉東介紹,過(guò)去科學(xué)建模類似構(gòu)建一個(gè)自己風(fēng)格的房子,而OneScience則采用平臺(tái)化思路,為科研人員提供各種各樣的樣板間,模型、數(shù)據(jù)、訓(xùn)練方式等就像樣板間的不同家具與風(fēng)格,科研人員可根據(jù)自身需求快速封裝起來(lái),達(dá)到快速開發(fā)模型的效果。
據(jù)悉,科學(xué)大模型一站式開發(fā)平臺(tái)OneScience是基于曙光在科研高性能計(jì)算領(lǐng)域30年積累以及“AI計(jì)算開放架構(gòu)”理念打造而成的。曙光從2022年底即對(duì)AI4S建模等共性問(wèn)題開展研究,之后正式啟動(dòng)OneScience項(xiàng)目,并明確工程化路線和需要解決的挑戰(zhàn);直至當(dāng)下,OneScience已在AI4S工程化方面取得一系列進(jìn)展,讓科學(xué)大模型研發(fā)效率提升百倍,使得“三小時(shí)開發(fā)一個(gè)模型”成為可能。
OneScience平臺(tái)的出現(xiàn)對(duì)于科研領(lǐng)域意義重大。以生物制藥為例,一個(gè)傳統(tǒng)的新藥研發(fā)周期平均在10-15年,成本高達(dá)20億至30億美元。但當(dāng)AI深度介入后,這個(gè)周期曲線正在迅速拉平。李柳直言:“對(duì)于科研工作而言,將模型開發(fā)周期壓縮到3個(gè)小時(shí)具有重要意義,這意味著科研人員可以將更多時(shí)間、精力聚焦在科學(xué)探索上。”
事實(shí)上,中科曙光在打造OneScience過(guò)程中做了很多開創(chuàng)性工作。例如,科研領(lǐng)域當(dāng)下大部分熱點(diǎn)模型均是基于國(guó)外計(jì)算卡研發(fā)的,為確保熱點(diǎn)模型在國(guó)產(chǎn)算力平臺(tái)上復(fù)現(xiàn),中科曙光在模型對(duì)齊、模型效果、精度差異、問(wèn)題定位等方面克服了大量困難;同時(shí),中科曙光還對(duì)OneScience上科學(xué)建模做了全流程的驗(yàn)證,并做到科研領(lǐng)域的全面覆蓋。
繼續(xù),OneScience平臺(tái)接下來(lái)還將會(huì)探索接入智能體,讓智能體參與到OneScience的科學(xué)模型開發(fā)、調(diào)試與實(shí)驗(yàn)復(fù)現(xiàn)中來(lái),推動(dòng)科研開發(fā)過(guò)程走向智能化。
落在實(shí)處,OneScience走開放之路
如今,“開放”已經(jīng)成為中科曙光的核心戰(zhàn)略。同樣,OneScience平臺(tái)也將堅(jiān)定不移地走開放之路。
目前,OneScience平臺(tái)在國(guó)產(chǎn)GPU上的復(fù)現(xiàn)與優(yōu)化支持模型代碼,已可通過(guò)Github、Gitee、超算互聯(lián)網(wǎng)等多個(gè)社區(qū)平臺(tái)向業(yè)界開放下載。
除了代碼層面的開放之外,中科曙光還希望通過(guò)場(chǎng)景化方案的方式,來(lái)推動(dòng)曙光AI超集群、OneScience等平臺(tái)在科研領(lǐng)域的應(yīng)用。
![]()
例如,中科曙光本次還發(fā)布了“曙光AI超集群”場(chǎng)景化方案,通過(guò)縱向穿透、橫向聯(lián)通的貫通式優(yōu)化,實(shí)現(xiàn)從底層芯片、指令集到上層框架、應(yīng)用的整體優(yōu)化,去加速賦能科研探索工作。中科曙光智能計(jì)算產(chǎn)品事業(yè)部副總經(jīng)理胡曉東介紹:“AI4S領(lǐng)域面臨著數(shù)據(jù)海量、模型復(fù)雜、實(shí)時(shí)性要求高等挑戰(zhàn),利用AI超級(jí)群場(chǎng)景化方案可以快速、低成本的試錯(cuò)和探索,從根本上加速了科學(xué)發(fā)現(xiàn)的進(jìn)程。”
此外,中科曙光OneScience平臺(tái)已經(jīng)在超算互聯(lián)網(wǎng)上線,并迅速獲得眾多科研人員的高度認(rèn)可。國(guó)家高性能計(jì)算機(jī)工程技術(shù)研究中心總工程師劉冠川表示,“傳統(tǒng)HPC時(shí)代,科研使用的路徑比較清晰和固定。進(jìn)入到AI時(shí)代,AI技術(shù)不斷深入到科研場(chǎng)景之中,但AI大模型等正處于發(fā)展的‘動(dòng)蕩期’,AI工具、框架更新迭代快,科研人員非常需要一個(gè)平臺(tái)提供經(jīng)過(guò)驗(yàn)證、有效的AI技術(shù)。”
![]()
據(jù)悉,中科曙光未來(lái)還將吸納更多伙伴、用戶參與到OneScience的共建,不斷將科研領(lǐng)域的數(shù)據(jù)、知識(shí)、經(jīng)驗(yàn)融入其中。
綜合觀察
科研范式的每一次躍遷,都離不開工具的突破。AI for Science 所代表的科研新范式正開啟科學(xué)探索的新時(shí)代,而中科曙光的OneScience平臺(tái)就像是一位重要的“制器者”,它并不直接創(chuàng)造知識(shí),卻為科研人員鍛造出最趁手的工具,讓其在科學(xué)探索中勇攀高峰。
BREAK AWAY
01
02
03
04
05
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.