![]()
![]()
一兩年前,連高考數學都及格不了的大模型,如今已經能在數學奧賽里睥睨群雄了!
不久前,在全國中學生數學奧林匹克競賽(CMO)決賽中,由上海人工智能實驗室研發的“書生”科學多模態大模型(Intern-S1)獲得了102分(滿分126分)的高分,不僅遠超78分的金牌分數線,更“一腳邁過”國家集訓隊入選線87分。
有閱卷專家評價:“答案表達方式非常接近人類”,其中對第四題的解答是“一個新的解法,巧妙的調整法,在學生的解法中沒有見過”。
上海AI實驗室青年領軍科學家陳愷認為,數學奧賽迎來了“AlphaGo時刻”,顯示出AI在高難度代數、幾何、數論、組合數學證明題領域的巨大潛力。
![]()
“在學生的解法中沒有見過”
全國中學生數學奧林匹克競賽是我國最高規格的高中生數學奧林匹克競賽,其題目難度往往不亞于國際數學奧林匹克競賽。
今年,主辦方首次設置了賽題AI測試,邀請三家大模型參與,與人類選手在相同時長內完成答題,并由官方組織以相同標準進行閱卷評分。
新民晚報記者獲悉,全國中學生數學奧林匹克競賽試題覆蓋代數、幾何、數論、組合四個板塊,試題往往具有條件隱蔽、邏輯鏈條長、需跨知識點整合等特點,需要答題者對數學概念有深刻理解,并能創造性地進行應用。有奧賽金牌教練直言不諱:“想獲得好名次,四個板塊不能有短板,而且要有板塊比較突出。”
在全部六道題目中,“書生”在其中4道“全對”,各得21分;另2題中,一題“未證明最優性”,一題“證明不夠嚴格”,各得9分。
最令人稱贊的,是“書生”在第四題上的表現。這道題涉及30種顏色、共2100 張紙牌,題目要求的操作極其復雜。“書生”在規定時長內不僅得出了正確的結論,還展示了清晰的回答思路。
【相關閱讀】有30種顏色的紙牌,每種顏色的紙牌均有70張。開始時從這些紙牌中任意選取70張,并從上至下擺成一疊。接著進行如下操作:從最下方20張紙牌中選擇一張紙牌 X,滿足其顏色在最上方50張紙牌中從未出現;再從最上方50張紙牌中選擇一張紙牌Y,滿足其顏色在最上方50張紙牌中至少出現兩次;從這疊紙牌中抽出X并將其緊貼著Y的上方放回這疊紙牌中。稱上述過程為一次操作。重復上述操作直至無法選取這樣的紙牌X時,整個操作過程結束。
(1)證明:對所有可能的初始情況及操作方式,整個操作過程都會在有限次操作后結束;
(2)在所有可能的初始情況及操作方式中,求操作次數的最大可能值。
![]()
閱卷專家點評說,“一個新的解法,巧妙的調整法,在學生的解法中沒有見過”。在陳愷看來,這說明“書生”已能突破人類解題思路局限,通過自主探索和分析找到新的解題方法,為進一步賦能科學發現夯實了技術基礎。
作為本次AI大模型數學顧問的第50屆國際數學奧林匹克競賽金牌選手鄭凡感慨:“未來,希望大模型能成為一名真正的‘研究伙伴’,攜手探索數學,乃至更廣闊科學邊疆。”
從“長時間獨立思考”邁向“長時間獨立科研”
“書生”的驚艷表現,讓不少“奧賽專業戶”震驚:“就像10年前的圍棋一樣,突破可能就是一剎那。”
記者獲悉,Intern-S1的表達邏輯與推理能力大幅提升,得益于AI與數學研究者的共同努力。
“基于實驗室提出的通專融合技術架構SAGE,Intern-S1模型重點突破了技術框架中融合協同層的技術,成功實現超長程嚴謹推理。”陳愷介紹。
![]()
要知道,高難度數學問題所需的推理復雜度,遠遠超過大模型在單次推理過程中所能探索的范圍。對此,上海AI實驗室的科研人員提出了多輪分層推理機制,基于通用推理模型和專業校驗模型構建了具備推理、總結和驗證智能體的多智能體系統,通過多模型分工協作實現了分階段推理和探索。
同時,科研人員提出了以數學引理為核心的緊湊記憶形式,將復雜推理過程拆解為可復用、可積累的引理模塊,讓模型的思考推理過程不再受限于單次上下文長度,從而能夠探索和發現更多的數學性質,并基于觀察提出一些人類沒有發現過的解決思路。
此外,創新性地提出了基于結果的過程校驗模型,顯著提升了模型在超長程思考和證明時的嚴謹性——這使得使得通專融合模型在“奧賽”級別的難題中,能產生“表達方式非常接近人類”的解答,最終通過閱卷專家嚴苛的閱卷標準。
值得一提的是,此前,上海AI實驗室的P1物理推理模型,在2025年國際物理奧林匹克大賽上拿下金牌,成為首個也是唯一獲得金牌的開源模型。
【相關閱讀】AI喜提物理奧賽金牌!來自上海的P1模型,如何開啟“封神”之路?
接連在兩大“奧賽”上摘金,上海AI實驗室透露, 計劃將Intern-S1的長程推理能力拓展應用于物理、化學、生命科學等基礎科研領域,通過與專業工具的打通與融合,實現從“長時間獨立思考”向“長時間獨立科研”轉變,進而加速各領域科研范式的根本性變革,為重大科學突破提供關鍵支撐,賦能未來的科學發現進程。
原標題:《高分奪金,遠超國家集訓隊入選線!“書生”大模型在奧賽:解法學生中沒見過!》
欄目編輯:王蔚
本文作者:新民晚報 郜陽
題圖來源:東方IC
圖片來源:上海AI實驗室
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.