來源:滾動播報
(來源:上觀新聞)
![]()
![]()
記者今天從上海人工智能實驗室獲悉,在2025年全國中學生數學奧林匹克競賽中,實驗室研發的“書生”科學多模態大模型(Intern-S1)獲得102 分(滿分 126 分),在人類選手中排名第三,在參賽的三個國內頂尖大模型中位列第一。閱卷專家認為,Intern-S1的答題表達方式非常接近人類,其中對第四題的解答是一個新的解法,十分巧妙,在參賽學生的解法中沒有見過。這意味著,大模型能突破人類解數學題的思路局限,有望幫助人類取得新的科學發現。
據悉,今年全國中學生數學奧賽首次開展人工智能測試,三個大模型參與,與人類選手在相同時間(4.5小時)內完成答題,并由官方組織以相同標準進行閱卷評分。參與大模型訓練項目的中國人民大學附屬中學老師、奧數教練張端陽說:“Intern-S1能取得這樣的成績,遠超我的預期,徹底改變了我對當前大模型數學能力上限的看法。”上海人工智能實驗室青年領軍科學家陳愷認為,數學奧賽迎來了“AlphaGo時刻”,顯示出人工智能在高難度代數、幾何、數論、組合數學證明題領域的巨大潛力。
![]()
中國數學會發布的2025年全國中學生數學奧林匹克競賽AI測試結果簡報
陳愷介紹,全國中學生數學奧賽加試部分的題型均為證明題,需要很長的推理鏈路,對大模型的推理能力提出了考驗。為此,他帶領團隊基于“通專融合”技術架構 SAGE(智者),開發了以數學引理為核心的多輪分層推理機制、基于結果的過程校驗模型,經過強化學習,讓通用大模型擁有了像數學家一樣逐步推導、探索和修正的思路,在做證明題時能保持長程推理的嚴謹性。為了讓大模型做好幾何證明題,科研團隊采用“通用大模型+專業符號引擎”方案,通過遠少于谷歌AlphaGeometry2模型的訓練量,就取得了很好效果。
2016年,AlphaGo與李世石對弈中下出“神之一手”,完全出乎九段職業棋手的意料。與之相仿,“書生”科學多模態大模型在數學奧賽第四題中,給出了讓閱卷專家嘖嘖稱奇的解答。
這道題目屬于組合數學:有30種顏色的紙牌,每種顏色的紙牌均有70張。開始時從這些紙牌中任意選取70張,并從上至下擺成一疊。接著進行如下操作:從最下方20張紙牌中選擇一張紙牌X,滿足其顏色在最上方50張紙牌中從未出現;再從最上方50張紙牌中選擇一張紙牌Y,滿足其顏色在最上方50張紙牌中至少出現兩次;從這疊紙牌中抽出X并將其緊貼著Y的上方放回這疊紙牌中。稱上述過程為一次操作。重復上述操作直至無法選取這樣的紙牌X時,整個操作過程結束。(1)證明:對所有可能的初始情況及操作方式,整個操作過程都會在有限次操作后結束;(2)在所有可能的初始情況及操作方式中,求操作次數的最大可能值。
面對這道“燒腦”題,“書生”展示了正確且清晰的解題思路。閱卷專家認為,“書生”提供了“一個新的解法,巧妙的調整法,結合了幾種觀察到的東西,在參賽學生的解法中沒有見過”。它體現出大模型已具備理解復雜概念、進行創造性推理、發現精妙解法的能力,并在表達邏輯方面,有很強的嚴謹性。
![]()
Intern-S1對第四題第一問的解答
![]()
Intern-S1對第四題第二問的解答
“書生”的巧妙解題,印證了上海人工智能實驗室訓練大模型路徑的可行性。“當AI系統的強大算力和人類的頂層規劃設計結合后,它確實能突破傳統‘刷題’的瓶頸,展現出接近人類高手的解題素養。”張端陽說。
未來,上海人工智能實驗室將把Intern-S1的長程推理能力拓展應用于物理、化學、生命科學等基礎研究領域,通過與專業工具融合,讓大模型從“長時間獨立思考”向“長時間獨立科研”轉變,從而加速各領域科研范式的根本性變革,為科學新發現提供重要支撐。
原標題:《“書生”大模型獲全國數學奧賽第三名,這道題的解法突破人類思路局限》
欄目主編:黃海華
來源:作者:解放日報 俞陶然
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.