網易首頁 > 網易號 > 正文申請入駐

“書生”大模型獲全國數學奧賽第三名，這道題的解法突破人類思路局限

2025-12-12 19:46:40　來源: 新浪財經

河北舉報

分享至

來源：滾動播報

（來源：上觀新聞）

記者今天從上海人工智能實驗室獲悉，在2025年全國中學生數學奧林匹克競賽中，實驗室研發的“書生”科學多模態大模型（Intern-S1）獲得102 分（滿分 126 分），在人類選手中排名第三，在參賽的三個國內頂尖大模型中位列第一。閱卷專家認為，Intern-S1的答題表達方式非常接近人類，其中對第四題的解答是一個新的解法，十分巧妙，在參賽學生的解法中沒有見過。這意味著，大模型能突破人類解數學題的思路局限，有望幫助人類取得新的科學發現。

據悉，今年全國中學生數學奧賽首次開展人工智能測試，三個大模型參與，與人類選手在相同時間（4.5小時）內完成答題，并由官方組織以相同標準進行閱卷評分。參與大模型訓練項目的中國人民大學附屬中學老師、奧數教練張端陽說：“Intern-S1能取得這樣的成績，遠超我的預期，徹底改變了我對當前大模型數學能力上限的看法。”上海人工智能實驗室青年領軍科學家陳愷認為，數學奧賽迎來了“AlphaGo時刻”，顯示出人工智能在高難度代數、幾何、數論、組合數學證明題領域的巨大潛力。

中國數學會發布的2025年全國中學生數學奧林匹克競賽AI測試結果簡報

陳愷介紹，全國中學生數學奧賽加試部分的題型均為證明題，需要很長的推理鏈路，對大模型的推理能力提出了考驗。為此，他帶領團隊基于“通專融合”技術架構 SAGE（智者），開發了以數學引理為核心的多輪分層推理機制、基于結果的過程校驗模型，經過強化學習，讓通用大模型擁有了像數學家一樣逐步推導、探索和修正的思路，在做證明題時能保持長程推理的嚴謹性。為了讓大模型做好幾何證明題，科研團隊采用“通用大模型+專業符號引擎”方案，通過遠少于谷歌AlphaGeometry2模型的訓練量，就取得了很好效果。

2016年，AlphaGo與李世石對弈中下出“神之一手”，完全出乎九段職業棋手的意料。與之相仿，“書生”科學多模態大模型在數學奧賽第四題中，給出了讓閱卷專家嘖嘖稱奇的解答。

這道題目屬于組合數學：有30種顏色的紙牌，每種顏色的紙牌均有70張。開始時從這些紙牌中任意選取70張，并從上至下擺成一疊。接著進行如下操作：從最下方20張紙牌中選擇一張紙牌X，滿足其顏色在最上方50張紙牌中從未出現；再從最上方50張紙牌中選擇一張紙牌Y，滿足其顏色在最上方50張紙牌中至少出現兩次；從這疊紙牌中抽出X并將其緊貼著Y的上方放回這疊紙牌中。稱上述過程為一次操作。重復上述操作直至無法選取這樣的紙牌X時，整個操作過程結束。（1）證明：對所有可能的初始情況及操作方式，整個操作過程都會在有限次操作后結束；（2）在所有可能的初始情況及操作方式中，求操作次數的最大可能值。

面對這道“燒腦”題，“書生”展示了正確且清晰的解題思路。閱卷專家認為，“書生”提供了“一個新的解法，巧妙的調整法，結合了幾種觀察到的東西，在參賽學生的解法中沒有見過”。它體現出大模型已具備理解復雜概念、進行創造性推理、發現精妙解法的能力，并在表達邏輯方面，有很強的嚴謹性。

Intern-S1對第四題第一問的解答

Intern-S1對第四題第二問的解答

“書生”的巧妙解題，印證了上海人工智能實驗室訓練大模型路徑的可行性。“當AI系統的強大算力和人類的頂層規劃設計結合后，它確實能突破傳統‘刷題’的瓶頸，展現出接近人類高手的解題素養。”張端陽說。

未來，上海人工智能實驗室將把Intern-S1的長程推理能力拓展應用于物理、化學、生命科學等基礎研究領域，通過與專業工具融合，讓大模型從“長時間獨立思考”向“長時間獨立科研”轉變，從而加速各領域科研范式的根本性變革，為科學新發現提供重要支撐。

原標題：《“書生”大模型獲全國數學奧賽第三名，這道題的解法突破人類思路局限》

欄目主編：黃海華

來源：作者：解放日報俞陶然

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.