網易首頁 > 網易號 > 正文申請入駐

上海“書生”大模型奧數高分奪金，解法“前所未見”讓閱卷專家驚嘆

2025-12-13 06:04:49　來源: 新浪財經

天津舉報

分享至

來源：滾動播報

（來源：上觀新聞）

數學奧賽猶如智慧皇冠上的明珠，是頂尖智力的競技，也一度成為人工智能（AI）難以攻克的高地。在近日揭曉的全國中學生數學奧林匹克競賽（CMO）決賽中，由上海人工智能實驗室（上海AI實驗室）研發的“書生”科學多模態大模型（Intern-S1）斬獲102分的高分，不僅遠超78分的金牌分數線，更跨過了87分的國家集訓隊入選線，位列大模型得分榜首。

這一突破標志著國產大模型在復雜邏輯推理方面邁出關鍵一步。上海AI實驗室青年領軍科學家陳愷認為，數學奧賽終于迎來“AlphaGo時刻”，顯示出人工智能在高難度代數、幾何、數論、組合數學證明題領域的巨大潛力。

從“做對題”邁向“創造性解題”

CMO是中國最高規格的高中生數學奧林匹克競賽，難度不亞于國際數學奧林匹克競賽（IMO），試題以條件隱蔽、邏輯鏈條極長等著稱，且所有題型均為證明題，相比解答題，對AI的挑戰要大得多。本次CMO決賽的700多名參賽者中，首次納入AI模型，堪稱一場史無前例的“人機同考”，雙方面臨的是相同的時長和閱卷標準。

最終，“書生”大模型展現出了驚人的思維能力。在全部6題中，有4題獲得滿分21分，另兩題則因為“未證明最優性”“部分不嚴格”而分別得到9分。閱卷專家驚嘆其表達方式“非常接近人類”。

最震撼的是其中第4題的解答，這是一道涉及30種顏色、2100張紙牌操作的復雜組合題。“書生”模型不僅在規定時間內得出了正確結論，其解題思路被專家評價為“一個新的解法，巧妙的調整法，在學生的解法中沒有見過”。

未曾見過的解法，對AI來說，意味著它絕非“知識的搬運工”，而是可以突破人類思維局限，從“做對題”邁向“創造性解題”。而這一點，哪怕是對人類參賽者而言，這也是一個了不起的成就。

對于此次“書生”大模型的突破，第50屆國際數學奧林匹克競賽金牌選手鄭凡表示，這徹底改變了他對當前大模型數學能力上限的看法，未來大模型有望成為一名真正的“研究伙伴”，和人類攜手探索數學，乃至更廣闊的科學疆域。

“通專融合”走出“第三條路”

“書生”模型之所以能取得如此突破，關鍵在于它采用了上海AI實驗室提出的“通專融合”技術架構。

當前，全球圍繞科研領域的AI競賽存在兩條主要技術路線：一條是“專業派”，以谷歌AlphaProof為代表，核心是基于形式化語言的專業模型，其推理過程絕對嚴謹，但泛化性差、效率低；另一條是“通用派”，主要采用基于自然語言的通用模型，泛化性強，但容易產生幻覺，難以保證推理的嚴謹性。

“書生”走出了獨特的“第三條路”。據項目團隊介紹，該模型通過多項核心技術創新，實現了“通專融合”，使得通用模型也具備進行超長程的嚴謹推理能力。

首先是以數學引理為核心的多輪分層推理機制。面對高難度數學問題，大模型像數學家一樣將復雜推理拆解為一個個可復用的“引理模塊”，通過多種模型的分工協作，突破了單次上下文長度限制，實現了分階段探索與校驗。

二是基于結果的過程校驗。針對AI在進行長鏈條推理時容易出錯的痛點，科研人員引入了高密度的監督機制，顯著提升了證明過程的嚴謹性。

三是將通用模型與專業符號引擎結合，使AI兼具“發散性思維”和精確嚴謹，使其能像人類科學家一樣逐步推導、試錯和修正。

值得一提的是，上海AI實驗室的這一技術路線已展現出極高的數據效率。相比于谷歌的幾何模型AlphaGeometry2，“書生”僅需不到萬分之一的訓練樣本就實現了超越，擺脫了對超大規模合成數據的依賴。

上海AI實驗室主任、首席科學家周伯文

AI接連攻克基礎科學堡壘

此次在數學奧賽中取得佳績，并非上海AI實驗室在科學領域的“首金”。就在上個月，該實驗室的AI模型同樣經受了2025年國際物理奧賽（IPhO）的考驗，并拿下金牌，成為首個也是唯一獲得金牌的開源模型。接連攻克兩座基礎科學的“堡壘”，某種意義上標志著AI正從單一任務的求解者，逐漸向具備跨學科能力的“全能科學家”演進。

當前，全球科技巨頭都在競相布局AI for Science（人工智能驅動的科學研究），但往往受困于無法突破“長程思考”的瓶頸。上海AI實驗室的探索證明，“通專融合”在賦能多領域科研方面的技術可行性。

正如上海AI實驗室主任、首席科學家周伯文所說，AI for Science應當在未來邁向AGI（通用人工智能） for Science，這意味著需要從純粹依賴自然語言，走向自然語言與符號語言等多種表示形式的融合。“書生”模型正是這一理念的體現。

當前，不少科學領域都積累了許多專業工具和計算引擎。一旦AI模型能夠展現出足夠的泛化能力，那么采取“通專融合”的路線，疊加相關學科領域的專業工具，AI有望快速達到該領域專家水平。

據上海AI實驗室透露，他們計劃將“書生”模型的長程推理能力，拓展至物理、化學、生命科學等更廣泛的基礎科研領域，不斷推進“長時間獨立思考”，甚至是“長時間獨立科研”，從而加速各領域科研范式的根本性變革，為重大科學突破提供關鍵支撐，賦能未來的科學發現進程。

原標題：《上海“書生”大模型奧數高分奪金，解法“前所未見”讓閱卷專家驚嘆》

欄目主編：任荃

來源：作者：文匯報張懿

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.