![]()
編輯|澤南
從此以后,AI 不再是工具,要尊稱為「硅基博學家」了。
北京時間周五凌晨,谷歌發布了 Gemini 3 Deep Think 的重大升級,作為專門用于復雜任務的推理模式,Deep Think 代表 AI 前沿的最強智能水平,旨在解決科學、工程領域的諸多挑戰。
![]()
去年 9 月加入 Google DeepMind 的清華物理系傳奇姚順宇(Shunyu Yao)也是這次 Deep Think 新模型的參與者。
![]()
去年,谷歌展示了專門開發的 Deep Think 版本能夠成功應對一些最棘手的推理挑戰,并在數學和編程世界錦標賽上取得了金牌成績。最近,Deep Think 又使專門開發的智能體能夠進行研究級別的數學探索。
更新后的深度思考模式繼續拓展智能的邊界,在最嚴格的學術基準測試中取得了新的高度,其中包括:
- 在「人類的最后考試」(一項旨在測試現代前沿模型極限的基準測試)中,該模型取得了新的 SOTA(48.4%,不使用任何工具)。
- 在 ARC-AGI-2 測試中取得了前所未有的 84.6% 的成績,并經 ARC Prize 基金會驗證。
- 在 Codeforces 上取得了驚人的 3455 Elo 分數,Codeforces 是一個包含各種競技編程挑戰的基準測試平臺。
- 在 2025 年國際數學奧林匹克競賽中取得金牌水平。
![]()
新版 Gemini 3 Deep Think 在 ARC-AGI-1 上的成績是 96.0%,每任務花費 7.17 美元;在 ARC-AGI-2 上已經達到了 84.6% 的分數,每任務成本為 13.62 美元。
![]()
大約 14 個月前,OpenAI 模型 o3-preview 的「高計算」版本在 ARC-AGI-1 測試中達到了約 88% 的分數,每個任務的成本約為 2000 至 3000 美元。而 Gemini 3 Deep Think 的每任務成本僅為 7.17 美元,成本降低了約 280 至 420 倍。
這意味著我們現在需要再次為 AI 準備更復雜的測試題了。
除了數學和編程競賽之外,Gemini 3 Deep Think 現在在化學和物理等廣泛的科學領域也表現出色。更新后的 Deep Think 模式在 2025 年國際物理奧林匹克競賽和化學奧林匹克競賽的筆試部分取得了金牌級別的成績。它還展現了在高等理論物理方面的能力,在 CMT-Benchmark 測試中取得了 50.5% 的分數。
![]()
還有這個在 Codeforces 上獲得的 3455 分,Gemini 3 Deep Think 已經相當于世界排名第八的頂尖競技程序員的水平。之前的最佳成績是來自一年多以前 OpenAI o3 的 2727 分,排名第 175。
地球上只有 7 個人能在編程比賽中擊敗 Gemini 3 Deep Think。
![]()
對于 AI 和整個科技領域而言,這是一個以往難以想象的成果。
谷歌與科學家和研究人員緊密合作,對 Gemini 3 Deep Think 進行了升級。Deep Think 將深厚的科學知識與日常工程實踐相結合,超越了抽象理論,推動了實際應用。
借助更新后的 Deep Think,你可以將草圖轉化為可 3D 打印的實體模型。Deep Think 會分析圖紙,對復雜形狀進行建模,并生成用于 3D 打印的實體文件。

谷歌展示了一些早期測試用戶使用最新版 Deep Think 的成果:
羅格斯大學的數學家 Lisa Carbone 致力于研究高能物理學界所需的數學結構,以彌合愛因斯坦引力理論和量子力學之間的鴻溝。由于該領域缺乏大量的訓練數據,她利用 Deep Think 技術審閱了一篇高度專業的數學論文。Deep Think 成功地識別出了一個細微的邏輯缺陷,而這個缺陷此前在人工同行評審中均未被發現。
![]()
在杜克大學,Haozhe "Harry" Wang 帶領的實驗室利用 Deep Think 技術優化了復雜晶體生長的制備方法,以期發現新的半導體材料。Deep Think 成功設計了一種能夠生長厚度大于 100 微米薄膜的工藝,達到了以往方法難以企及的精確目標。
![]()
或許隨著更多人的使用,我們不久之后能夠基于 Gemini 3 Deep Think 實現更多科研突破。
全新 Deep Think 現已在 Gemini 應用中上線,目前 Google AI Ultra 訂閱用戶可以使用。此外,谷歌首次通過 Gemini API 向部分研究人員、工程師和企業開放 Deep Think 的使用權限。
參考內容:
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-deep-think/
https://x.com/shaneguML/status/2021999801911718029
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.