IT之家 2 月 13 日消息,谷歌昨晚宣布對 Gemini 3 Deep Think 進行重大升級,號稱是專門針對科學、研究與工程場景的開發的“推理模式”,旨在推動智能前沿發展。
據介紹,新版 Deep Think 由谷歌開發人員與各行業科學家、研究人員共同合作完成,目標是應對真實科研環境中的常見復雜問題:缺少清晰邊界、未必存在唯一解,且數據往往雜亂或不完整。
![]()
此次升級的一個關鍵變化是,Deep Think 的可用范圍進一步擴大。谷歌稱,更新后的 Deep Think 從當地時間 2 月 12 日起在 Gemini 應用中向 Google AI Ultra 訂閱用戶開放。
IT之家注意到,谷歌首次將 Deep Think 通過 Gemini API 提供給部分研究人員、工程師與企業,采用“早期訪問計劃”的方式推進,并開放了申請入口以招募意向用戶。
在能力表現方面,谷歌強調新版 Deep Think 在數學、算法與編程等高難推理任務上繼續提升。該模式在不使用工具的情況下,在終極人類考試(Humanity's Last Exam)上取得 48.4% 的成績;在 ARC-AGI-2 上達到 84.6%,并由 ARC Prize Foundation 驗證;在 Codeforces 競賽編程基準上獲得 3455 的 Elo;并在 2025 年國際數學奧林匹克競賽(IMO 2025)上達到金牌水平表現。
除數學與編程之外,谷歌還強調新版 Deep Think 在化學、物理等科學領域同樣具備更強能力。官方稱,該模式在 2025 年國際物理奧林匹克與國際化學奧林匹克的筆試部分取得金牌級結果,同時在理論物理相關的 CMT-Benchmark 上獲得 50.5% 的得分。
谷歌表示,Deep Think 的目標不僅是追求基準測試成績,還希望推動實際工程與科研應用,例如幫助研究人員解釋復雜數據、幫助工程師通過代碼對物理系統進行建模。谷歌稱,未來將持續把 Deep Think 帶到研究人員和實踐者“最需要的地方”,而通過 Gemini API 開放早期訪問被視為重要一步。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.