Google在持續擴展 Gemini 3 模型家族的基礎上,正式發布全新的 Gemini 3 Deep Think 模式,這一模式在 Gemini 3 Pro 之上投入了更多算力并引入新技術,旨在在復雜數學、科學與邏輯推理任務上提供更高水平的表現。
目前,Deep Think 已面向所有 Google AI Ultra 訂閱用戶開放,可在 Gemini 應用中通過在提示欄選擇 Gemini 3 Pro 模型并切換至“Deep Think”模式直接使用。
![]()
據介紹,Gemini 3 Deep Think 在多項業內高難度基準測試中取得了“業界領先”的成績。它在被視為當前最難 AI 推理測評之一的 Humanity’s Last Exam 上取得了 41% 的得分,在 ARC-AGI-2 測試中借助代碼執行拿下 45.1% 的成績,而在 GPQA Diamond 科學知識測試中則獲得了 93.8% 的高分,均被標注為“最先進水平”。 Google表示,這一模式依托“高級并行推理”能力,可以同時探索多種假設路徑,從而在復雜問題求解中大幅提升準確率和穩健性。
在實際競賽場景中,Deep Think 相關模型也已展現出接近人類頂尖選手的實力。Google提到,這些 Deep Think 變體近期在國際數學奧林匹克(IMO)和國際大學生程序設計競賽(ICPC)世界總決賽中達到了“金牌標準”水平。 在 IMO 測試設置中,模型需在兩場各 4.5 小時的考試中,在完全離線、不可調用工具或互聯網的條件下獨立解題并撰寫自然語言證明,對推理深度與表達能力要求極高。
對于終端用戶而言,Gemini 3 Deep Think 的定位是作為 Ultra 訂閱層中的“高推理模式”,主要面向需要嚴謹演繹、多步推理和高可靠性的復雜任務場景。Google強調,這一模式是在現有 Gemini 3 Pro 能力之上通過額外算力與新技術堆疊而成,因此更適合處理高難度數學、科學研究問題及復雜邏輯分析需求。 用戶在 Gemini 應用內僅需在模型選項中切換到 Gemini 3 Pro 并啟用 Deep Think,即可體驗這一增強版推理能力。
文章還提到,OpenAI 早在今年 7 月就宣稱其一款實驗性推理大模型已達到“金牌級別”的表現,但該模型迄今尚未公開發布。 相比之下,Google此次將達到 IMO 金牌標準的 Deep Think 模型直接開放給 Ultra 訂閱用戶使用,被視為對競品的一次“先手發布”,外界也普遍預計 OpenAI 可能在不久的將來跟進,將其高推理模型推向公眾。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.