Google 剛剛放出了 Gemini3 DeepThink
這里還有兩個 Gemini3 DeepThink vs Gemini3 Pro 的對比
評測數據:
?
ARC-AGI-2: 45.1%? 作為對比,Claude Sonnet 4.5 是 13.6%,GPT-5 Pro 是 15.8%,GPT-5.1 是 17.6%
差不多是其他模型的 3 倍
![]()
Google 官方放的圖,ARC-AGI-2 那欄的差距最明顯
Humanity's Last Exam 上也是第一,41%,比 GPT-5 Pro 的 30.7% 高出 10 個點GPQA Diamond 是93.8%,科學知識類測試,各家差距不大
技術上,Google 說的是「parallel reasoning」,并行推理
普遍的 reasoning model 是 chain-of-thought,一步一步往下推,走一條路,走到底
parallel reasoning 不一樣,它同時開很多條推理路徑,每條路徑探索一個假設
比如遇到一個問題,傳統做法是:假設 A → 推理 → 結論
parallel reasoning 則是這樣:
同時開 A、B、C、D 四個假設,四條路同時跑,跑完在比較
理解起來,就像這樣
假設 A → 推理 → ...可能的正確結論 A
假設 B → 推理 → ...可能的正確結論 B
假設 C → 推理 → ...可能的正確結論 C
假設 D → 推理 → ...可能的正確結論 D
然后,在看看這些結論中,哪些更靠譜
這樣的話,不會因為一開始選錯方向就全盤皆輸
就很類似你在做數獨,有時候要假設好幾個前提,然后逐個嘗試
![]()
就這種,很難說一次能試對
在 ARC-AGI-2 這種視覺推理測試上特別有用,因為這類題目需要從沒見過的 pattern 里找規律,一開始很難判斷哪個方向是對的
有關 ARC-AGI 的介紹,之前提過,感興趣的可以回顧下這里:
簡單來說,ARC-AGI 就是一組圖片題庫,沒有描述,對人來說較為簡單,但對 AI 來說就難度異常,這里放幾個典型的題目,感受一下
![]()
![]()
![]()
Gemini3 Deep Think 這套東西,是 Gemini 2.5 Deep Think 的延續
之前在 IMO(國際數學奧林匹克)和 ICPC 世界總決賽上都拿到了金牌水平,現在這套東西產品化了
使用方式:
Gemini app 里選「Deep Think」模式,模型選 Gemini 3 Pro
![]()
截止到發稿時,我這里還沒實裝
需要 Ultra 訂閱,今天實裝
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.