魚羊 夢瑤 發自 凹非寺
量子位 | 公眾號 QbitAI
春節檔國產大模型狂卷,谷歌也突然出手,Gemini 3.1 Pro直接深夜放大招!
相較于去年11月才剛剛發布的3 Pro,別看只是「.1」的一小步,升級幅度肉眼可見:
在官方給出的SVG對比展示中,3.1Pro在多模態生成和語義理解上都提升了一個level。

不僅如此,3.1 Pro還能將日常數據轉為互動可視化內容,一個航空航天儀表盤也能輕松roll出:

玩起「模擬城市」來,也是地形生成、道路鋪設、交通線路,一整套直接成型:

夯,是真夯,這不有網友們手搓體驗完真·就只想說一句——其他家模型可以直接over了(doge)
![]()
閑話少敘,技術報告、模型卡更多細節,我們直接開扒——
.1一小步,推理能力一大步
此次升級,官方的說法是把上周發布的Gemini 3 Deep Think背后的核心智能給公開了:
在Gemini 3的基礎上,3.1 Pro在核心推理能力上更進一步。
在ARC-AGI-2基準測試中,3.1 Pro獲得了77.1%的驗證分數,在推理表現上達到3 Pro的2倍之多:
![]()
此外,3.1 Pro支持1M上下文,知識截止日期為2025年1月,在多模態理解能力、vibe coding、多語言性能和長上下文方面都同步增強。
在Arena的對比評測結果中,3.1 Pro的整體排名分數也比3 Pro高出13分,文本與代碼維度的表現進步也相當明顯:
![]()
在官方給出的多模態效果中,在同一句提示詞下,3.1 Pro在動作連貫性和色彩輸出上較3.0 Pro有明顯提升:

在推理能力上,3.1 Pro相比上一代能應對結構更復雜、步驟更多的提示詞需求。
比如下面這個案例:3.1 Pro直接生成了一個3D版“椋鳥群飛”,視覺代碼一次到位,還順手做出了可交互玩法。
用戶可以直接通過手勢追蹤操控鳥群,而且畫面還能夠根據鳥群運動變化而生成的音樂~

整體上來看,在復雜主題的可視化方面,Gemini 3.1 Pro確有明顯的進化。
網友們也在第一時間對官方宣傳進行了檢驗。
比如用3.1 Pro直接生成一個《我的世界》:

再瞧這位網友,用3.1 Pro搓出來了個人網站(別說,感覺比Gemini官網效果還好?):

還有網友腦洞大開,讓3.1 Pro開發了一款教育應用,直言模型在模擬光線效果上那叫一個逼真!

一圈體驗下來,大家紛紛表示:
- Gemini沒有在開玩笑。

目前,Gemini 3.1 Pro已經在Gemini應用和API中上線,Google AI Pro和Ultra用戶還可以在NotebookLM中使用這一最新模型。
智能成本還在呈數量級下降
有意思的一點是,此次發布Gemini 3.1 Pro,是谷歌首次采用「.1」這樣的小版本號。
具有網友表示:不兒,Gemini 3 Pro不是還在Preview嗎,這就出新模型啦?
![]()
不得不說,大模型的2026,注定還是要卷到飛起。
![]()
另外值得注意的是,谷歌這一小步,還又把大模型向帕累托前沿推了推。
帕累托前沿(Pareto Front),可以簡單理解為最小化成本,最大化性能。
定價方面,Gemini 3.1 Pro Preview的輸入價格為2美元(<200k tokens)/4美元(>200k tokens),輸出價格為4美元(<200k tokens)/18美元(>200k tokens),跟Gemini 3 Pro Preview持平。
從ARC-AGI基準的視角來看,則是每完成一次ARC-AGI-2任務花費0.96美元(約合人民幣6.63元)——
相較之下,Gemini 3 Deep Think價格是3.1 Pro的10倍,而兩者性能相差僅幾個百分點。
![]()
有網友認為,這樣的推進速度,「完全打破了傳統的成本-智能曲線」。
![]()
相比于基準榜單上測試成績的變化,對于高速進化中的大模型應用而言,成本方面的持續壓縮更加值得關注。
并且2026,這才剛剛開始呢。
參考鏈接:
[1]https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
[2]https://deepmind.google/models/gemini/pro/
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.