![]()
機器之心編輯部
上周,谷歌發布了 Gemini 3 Deep Think 的一次重大更新,以應對當今科學、研究和工程領域的復雜挑戰。而就在剛剛,谷歌正式推出支撐這些突破的升級版核心智能:Gemini 3.1 Pro。
![]()
參與了 Gemini 3 Deep Think 研究的姚順宇也發推介紹了這項新突破,并表示:「后續還會有更好的模型源源不斷地涌現」。
![]()
谷歌表示,基于 Gemini 3 系列,3.1 Pro 在核心推理能力上實現了進一步躍升。針對復雜問題的求解,3.1 Pro 提供了一個更聰明、更強大的能力基準。這一點也體現在團隊的多項嚴格基準測試進展中。
在 ARC-AGI-2(一個評估模型解決全新邏輯模式能力的基準測試)上,3.1 Pro 取得了經驗證的 77.1% 成績,其推理性能是 3 Pro 的兩倍以上
![]()
此外,內部基準測試表明,3.1 Pro 在各個專業領域都具有很強的競爭力:
- 科學知識:在 GPQA 鉆石級測試中得分為 94.3%;
- 編碼:在 LiveCodeBench Pro 上 Elo 得分為 2887,在 SWE-Bench Verified 上得分為 80.6%;
- 多模態理解:在 MMMLU 測試中達到了 92.6%。
這些技術進步不僅僅是漸進式的,它們代表了模型處理「思考」token 和長期任務方式的改進,為構建自主智能體的開發者提供了更可靠的基礎。
來自第三方公司 Artificial Analysis 的評估表明,谷歌的 Gemini 3.1 Pro 已經躍居榜首,再次成為世界上功能最強大、性能最佳的 AI 模型。
![]()
它的得分領先 Claude Opus 4.6 4 分,而運行成本卻不到后者的一半。
![]()
而 Gemini 3.1 Pro 的各項強大功能,意味著它可以將復雜主題可視化、整理零散數據,并將創意項目化為現實。
為了呈現這種能力躍升,谷歌制作了一個經典的「鵜鶘騎自行車」SVG,與之前的效果進行對比,還測試了其他動物的效果。可以說,谷歌基本已經「殺死」了比賽。

目前,谷歌正在將 3.1 Pro 部署到面向消費者和開發者的各類產品中,以讓這一智能進步進入到大家的日常應用中。
即日起,3.1 Pro 將陸續上線:
- 面向開發者:通過 Google AI Studio 中的 Gemini API、Gemini CLI、智能體開發平臺 Google Antigravity,以及 Android Studio 提供預覽;
- 面向企業:上線 Vertex AI 和 Gemini Enterprise;
- 面向消費者:通過 Gemini 應用程序(APP)和 NotebookLM 推出。
資料顯示,谷歌的企業合作伙伴已經開始整合 3.1 Pro 預覽版,并稱其在可靠性和效率方面有了顯著提升。
Databricks 首席技術官 Hanlin Tang 稱,3.1 Pro 在一項針對表格和非結構化數據進行基于事實推理的基準測試 OfficeQA 上取得了「同類最佳結果」。Cartwheel 聯合創始人 Andrew Carr 也強調,該模型「對 3D 變換的理解有了顯著提升」,并指出它解決了 3D 動畫管線中長期存在的旋轉順序漏洞等。
值得注意的是,3.1 Pro 的定價稍顯復雜:
- 輸入價格:提示詞不超過 20 萬 token,每百萬 token 收費 2.00 美元;提示詞超過 20 萬 token,每百萬 token 收費 4.00 美元。
- 輸出價格:提示詞不超過 20 萬 token,每百萬 token 收費 12.00 美元;提示詞超過 20 萬 token,每百萬 token 收費 18.00 美元。
- 上下文緩存:根據提示詞規模,每百萬 token 收取 0.20 至 0.40 美元,外加每小時每百萬 token 4.50 美元的存儲費。
- 聯網搜索(Grounding):每月前 5000 次提示免費,之后每 1000 次搜索查詢收費 14 美元。
3.1 Pro,好用嗎?
谷歌表示,3.1 Pro 的設計初衷,就是為了應對那些「簡單答案」解決不了的問題。它將先進的推理能力,轉化為幫你攻克最棘手挑戰的實用工具。這種更強的智能,能在實際應用中幫上大忙 —— 無論是想通過清晰的圖文講解搞懂一個復雜概念,想把零散的數據整合成一目了然的視圖,還是想給創意項目注入活力,它都能助你一臂之力。
以下是 3.1 Pro 的一些應用效果展示:
1、基于代碼的動畫:3.1 Pro 可以直接根據文字提示,生成網站可用的、自帶動效的 SVG 圖片。由于這些動畫是用純代碼而非像素構建的,所以無論放大到什么尺寸都依然清晰,并且和傳統視頻相比,文件體積也小得驚人。
2、復雜系統整合:3.1 Pro 能運用其強大的推理能力,在復雜的 API 接口和用戶友好的設計之間架起橋梁。比如在這個例子中,該模型就搭建了一個實時航空儀表盤,成功接入公共遙測數據流,將國際空間站的運行軌道直觀地呈現出來。
3、交互式設計:3.1 Pro 能編寫出復雜的 3D 椋鳥群飛模擬代碼。它不僅能生成視覺代碼,還能打造出沉浸式的互動體驗 —— 用戶可以通過手勢追蹤來控制鳥群的飛行,同時聽到根據鳥群動作實時變化的生成式配樂。對于研究人員和設計師來說,這為打造感官豐富的交互界面原型,提供了一種強大的新途徑。
4、創意編程:3.1 Pro 能將文學主題轉化為實用的代碼。當要求它為艾米莉?勃朗特的《呼嘯山莊》構建一個現代風格的個人作品集網站時,該模型并非只是簡單復述文本內容。它會深入理解小說中那種充滿氛圍感的基調,并以此構思出一個時髦又現代的界面,最終打造出一個能精準捕捉主人公精神內核的網站。
下一步計劃
谷歌表示,今天推出的 Gemini 3.1 Pro 是一個預覽版,之后將在自主工作流等領域尋求進一步突破,不久后,會正式全面開放給大家使用。
從今天開始,Gemini app 中的 3.1 Pro 版本將逐步面向 Google AI Pro 和 Ultra 套餐的用戶開放更高的使用額度。同時,3.1 Pro 也已登陸 NotebookLM,專供 Pro 和 Ultra 用戶使用。對于開發者和企業用戶,現在可以在 Gemini API 中通過 AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI 和 Android Studio 平臺搶先體驗 3.1 Pro 的預覽版。
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/
https://x.com/GoogleDeepMind/status/2024516464892334129
https://x.com/ArtificialAnlys/status/2024518545510662602
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.