網易首頁 > 網易號 > 正文申請入駐

谷歌奪回王座：Gemini 3.1 Pro來了！姚順宇：后面還有更好的

2026-02-20 13:26:08　來源: 機器之心Pro

河北舉報

分享至

機器之心編輯部

上周，谷歌發布了 Gemini 3 Deep Think 的一次重大更新，以應對當今科學、研究和工程領域的復雜挑戰。而就在剛剛，谷歌正式推出支撐這些突破的升級版核心智能：Gemini 3.1 Pro。

參與了 Gemini 3 Deep Think 研究的姚順宇也發推介紹了這項新突破，并表示：「后續還會有更好的模型源源不斷地涌現」。

谷歌表示，基于 Gemini 3 系列，3.1 Pro 在核心推理能力上實現了進一步躍升。針對復雜問題的求解，3.1 Pro 提供了一個更聰明、更強大的能力基準。這一點也體現在團隊的多項嚴格基準測試進展中。

在 ARC-AGI-2（一個評估模型解決全新邏輯模式能力的基準測試）上，3.1 Pro 取得了經驗證的 77.1% 成績，其推理性能是 3 Pro 的兩倍以上

此外，內部基準測試表明，3.1 Pro 在各個專業領域都具有很強的競爭力：

科學知識：在 GPQA 鉆石級測試中得分為 94.3%；
編碼：在 LiveCodeBench Pro 上 Elo 得分為 2887，在 SWE-Bench Verified 上得分為 80.6%；
多模態理解：在 MMMLU 測試中達到了 92.6%。

這些技術進步不僅僅是漸進式的，它們代表了模型處理「思考」token 和長期任務方式的改進，為構建自主智能體的開發者提供了更可靠的基礎。

來自第三方公司 Artificial Analysis 的評估表明，谷歌的 Gemini 3.1 Pro 已經躍居榜首，再次成為世界上功能最強大、性能最佳的 AI 模型。

它的得分領先 Claude Opus 4.6 4 分，而運行成本卻不到后者的一半。

而 Gemini 3.1 Pro 的各項強大功能，意味著它可以將復雜主題可視化、整理零散數據，并將創意項目化為現實。

為了呈現這種能力躍升，谷歌制作了一個經典的「鵜鶘騎自行車」SVG，與之前的效果進行對比，還測試了其他動物的效果。可以說，谷歌基本已經「殺死」了比賽。

目前，谷歌正在將 3.1 Pro 部署到面向消費者和開發者的各類產品中，以讓這一智能進步進入到大家的日常應用中。

即日起，3.1 Pro 將陸續上線：

面向開發者：通過 Google AI Studio 中的 Gemini API、Gemini CLI、智能體開發平臺 Google Antigravity，以及 Android Studio 提供預覽；
面向企業：上線 Vertex AI 和 Gemini Enterprise；
面向消費者：通過 Gemini 應用程序（APP）和 NotebookLM 推出。

資料顯示，谷歌的企業合作伙伴已經開始整合 3.1 Pro 預覽版，并稱其在可靠性和效率方面有了顯著提升。

Databricks 首席技術官 Hanlin Tang 稱，3.1 Pro 在一項針對表格和非結構化數據進行基于事實推理的基準測試 OfficeQA 上取得了「同類最佳結果」。Cartwheel 聯合創始人 Andrew Carr 也強調，該模型「對 3D 變換的理解有了顯著提升」，并指出它解決了 3D 動畫管線中長期存在的旋轉順序漏洞等。

值得注意的是，3.1 Pro 的定價稍顯復雜：

輸入價格：提示詞不超過 20 萬 token，每百萬 token 收費 2.00 美元；提示詞超過 20 萬 token，每百萬 token 收費 4.00 美元。
輸出價格：提示詞不超過 20 萬 token，每百萬 token 收費 12.00 美元；提示詞超過 20 萬 token，每百萬 token 收費 18.00 美元。
上下文緩存：根據提示詞規模，每百萬 token 收取 0.20 至 0.40 美元，外加每小時每百萬 token 4.50 美元的存儲費。
聯網搜索（Grounding）：每月前 5000 次提示免費，之后每 1000 次搜索查詢收費 14 美元。

3.1 Pro，好用嗎？

谷歌表示，3.1 Pro 的設計初衷，就是為了應對那些「簡單答案」解決不了的問題。它將先進的推理能力，轉化為幫你攻克最棘手挑戰的實用工具。這種更強的智能，能在實際應用中幫上大忙 —— 無論是想通過清晰的圖文講解搞懂一個復雜概念，想把零散的數據整合成一目了然的視圖，還是想給創意項目注入活力，它都能助你一臂之力。

以下是 3.1 Pro 的一些應用效果展示：

1、基于代碼的動畫：3.1 Pro 可以直接根據文字提示，生成網站可用的、自帶動效的 SVG 圖片。由于這些動畫是用純代碼而非像素構建的，所以無論放大到什么尺寸都依然清晰，并且和傳統視頻相比，文件體積也小得驚人。

2、復雜系統整合：3.1 Pro 能運用其強大的推理能力，在復雜的 API 接口和用戶友好的設計之間架起橋梁。比如在這個例子中，該模型就搭建了一個實時航空儀表盤，成功接入公共遙測數據流，將國際空間站的運行軌道直觀地呈現出來。

3、交互式設計：3.1 Pro 能編寫出復雜的 3D 椋鳥群飛模擬代碼。它不僅能生成視覺代碼，還能打造出沉浸式的互動體驗 —— 用戶可以通過手勢追蹤來控制鳥群的飛行，同時聽到根據鳥群動作實時變化的生成式配樂。對于研究人員和設計師來說，這為打造感官豐富的交互界面原型，提供了一種強大的新途徑。

4、創意編程：3.1 Pro 能將文學主題轉化為實用的代碼。當要求它為艾米莉?勃朗特的《呼嘯山莊》構建一個現代風格的個人作品集網站時，該模型并非只是簡單復述文本內容。它會深入理解小說中那種充滿氛圍感的基調，并以此構思出一個時髦又現代的界面，最終打造出一個能精準捕捉主人公精神內核的網站。

下一步計劃

谷歌表示，今天推出的 Gemini 3.1 Pro 是一個預覽版，之后將在自主工作流等領域尋求進一步突破，不久后，會正式全面開放給大家使用。

從今天開始，Gemini app 中的 3.1 Pro 版本將逐步面向 Google AI Pro 和 Ultra 套餐的用戶開放更高的使用額度。同時，3.1 Pro 也已登陸 NotebookLM，專供 Pro 和 Ultra 用戶使用。對于開發者和企業用戶，現在可以在 Gemini API 中通過 AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI 和 Android Studio 平臺搶先體驗 3.1 Pro 的預覽版。

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-pro/

https://x.com/GoogleDeepMind/status/2024516464892334129

https://x.com/ArtificialAnlys/status/2024518545510662602

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.