2月19日,Google正式發布Gemini 3.1 Pro。
作為Gemini 3系列的旗艦迭代版本,官方將其定位為面向最復雜任務的高階推理模型。
![]()
該版本依托MoE混合專家架構,實現了核心能力躍升,在推理、長上下文、編程、智能體、多模態五大維度上,都刷新了行業基準,成為當前AI模型競賽中兼具性能與性價比的標桿產品。
Artificial Analysis 的評估表明,Gemini 3.1 Pro 已經躍居榜首,再次成為世界上功能最強大、性能最佳的 AI 模型。
![]()
Gemini 3.1 Pro的核心突破集中在抽象推理能力的翻倍提升。
第三方獨立評測顯示,在ARC-AGI-2這一衡量模型處理全新邏輯模式的嚴苛基準上,模型得分從Gemini 3 Pro的31.1%躍升至77.1%,性能提升超兩倍,遠超Claude Opus 4.6的68.8%與GPT-5.2的52.9%。
![]()
![]()
![]()
Google CEO Sundar Pichai公開評價,這一成績標志著核心推理能力的里程碑式進步, 讓高級推理從實驗室能力變為解決真實復雜挑戰的實用工具。
![]()
在學術與科學推理場景中,GPQA Diamond科學知識基準測試拿下94.3%的行業最高分,Humanity’s Last Exam高級學術推理測試零工具輔助得分44.4%,均領先同期主流旗艦模型。
權威AI評測機構THE DECODER指出,該模型在科學知識與復雜邏輯理解上的表現,已接近專業領域人類專家水平。
同時,幻覺率較上一代降低38%,大幅提升了高價值場景的可靠性。
長文本處理能力也是Gemini 3.1 Pro的核心優勢之一。
新版本模型支持100萬token輸入上下文與6.5萬token輸出長度,可一次性處理整本書籍、數小時會議記錄、完整代碼庫等超大規模文本,而無需拆分任務。
![]()
OfficeChai實測數據顯示,在處理百萬級token長文檔時,信息提取準確率保持在90%以上,輸出完整技術手冊、行業研報等長文本的連貫性與完整性優于同類模型,解決了傳統模型長文本處理碎片化、信息丟失的痛點。
編程與工程能力方面,Gemini 3.1 Pro在LiveCodeBench Pro競賽級編程測試中ELO評分達2887,SWE-Bench Verified工程代碼修復通過率80.6%,與Claude Opus 4.6持平并顯著高于GPT-5.2,Terminal-Bench 2.0終端編程得分68.5%,較上一代提升11.6個百分點。
此外,Gemini 3.1 Pro智能體能力實現近翻倍提升。
APEX-Agents長鏈任務測試中,其得分33.5%,較Gemini 3 Pro的18.4%大幅增長,領先Claude Opus 4.6的29.8%與GPT-5.2的23.0%,可自主完成多步驟規劃、API對接、工具調用、復雜業務流程執行等任務。
![]()
第三方測試顯示,Gemini 3.1 Pro醫療領域任務準確率從47%提升至67%,法律任務準確率從57%提升至74%,具備落地行業智能體的核心能力。
多模態方面,Gemini 3.1 Pro支持文本、圖像、視頻、音頻一體化輸入輸出,Video-MMMU視頻理解基準得分87.6%,可精準解析視頻內容、理解多模態邏輯關聯。
![]()
下面是一些針對各方面能力的演示案例。
1.SVG 生成效果
之前 Gemini 3 Pro 在生成復雜 SVG 圖形時,經常會出現結構混亂、細節缺失的問題。
同樣的需求,Gemini 3.1 Pro不管是圖形的層次感、細節的處理,還是代碼的優雅程度,都有明顯提升。
這種提升背后,就是抽象推理能力的體現。
谷歌還制作了一個經典的“鵜鶘騎自行車”SVG,與之前的效果進行對比,此次測試了其他動物的效果。

有網友評測,其輸入一句話的Prompt,3.1 Pro在短短3分鐘內,輸出一個11秒的SVG動畫。

在另一個SVG測試中,3.1 Pro生成的“海豹頂皮球”在視覺表現力上也堪稱驚艷。

2.3D 地圖構建
這個任復雜度很高,需要理解地理數據、處理三維坐標、調用可視化庫,還要考慮性能優化。

結果顯示,不僅代碼結構清晰,還主動考慮到了數據加載、渲染優化、交互設計這些細節。
再如這兩個:


3.復雜系統整合
3.1 Pro 能運用其強大的推理能力,在復雜的 API 接口和用戶友好的設計之間架起橋梁。
比如,該模型搭建了一個實時航空儀表盤,成功接入公共遙測數據流,將國際空間站的運行軌道直觀地呈現出來。
Google DeepMind 首席科學家 Jeff Dean 也轉發了一個是用 3.1 Pro 模擬城市規劃、設計全新城市的應用,從零生成可交互的規劃界面 demo。

4. 交互式設計
3.1 Pro 能編寫出復雜的 3D 椋鳥群飛模擬代碼。它不僅能生成視覺代碼,還能打造出沉浸式的互動體驗 —— 用戶可以通過手勢追蹤來控制鳥群的飛行,同時聽到根據鳥群動作實時變化的生成式配樂。
再如3.1 Pro展示的一顆種子從發芽到長成大樹的全過程。

另一個案例是,把《呼嘯山莊》的文學氛圍轉化成一個現代個人網站,模型沒有簡單概括情節,而是分析了小說的整體基調,設計出了貼合主人公氣質的界面風格。

定價方面,與Gemini 3 Pro一致,20萬token以內輸入2美元/百萬token、輸出12美元/百萬token,超過200K token輸入4美元/百萬token、輸出18美元/百萬token,性價比顯著高于競品。
![]()
目前,Gemini 3.1 Pro已通過Google AI Studio、Gemini API、Vertex AI向開發者與企業開放,消費端可通過Gemini App、NotebookLM體驗,Google AI Pro訂閱用戶可直接使用高階能力。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.