<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌Gemini 3.1 Pro新王登場!一口氣手搓Win11操作系統

      0
      分享至



      性能暴增價格不變。

      作者 |程茜 江宇

      編輯 |心緣

      智東西2月20日消息,谷歌正式發布其新一代旗艦模型Gemini 3.1 Pro。根據谷歌放出的基準測試,谷歌最強復雜任務處理模型Gemini 3.1 Pro在12項測試中超過Gemini 3 Pro、Claude Opus 4.6、Claude Sonnet 4.6、GPT-5.2等模型,拿下第一。



      谷歌DeepMind主要提升了Gemini 3.1 Pro的推理能力。面對業界公認高難度的ARC-AGI-2通用智能基準測試,Gemini 3.1 Pro斬獲77.1%的高分,超越Claude、GPT模型,且成績相較Gemini 3 Pro實現翻倍提升。

      去年9月加入谷歌DeepMind的清華物理系傳奇人物姚順宇(Shunyu Yao)也發文官宣了新模型發布,并稱“更好的Gemini模型正以勢不可擋的速度涌現”



      下面這一經典的“鵜鶘騎自行車SVG動畫”對比,直觀體現了新模型的能力提升,右側Gemini 3.1 Pro生成的鵜鶘身體結構、騎行姿態自然合理,且自行車的車架、鏈條、腳踏、座椅等細節完整,相比Gemini 3 Pro的生成結果符合物理常識,更像一個完整的動畫場景。



      為Gemini 3.1開發SVG生成功能的清華校友Jiao Sun,在X上評論說“無比自豪”。

      從今日起,Google AI Pro、Ultra訂閱用戶可以在Gemini應用、AI助手NotebookLM中使用Gemini 3.1 Pro,免費用戶可向Gemini 3.1 Pro提問2次。開發者和企業用戶可以在AI Studio、Antigravity、Vertex AI、Gemini Enterprise、Gemini CLI及Android Studio的Gemini API預覽版中使用Gemini 3.1 Pro。

      Gemini 3.1 Pro預覽版的API價格采用分級計費模式,與上一代Gemini 3 Pro預覽版保持一致,提示詞在20萬token以內,每百萬token輸入價格2美元(約合人民幣14元),輸出價格12美元(約合人民幣83元),提示詞超過20萬token,每百萬token輸入價格4美元(約合人民幣28元),輸出價格18美元(約合人民幣124元)。



      01.

      能搭WebOS、能做《我的世界》

      還能拆視覺錯覺

      Gemini 3.1 Pro的核心升級集中在復雜任務處理能力上。其博客透露,新模型在高級推理、多模態理解和復雜項目生成方面進一步強化,能夠更好應對高難度工作場景。模型發布后,社區實測迅速跟進。

      知名AI博主Chetaslua展示了其用Gemini 3.1 Pro一次性安裝Windows 11 WebOS的結果。

      Chetaslua在帖中直言:“上次我分享類似案例時還非常困難,現在已經變成常態。有了智能體系統,我們幾乎可以用這個模型做任何事?!?/p>



      他之前也發過用Gemini 3.0 Pro生成Windows Web操作系統的視頻,兩個視頻放一起對比,提升效果非常明顯。

      Gemini 3.1 Pro生成的系統界面有完整應用圖標、開始菜單樣式布局以及基礎窗口交互邏輯,整體形態更接近一個可運行的輕量級操作系統。

      相比之下,之前3.0 Pro生成的系統形態相對簡陋,一些基礎桌面交互和系統級應用缺失。

      另一組更偏工程化的案例顯示,有開發者用Gemini 3.1 Pro在瀏覽器中直接生成并運行了一個可交互的VoxelWeb項目,形態類似“我的世界”式3D沙盒。

      界面已包含啟動按鈕、移動控制、方塊交互以及基礎合成邏輯,具備完整的輕量沙盒雛形。



      在前端生成與動畫細節方面,也有開發者要求模型生成一段完整的交互式生長動畫,覆蓋種子發芽、根系形成、枝干生長到樹葉展開的全過程。



      實測結果顯示,模型在生長階段銜接與葉片細節上表現較為完整。該開發者評價稱:“這是我在這個提示詞下見過最好的樹葉效果?!?/p>

      視覺理解方向的測試則進一步拉高了難度。有網友專門驗證“AgenticVision”能力,輸入素材是一張看似普通的街頭垃圾桶照片。

      模型不僅完成了基礎識別,還進一步指出:當瞇眼或拉遠觀看時,畫面中的垃圾、陰影與輪廓會在視覺上拼合成兩個并排而坐的卡通角色。模型還逐項拆解了這一視覺錯覺的形成機制,解釋不同布料、垃圾袋與陰影分別對應角色的頭部、身體與外輪廓關系,體現出多步視覺推理能力。



      整體來看,Gemini 3.1 Pro已經開始觸及空間關系理解、形狀映射和視覺錯覺解釋等更高階視覺認知任務。開發者給出的綜合判斷是,其表現已進入當前第一梯隊水平。

      我們還用“開車還是步行去距離100米的洗車店洗車”、“父母能否結婚”等陷阱題考了考Gemini 3.1 Pro,結果它都成功避坑答對。



      02.

      手搓《模擬城市》

      創意編程、交互式設計分分鐘搞定

      谷歌DeepMind的官方X賬號展示了谷歌UX工程師Michael Chang用Gemini 3.1 Pro開發了一個逼真的城市規劃應用程序。Gemini 3.1 Pro能自己處理復雜地形、繪制基礎設施圖、模擬交通,最后生成高質量的可視化效果。

      除了上面提到的鵜鶘騎自行車,Gemini 3.1 Pro在生成青蛙騎老式高輪自行車、長頸鹿駕駛微型汽車、鴕鳥穿著旱冰鞋等各種抽象畫面的SVG動畫上,表現也毫不遜色。相比Gemini 3 Pro,Gemini 3.1 Pro的生成效果整體場景更生動、更有故事感,細節表現力大幅提升。

      如Gemini 3.1 Pro可以直接根據文本提示生成可用于網站的動畫SVG,并且由于這些動畫是用純代碼而非像素構建的,因此在任何尺寸下都能保持清晰,并且文件體積相比傳統視頻非常小。

      Gemini 3.1 Pro的復雜推理能力,能幫助用戶使用復雜API完成設計。如下面案例,該模型構建了一個實時航空航天儀表盤,成功配置了公共遙測數據流,以可視化國際空間站的軌道運行軌跡。

      在交互式設計方面,Gemini 3.1 Pro可以編寫代碼,生成一個復雜的3D椋鳥群飛模擬。并且其還能構建沉浸式體驗,用戶可以通過手勢追蹤操控鳥群,同時聆聽一段生成式配樂,音樂會隨著鳥群的動態變化而改變。

      Gemini3.1 Pro還能進行創意編程, 將文學主題轉化為可運行的代碼。當被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》構建一個現代個人作品集網站時,該模型深入分析了小說的氛圍基調,設計出一個簡潔現代的界面,打造出一個能捕捉主角精神內核的網站。

      03.

      編程、推理、多模態樣樣行

      數項測試超Claude、GPT模型

      研究人員在一系列基準測試中對Gemini 3.1 Pro進行了評估,包括推理、多模態能力、智能體工具使用、多語言性能和長上下文。

      相比Gemini 3 Pro、Claude Sonnet 4.6、Claude Opus 4.6、GPT-5.2、GPT-5.3-Codex,Gemini 3.1 Pro在12項基準測試中拿下第一。

      在需要更強推理能力的測試中,Gemini 3.1 Pro在人類最后的考試、ARC-AGI-2、GPQA Diamond 3項測試中,表現都優于Claude、GPT模型。

      編程能力測試中,Gemini 3.1 Pro在SWE-Bench Pro(公開版)和SWE-Bench Verified中得分相對較低,這兩大測試集考驗的是模型在真實項目中理解需求、定位問題、修改代碼、保證可用的端到端工程能力。

      GDPval-AA Elo是當前衡量大模型在高價值知識工作中綜合能力的相對評分體系,Gemini 3.1 Pro的表現優于GPT-5.2、GPT-5.3-Codex,僅次于Sonnet 4.6。

      衡量大模型工具使用能力的τ2-bench、MCP Atlas、BrowseComp、多語言性能的MMLU、長上下能力的MRCR v2測試集中,新模型的表現同樣優于其他模型。

      在多模態大模型學術評測基準MMMU-Pro上,Gemini 3.1 Pro的表現比Claude、GPT模型更好,但略遜于Gemini 3 Pro。

      04.

      結語:大模型競賽焦點

      轉向復雜任務落地能力

      當前大模型行業正從通用能力比拼,轉向真實世界復雜任務的實戰能力競爭,海內外各家模型在推理、工程化、多模態理解等核心能力上不斷發力突破,力求讓大模型真正落地應用,與真實業務場景相結合。

      谷歌近期的加速布局也是如此,其上周發布了Gemini 3 Deep Think模型升級、一周后又推出Gemini 3.1 Pro,都將模型的升級重點放在專業領域加速技術研發、解決實際工作中的復雜問題上??梢钥闯?,當下大模型已經讓更智能的大模型真正具備解決真實世界復雜任務能力,AI成為專業領域核心生產力的潛力增加。

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      特朗普:美軍在與伊朗沖突中可能還會出現更多傷亡

      特朗普:美軍在與伊朗沖突中可能還會出現更多傷亡

      界面新聞
      2026-03-08 07:13:38
      西貝再暴大雷!總部人去樓空,新任領導威逼員工,300人討薪無門

      西貝再暴大雷!總部人去樓空,新任領導威逼員工,300人討薪無門

      離離言幾許
      2026-03-07 15:53:37
      偷往帽子倒螺螄粉湯的女子已經社死,正面照遭網友Ai修復后瘋傳

      偷往帽子倒螺螄粉湯的女子已經社死,正面照遭網友Ai修復后瘋傳

      映射生活的身影
      2026-03-08 02:42:07
      越扒瓜越大!魯山舅舅與亡姐結婚再添猛料,遠不止吃絕戶這么簡單

      越扒瓜越大!魯山舅舅與亡姐結婚再添猛料,遠不止吃絕戶這么簡單

      夢史
      2026-03-07 09:26:14
      特朗普發表聲明:伊朗已向其中東鄰國投降!這是由于美以的持續攻擊才實現的

      特朗普發表聲明:伊朗已向其中東鄰國投降!這是由于美以的持續攻擊才實現的

      爆角追蹤
      2026-03-07 21:09:51
      伊朗發視頻嘲諷:500萬美元導彈摧毀10美元假直升機 這就是所謂的“精準勝利”

      伊朗發視頻嘲諷:500萬美元導彈摧毀10美元假直升機 這就是所謂的“精準勝利”

      閃電新聞
      2026-03-07 14:00:07
      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      國家下狠手了!體制內大地震,少爺、公主們的“天”,要塌了

      霹靂炮
      2026-01-19 22:24:13
      汪小菲怒撕親媽翻車!張蘭撕開汪家四十年遮羞布,六麻記口碑暴跌

      汪小菲怒撕親媽翻車!張蘭撕開汪家四十年遮羞布,六麻記口碑暴跌

      離離言幾許
      2026-03-07 16:06:38
      就在下周一,或迎來本年度飆升!加滿一箱油要貴20元

      就在下周一,或迎來本年度飆升!加滿一箱油要貴20元

      都市快報橙柿互動
      2026-03-07 23:13:42
      網友吐槽別糊弄老百姓了,又是天才少年發國際論文,誰家的公子?

      網友吐槽別糊弄老百姓了,又是天才少年發國際論文,誰家的公子?

      眼光很亮
      2026-03-08 01:43:40
      劉詩詩直播美的好權威,金絲眼鏡+大波浪造型,讓她美的發光了

      劉詩詩直播美的好權威,金絲眼鏡+大波浪造型,讓她美的發光了

      明星私服穿搭daily
      2026-03-05 07:24:32
      以色列特種兵深夜突襲慘敗,伊朗系成功伏擊,遠火轟擊F-35維修廠

      以色列特種兵深夜突襲慘敗,伊朗系成功伏擊,遠火轟擊F-35維修廠

      軍機Talk
      2026-03-07 16:42:12
      38歲破格被復旦大學錄取為博士的東北三輪車夫,如今怎么樣了?

      38歲破格被復旦大學錄取為博士的東北三輪車夫,如今怎么樣了?

      凡知
      2026-03-07 12:12:50
      魯迅在北京用3765塊大洋,買一套32間的四合院,如今值多少錢?

      魯迅在北京用3765塊大洋,買一套32間的四合院,如今值多少錢?

      鶴羽說個事
      2026-03-07 18:52:54
      特朗普沒想到:美伊大戰打醒兩個國家,一個是越南,一個是菲律賓

      特朗普沒想到:美伊大戰打醒兩個國家,一個是越南,一個是菲律賓

      探索新高度
      2026-03-07 23:24:06
      愛德華茲評NBA歷史首發五虎:現役三人在列包括自己 沒選詹姆斯

      愛德華茲評NBA歷史首發五虎:現役三人在列包括自己 沒選詹姆斯

      羅說NBA
      2026-03-08 06:08:56
      伊朗戰術奏效了,再對林肯號航母發射導彈,這個武器成美軍數學題

      伊朗戰術奏效了,再對林肯號航母發射導彈,這個武器成美軍數學題

      書紀文譚
      2026-03-07 15:19:19
      人大代表畢利霞哽咽發言:老一輩的農民為農村改革發展奉獻了一輩子,懇請將農村70歲以上老人養老金每月提高到400元,免除居民醫保費

      人大代表畢利霞哽咽發言:老一輩的農民為農村改革發展奉獻了一輩子,懇請將農村70歲以上老人養老金每月提高到400元,免除居民醫保費

      大風新聞
      2026-03-07 17:46:10
      伊朗問題,注意普京的動向

      伊朗問題,注意普京的動向

      新民周刊
      2026-03-08 09:11:54
      "小龍蝦”背后暗藏極大危險:目前所有部署OpenClaw的電腦都可能成為"肉雞"!

      "小龍蝦”背后暗藏極大危險:目前所有部署OpenClaw的電腦都可能成為"肉雞"!

      識局Insight
      2026-03-07 19:42:12
      2026-03-08 09:43:00
      智東西 incentive-icons
      智東西
      聚焦智能變革,服務產業升級。
      11320文章數 116989關注度
      往期回顧 全部

      數碼要聞

      蘋果M5 MacBook Air玩3A游戲,低功耗高能效!

      頭條要聞

      媒體:伊朗問題要注意普京的動向 其在向美以喊話

      頭條要聞

      媒體:伊朗問題要注意普京的動向 其在向美以喊話

      體育要聞

      塔圖姆298天走完這段路 只用27分鐘征服這座城

      娛樂要聞

      汪小菲曝親媽猛料,張蘭公開財產分配

      財經要聞

      油價要失控?

      科技要聞

      OpenClaw最大的推手是閑魚和小紅書

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      教育
      藝術
      本地
      手機
      公開課

      教育要聞

      成長路上的心靈迷霧:青春期女生常見心理

      藝術要聞

      他是二王書法的化身?米芾的秘密揭曉!

      本地新聞

      食味印象|一口入魂!康樂烤肉串起千年絲路香

      手機要聞

      麒麟9030產能火力全開!華為Mate 80系列銷量激增:已突破400萬臺

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版