<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌Gemini最“小”的一次迭代,姚順宇為何高呼“不可阻擋”?

      0
      分享至


      本文來自微信公眾號:字母AI,作者:小金牙,編輯:王靖,題圖來自:AI生成

      人們還在津津樂道OpenAI和Anthropic兩家公司的老板拒絕牽手,以至于握拳高舉的滑稽畫面,另一邊,谷歌一個反手迭代了模型。


      而且這次迭代,頗像是狼披上了羊皮——從模型后綴的數字序號看,這是谷歌最“小”的一次迭代,之前都是從Gemini 2.0到Gemini 2.5這樣的迭代,這次從Gemini 3.0到Gemini 3.1Pro Preview。


      但是這“.1”的迭代,進步得卻不是一星半點。

      谷歌CEO皮查伊(Sundar Pichai)表示,新代模型非常擅長處理“超級復雜的任務”。例如將復雜概念可視化、將數據綜合成單一視圖或者將創意項目變為現實。


      姚順宇也專門在X上發帖為Gemini 3.1 Pro Preview振臂,盛贊:

      “Gemini不僅僅是一個好模型,更好的模型正在以不可阻擋之勢到來?!?/p>


      需要注意的是,大約一周前,谷歌推出了“專用推理模式”Gemini 3 Deep Think,專為科學、研究、工程等復雜、開放式問題設計。

      Demini 3 Deep Think是姚順宇從Anthropic跳槽到谷歌DeepMind之后參與的第一個項目。

      而如今的Gemini 3.1 Pro Preview和Gemini 3 Deep Think有千絲萬縷的關系,官方表示“直接構建在Gemini 3 Deep Think的經驗和技術之上”。相當于把Deep Think的核心推理提升技術“下放”到更廣泛可用的Pro模型中。

      一、Gemini 3.1 Pro Preview能做什么

      既然這次新代模型的突出能力在處理“超級復雜”的任務,那么普通的對話放一邊,谷歌的官方博文中,重點給出了幾種示例秀肌肉。

      第一,通過簡單的提示詞,創建SVG動畫。

      這個功能前代也有,但是對比之下進步明顯。

      比如提示詞“生成一個SVG,描繪一只變色龍靜靜地坐在樹枝上。讓變色龍的眼睛跟隨用戶的鼠標光標在屏幕上移動?!?/p>

      Gemini 3 Pro生成的動畫背景是單一的白色,變色龍也看起來很呆板,甚至一側有兩只眼睛。

      Gemini 3.1 Pro生成的動畫則有豐富的“深綠色叢林”背景,變色龍身體有黃色斑紋和圓點裝飾,眼睛立體,腿部姿勢自然彎曲。


      再比如提示詞“生成一個滑動切換開關的SVG,當鼠標懸停在太陽圖標上時,將其變成發光的月亮,同時背景從明亮平滑漸變到黑暗。采用干凈的扁平UI風格?!?/p>

      Gemini 3 Pro給出的動畫雖然完成了任務,圖標可以隨鼠標變化,但是主圖標單一,是一個缺角的圓形圖案,用黃色代表白天,白色代表夜間。

      Gemini 3.1 Pro生成的動畫要復雜得多,白天是黃日白云,夜間是月牙繁星,兩套圖標絲滑變換。


      總而言之,Gemini 3 Pro做的動畫,讓人想起多年前那個“學了三年動畫”的梗。


      而Gemini 3.1 Pro交付的SVG動畫,已經達到了可以直接使用的效果。

      第二,構建工程級別系統。

      Gemini 3.1 Pro已經可以根據一段高復雜度的自然語言指令,直接生成一個集3D渲染、實時太陽星歷計算、API異步拉取和物理光效于一體的完整交互系統,而不是簡單頁面demo。

      谷歌給出的示例中,用戶給出文字指令,Gemini 3.1 Pro生成了構建一個高保真、可交互的3D國際空間站(ISS)軌道追蹤器。使用高分辨率的Blue Marble紋理貼圖渲染一個精細的3D地球模型。


      第三,生成交互式創意系統。

      在另一個示例中,谷歌展示了Gemini 3.1 Pro編寫的一個復雜的3D椋鳥群舞(murmuration)模擬。


      它不僅生成視覺代碼,還構建了一個沉浸式體驗,用戶可以通過手部追蹤操控鳥群,并聆聽根據鳥群運動變化的生成式配樂。

      對于研究人員和設計師而言,這提供了一種強有力的方式來原型化感官豐富的界面。

      第四,將文學主題轉化為可運行的代碼。

      這個示例可能是普通人最容易get到厲害之處的一個。


      當被要求為艾米莉·勃朗特(Emily Bront?)的《呼嘯山莊》(Wuthering Heights)打造一個現代個人作品集網站時,該模型并未簡單地總結文本內容,而是基于小說的氛圍與情緒進行推理,設計出一個簡潔、當代感十足的界面,創建出一個捕捉主人公精神內核的網站。

      抽象推理,這種能力的含金量不用多說。

      二、到底有多強?

      新代模型免不了過一下刷榜這一步。

      而“.1”的升級,獲得了動輒倍數躍升的成績。

      根據谷歌官方博文放出的測試結果,在ARC-AGI-2基準測試中,3.1 Pro的驗證得分達到了77.1%。比3 Pro的推理性能提升了一倍以上。

      這也符合3.1 Pro的示例,因為這個測試評估的是模型解決全新邏輯模式的能力。用人話說就是,抽象推理解謎的能力。


      此外,在GPQA Diamond(科學知識測試)中,3.1 Pro得分94.3%;智能體類基準MCP Atlas上,得分69.2%;真實網絡瀏覽與信息整合能力的基準BrowseComp上,得分85.9%。

      這些成績,均超過了Anthropic的Sonnet 4.6、Opus 4.6,以及OpenAI的GPT-5.2與GPT-5.3-Codex。

      谷歌Gemini 3.1 Pro這次在ARC抽象推理和BrowseComp搜索任務上顯著拉開差距,顯示出明顯的Agent傾向,而非單純知識模型。

      此外,專門做大模型基準測試與對比分析的第三方評測機構也發布了相關測試結果,大贊Gemini 3.1 Pro在構成Artificial Analysis Intelligence Index的10項評測中領先6項,相較于Gemini 3 Pro Preview在多項能力上顯著提升,尤其是在推理與知識、代碼能力以及降低幻覺方面進步最大。


      而且,Gemini 3.1 Pro Preview保持較高的token效率。

      運行完整Artificial Analysis Intelligence Index約需5700萬token(比Gemini 3 Pro Preview多100萬)。

      這一token使用量低于其他在最大推理模式下運行的前沿模型,如Opus 4.6(max)和GPT-5.2(xhigh)。

      結合更低的單token定價,Gemini 3.1 Pro Preview在前沿模型中具有成本優勢,運行完整Intelligence Index的成本不到Opus 4.6(max)的一半,不過仍約為領先開源模型GLM-5的兩倍。

      三、能力翻倍價格不變

      谷歌官方API定價顯示,Gemini 3 Pro/3.1 Pro Preview的收費結構是按token計費的:

      小于200k tokens時,每百萬token輸入約2美元,輸出價格為4美元。大于200k tokens時,每百萬token輸入4美元,輸出18美元。

      在上下文緩存方面,根據提示詞規模,每百萬 token 收取 0.20 至 0.40 美元,外加每小時每百萬 token 4.50 美元的存儲費。

      這個價格,整體上和Gemini自己的上一代3 Pro一致,但要是和 Anthropic Opus 系列比起來,還是相對便宜的。 Opus這類模型輸入/輸出單價能在$5/$25左右。

      尤其是結合當下它在模型能力上相當突出,這個價格更顯得極具競爭力。

      不要忘了,谷歌這次發布的只是“預覽(Preview)”,谷歌很快就會推出正式版。而“.1”的迭代,谷歌也是在暗示其只是小秀肌肉。

      目前,開發者可以在AI Studio、Gemini API、Gemini CLI、智能體開發平臺Google Antigravity以及Android Studio使用3.1 Pro;企業用戶則可以在Vertex AI和Gemini Enterprise使用;普通用戶在Gemini應用和NotebookLM都能用上,不過后者僅限Pro和Ultra訂閱用戶。

      各個社區里已經有不少人迫不及待上手操作,真的就和谷歌的演示一樣,手搓了不少驚艷的玩意。

      有人用Gemini 3.1 Pro 生成了一個可交互的 3D 機械級汽車懸架系統模擬器,包含真實幾何結構、連桿約束與實時轉向和行程計算,相當于把機械工程建模、物理邏輯和3D可視化一次性寫成可運行工具,接近工程級原型能力。


      有人用3.1 Pro制作“捉鬼獵人走過一棟鬧鬼的房子”的循環動畫,驚呼“Gemini沒有開玩笑”。


      總之,谷歌這回是真憋了個大招。

      小小一個“.1”,卻把推理和代碼能力拉得飛起,定價還這么穩。

      社區里滿溢的手搓demo的熱情,也證明了它的能力與實用性。

      AI圈越來越現實了。模型再強,終究得看賬單值不值。企業開始精打細算每個token的回報,開發者也得掂量掂量性價比。谷歌這一步,不僅是搶回王座,更是把競爭推向“誰更會過日子”的新階段。

      且看接下來,捏著拳頭的Anthropic和OpenAI,以及xAI、Meta、微軟等一眾競爭對手該如何應對吧。

      本文來自微信公眾號:字母AI,作者:小金牙,編輯:王靖

      本內容由作者授權發布,觀點僅代表作者本人,不代表虎嗅立場。如對本稿件有異議或投訴,請聯系 tougao@huxiu.com。

      本文來自虎嗅,原文鏈接:https://www.huxiu.com/article/4835960.html?f=wyxwapp

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      水下攝像探頭拍到了!虎跳峽墜江新郎遺體死死吸在水底,打撈困難

      水下攝像探頭拍到了!虎跳峽墜江新郎遺體死死吸在水底,打撈困難

      娛樂的硬糖吖
      2026-03-08 01:38:35
      “人面獸心”的婆婆自曝虐兒媳:十年欺凌換一生怨恨,網友怒了!

      “人面獸心”的婆婆自曝虐兒媳:十年欺凌換一生怨恨,網友怒了!

      另子維愛讀史
      2026-03-07 19:45:49
      印度同意接納伊朗軍艦

      印度同意接納伊朗軍艦

      財聯社
      2026-03-07 14:38:12
      2026中國百強城市指數榜單發布!一線城市洗牌,江蘇13市全部入選

      2026中國百強城市指數榜單發布!一線城市洗牌,江蘇13市全部入選

      GYbrand
      2026-03-05 22:03:13
      國家發改委主任:新建、改擴建1000所普通高中,增加學位200萬個以上,支持雙一流高校本科擴招10萬人以上

      國家發改委主任:新建、改擴建1000所普通高中,增加學位200萬個以上,支持雙一流高校本科擴招10萬人以上

      極目新聞
      2026-03-06 18:28:25
      出兵朝鮮的前夜,政治局吵成一團,毛主席:你們都太小題大做

      出兵朝鮮的前夜,政治局吵成一團,毛主席:你們都太小題大做

      風飄飄而吹衣
      2025-01-02 13:17:20
      嚷嚷了小半年、講了3個小時,二代刀片電池+閃充,連電都充不滿?

      嚷嚷了小半年、講了3個小時,二代刀片電池+閃充,連電都充不滿?

      小李車評李建紅
      2026-03-06 08:08:45
      金晨真的出事了!

      金晨真的出事了!

      八卦瘋叔
      2026-03-07 10:24:54
      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      回顧“91女神”琪琪:五官出眾,卻因天真讓自己“受傷”

      就一點
      2025-11-22 10:36:39
      西方戰略專家感嘆:中國是全世界,唯一強得悄無聲息的超級大國!

      西方戰略專家感嘆:中國是全世界,唯一強得悄無聲息的超級大國!

      勇士軍武閑談
      2026-03-05 11:20:31
      辣媽弦子竟比少女還緊致?這抹墨綠殺為何讓全網心跳失控?

      辣媽弦子竟比少女還緊致?這抹墨綠殺為何讓全網心跳失控?

      娛樂領航家
      2026-03-08 00:00:03
      瓜帥:我創下了主教練拿黃牌最多紀錄,我一直想要這個紀錄

      瓜帥:我創下了主教練拿黃牌最多紀錄,我一直想要這個紀錄

      懂球帝
      2026-03-08 07:28:59
      1-0!巴薩3連勝:西甲4分領跑,后11輪2場惡戰,贏1場基本奪冠

      1-0!巴薩3連勝:西甲4分領跑,后11輪2場惡戰,贏1場基本奪冠

      體育知多少
      2026-03-08 07:12:35
      法國藝術圈地震!芭蕾女神、哲學少女,都被鋼琴家送給了愛潑斯坦!

      法國藝術圈地震!芭蕾女神、哲學少女,都被鋼琴家送給了愛潑斯坦!

      新歐洲
      2026-02-18 19:44:34
      貴州男子建房挖出一條千斤鯰魚,發網上炫耀,次日村子被507所封禁

      貴州男子建房挖出一條千斤鯰魚,發網上炫耀,次日村子被507所封禁

      第四思維
      2025-03-11 14:43:28
      戰滿三局遭逆轉!陳雨菲1-2惜敗世界第一,無緣全英公開賽決賽

      戰滿三局遭逆轉!陳雨菲1-2惜敗世界第一,無緣全英公開賽決賽

      全景體育V
      2026-03-08 06:17:53
      汪峰前妻葛薈婕自曝:父母會找自己每任前任要20多萬,還說應該的

      汪峰前妻葛薈婕自曝:父母會找自己每任前任要20多萬,還說應該的

      觀魚聽雨
      2026-03-07 23:00:05
      金價:大家做好準備,信號很明確,下周或迎新一輪歷史行情?

      金價:大家做好準備,信號很明確,下周或迎新一輪歷史行情?

      三農老歷
      2026-03-08 00:12:07
      被邪修的“養生壺用法”驚到了,思路打開后,成了辦公室神器!

      被邪修的“養生壺用法”驚到了,思路打開后,成了辦公室神器!

      美家指南
      2026-03-06 15:38:12
      NASA 確認 DART 航天器首次改變雙小行星繞日軌道

      NASA 確認 DART 航天器首次改變雙小行星繞日軌道

      龍劍秀南
      2026-03-08 07:23:55
      2026-03-08 08:39:00
      虎嗅APP incentive-icons
      虎嗅APP
      個性化商業資訊與觀點交流平臺
      25843文章數 687552關注度
      往期回顧 全部

      科技要聞

      OpenClaw最大的推手是閑魚和小紅書

      頭條要聞

      牛彈琴:中東戰火還在繼續 三個戲劇性變化出現了

      頭條要聞

      牛彈琴:中東戰火還在繼續 三個戲劇性變化出現了

      體育要聞

      塔圖姆298天走完這段路 只用27分鐘征服這座城

      娛樂要聞

      汪小菲曝親媽猛料,張蘭公開財產分配

      財經要聞

      針對"不敢休、不讓休"怪圈 國家出手了

      汽車要聞

      逃離ICU,上汽通用“止血”企穩

      態度原創

      家居
      房產
      旅游
      手機
      健康

      家居要聞

      暖棕撞色 輕法奶油風

      房產要聞

      傳統學區房熄火?2月海口二手房爆火的板塊竟然是…

      旅游要聞

      杏花開了!西安地鐵直達的免費花海,巨巨巨出片,快去拍!

      手機要聞

      realme真我新機海外發布,6.8英寸144Hz LCD 高刷屏

      轉頭就暈的耳石癥,能開車上班嗎?

      無障礙瀏覽 進入關懷版