<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌數到3,這次輪到Gemini遙遙領先|Landing AI

      0
      分享至



      現在輪到谷歌數到3了。

      今天凌晨,谷歌正式公布了Gemini 3系列模型,并率先上線Gemini 3 Pro預覽版。按照介紹,開發者現可以在Google AI Studio直接調用API,Gemini應用已同步切換到新模型,企業與開發平臺側的更新則也已經納入近期計劃。

      對外而言,這次發布看似沿襲了大模型迭代的慣常節奏,但從谷歌的表述方式到模型本身呈現出來的能力,都暗示著一個趨勢:Gemini 3不再只是參數與跑分的躍遷,而是在嘗試重新定義“模型在系統中的位置”。

      Gemini 3 Pro被谷歌歸納為三個核心變化:推理強度提升、事實一致性增強、多模態能力從設計之初就內置而非附加。這意味著模型在對話中處理文本、圖像、音頻、視頻不再需要分階段切換,而是以統一的方式理解信息結構。

      官方給出的示例依舊貼近日常場景:把家里幾種語言混寫的手寫菜譜拍照丟給它,它能整理成一本統一格式的家庭菜譜;把一串長視頻講座交給它,它會把關鍵知識點拆成交互式卡片,甚至生成簡單的可視化工具來輔助記憶。在Gemini應用中,Canvas工作區能夠支持更完整的“小項目”;在Gemini Labs里,它也能根據你的問題生成類似雜志排版的界面。

      這些特性看上去像是一次體驗層面的升級,但真正讓Gemini 3 Pro與以往不同的,是它在各類評估中的表現出現了領先式的變化,而不僅是“略微更準一點”。

      過去一年,模型在各類基準測試中的差距往往停留在小范圍波動。現在,一些關鍵指標第一次被明顯拉開。


      最突出的表現落在高難度數學與復雜推理方向。Gemini 3 Pro在MathArena Apex中拿到23.4%的正確率,而上一代模型為0.5%、Claude為1.6%、GPT-5.1為1.0%——這是長期停滯區間第一次被大幅突破。

      在跨領域推理考試中,這種差距繼續擴大。例如在Humanity’s Last Exam中,Gemini 3 Pro的無工具得分達到37.5%,工具模式則提升至45.8%,高于上一代的21.6%和GPT-5.1的26.5%。在GPQA Diamond中,它也以91.9%領先于同類模型的83%—88%區間。

      多模態方面的變化則更集中體現在“界面理解”能力上。谷歌首次在技術資料中單列屏幕截圖理解,模型不僅能識別內容,還能把握界面結構、按鈕層級與可操作區域。

      在ScreenSpot-Pro中,Gemini 3 Pro達到72.7%,而GPT-5.1僅為3.5%,Claude為36.2%,上一代Gemini為11.4%。這里的差距不只是識別率問題,而是決定了Agent是在“憑感覺點擊”,還是確實理解界面語境。

      這種能力直接關系到Agent在操作電腦時是否能保持“情境意識”——能否基于界面判斷接下來會發生什么。對于任何期待AI“完成任務”的系統而言,這類能力遠比單純的圖像識別更關鍵。

      更廣泛的表現也與谷歌想強調的方向一致:Gemini 3 Pro在多學科理解、視頻推理和事實一致性上都拉開差距,并在工程類任務中顯現出更高的穩定度。

      例如在SimpleQA Verified中,Gemini 3 Pro達到72.1%,而同類模型普遍落在30%—35%區間;多語言綜合能力的MMLU中,它拿下91.8%,略高于GPT-5.1的91.0%,并領先Claude的89.1%。

      在工程類任務上,它不僅能處理更復雜的代碼生成,還能在涉及實際環境的測試中穩定執行。例如在Terminal-Bench 2.0中,Gemini 3 Pro達到54.2%,而Claude為42.8%,GPT-5.1為47.6%;在長鏈路任務Vending-Bench 2中,它的收益為5478美元,而其他模型普遍在1500—3800美元之間。

      不過,Gemini 3真正有意義的部分,不在于單項能力的提升,而是谷歌圍繞它構建的系統形態。伴隨此次更新推出的Antigravity,是一個以Agent為核心的開發環境。它并不是“補齊代碼空缺”的工具,而是讓模型能夠直接參與開發流程:理解需求、拆分任務、生成代碼、運行測試、檢查界面效果,再回到代碼層面調整。

      于此,谷歌通過把不同模型組合使用,讓Agent在編輯器、終端與瀏覽器之間自由切換,從而承接一段完整的執行鏈。對于結構不算復雜的項目,它已經能承擔起實際工作。

      面向普通用戶的變化,則更集中體現在Gemini應用和Google搜索上。Gemini 3 Pro從第一天起就是默認模型,而應用內的“Gemini Agent”可以處理多步決策任務,例如歸檔郵件、安排行程或處理需要反復查找信息的事務。搜索端的AI Mode也開始呈現更動態的信息布局,包括結構化數據、圖片、時間軸甚至交互組件。這些變化來自于Gemini 3對查詢的拆分與重組,再由生成式界面組合展示,背后依賴的是更強的意圖理解能力。

      此外,谷歌在這一代模型中主動強調了一個方向:Gemini 3 Pro在回答時更少迎合用戶,而更傾向于提供有信息密度的反饋。“降低迎合性”既對應今年的對話安全討論,也說明谷歌正在嘗試把“內容質量”變成產品特性,而不是語言風格。

      基于上述這些,不難發現,Gemini 3的意義并不僅僅在于“跑分領先多少”,而更多的是,它把能力重新組織成一個能堅持執行任務、能跨模態整合、能在真實環境中保持結構穩定的系統。對谷歌來說,這提出了一個與GPT系列不同的回答:AI不僅要強,更要穩;不僅要會生成,更要懂場景;不僅能理解界面,更要能在界面中持續行動。

      當然,接下來,Gemini 3能夠走多遠,所依仗的遠非這些看起來很漂亮的跑分和能力,而是在日常使用中,能有多少真正留得住的地方。

      Landing AI

      Landing AI是由動點科技策劃的一檔聚焦人工智能領域的專題報道欄目。通過對AI落地前景以及幕后故事的發掘,我們將在這一專題中深入淺出地探討關于AI新浪潮下的一切可能。

      本文為動點科技記者原創文章,未經授權不得轉載,如需轉載或開白請在后臺回復“轉載”。

      - - - - - - - - END - - - - - - - -

      *想要獲取行業資訊、和志同道合的科技愛好者們分享心得,那就趕快掃碼添加“動點君”加入群聊吧!群里更有不定期福利發放!

      精彩好文值得推薦

      一鍵轉發,戳個在看


      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      1月首款新機官宣:1月5日,正式發布

      1月首款新機官宣:1月5日,正式發布

      T科技衍生
      2026-01-02 00:05:35
      比你自己更懂你的,是 2025 年度報告。

      比你自己更懂你的,是 2025 年度報告。

      差評XPIN
      2026-01-01 00:19:13
      洛克希德·馬丁生產線停了,是中國凍結了他們在華的全部資產。

      洛克希德·馬丁生產線停了,是中國凍結了他們在華的全部資產。

      百態人間
      2025-12-31 16:18:36
      流量鬧劇,那只18斤重的大鵝,被拖下水的事件,終于水被抽干了

      流量鬧劇,那只18斤重的大鵝,被拖下水的事件,終于水被抽干了

      西樓知趣雜談
      2025-12-31 20:58:48
      女性“高潮”的秘密:別再假裝了,教你的伴侶如何帶你到達巔峰

      女性“高潮”的秘密:別再假裝了,教你的伴侶如何帶你到達巔峰

      精彩分享快樂
      2025-11-12 00:05:03
      2014前機關事業退休人員注意!國發2號文定待遇,這些細節別弄錯

      2014前機關事業退休人員注意!國發2號文定待遇,這些細節別弄錯

      冬天來旅游
      2026-01-01 15:09:55
      張雨綺穿吊帶看著骨架有點大哦!這大體格誰看了不喜歡?

      張雨綺穿吊帶看著骨架有點大哦!這大體格誰看了不喜歡?

      草莓解說體育
      2025-12-21 00:52:27
      郭德綱岳云鵬年輕時的同框合影,經典師生情,讓人羨慕

      郭德綱岳云鵬年輕時的同框合影,經典師生情,讓人羨慕

      民間平哥
      2025-12-31 16:41:28
      我是河南人,從臺灣回來,實在忍不住想說:臺灣給我的5點印象

      我是河南人,從臺灣回來,實在忍不住想說:臺灣給我的5點印象

      i書與房
      2026-01-01 16:58:55
      賣給越南一度電三四毛惹爭議

      賣給越南一度電三四毛惹爭議

      辣條叨叨叨
      2025-12-29 02:52:56
      美國洛克希德·馬丁公司突然宣布了

      美國洛克希德·馬丁公司突然宣布了

      安安說
      2026-01-01 14:29:53
      越南最新披露:中國軍隊滲透越南境內30公里,越南進至中國15公里

      越南最新披露:中國軍隊滲透越南境內30公里,越南進至中國15公里

      興趣知識
      2025-12-29 01:44:52
      原來是他娶了譚維維!被譽為“不老男神”,曾在海拔5600米上求婚

      原來是他娶了譚維維!被譽為“不老男神”,曾在海拔5600米上求婚

      韓馳
      2025-12-25 20:04:01
      5國圍攻中方,逼解放軍撤出臺海?不到24小時,普京政府下場助華

      5國圍攻中方,逼解放軍撤出臺海?不到24小時,普京政府下場助華

      老范談史
      2025-12-31 23:18:46
      “肋骨戳進內臟,腳趾全部被掰斷!”19歲青年疑陷緬北,兩度逃跑失敗,被索要100萬贖金

      “肋骨戳進內臟,腳趾全部被掰斷!”19歲青年疑陷緬北,兩度逃跑失敗,被索要100萬贖金

      19樓
      2025-12-06 08:43:19
      蔡正元:我要去坐牢了,判了三年半!背后的真相實在讓人憤怒無語

      蔡正元:我要去坐牢了,判了三年半!背后的真相實在讓人憤怒無語

      達文西看世界
      2026-01-01 14:04:27
      佳兆業集團成功賴賬601億元

      佳兆業集團成功賴賬601億元

      地產微資訊
      2026-01-01 21:45:45
      美國總統特朗普不查不知道,一查才知道他是美國史上最有錢的總統

      美國總統特朗普不查不知道,一查才知道他是美國史上最有錢的總統

      西樓知趣雜談
      2026-01-01 13:23:46
      準備開搶!美媒曬各隊理想交易目標:火箭5換1哈登+勇士6換1字母

      準備開搶!美媒曬各隊理想交易目標:火箭5換1哈登+勇士6換1字母

      鍋子籃球
      2026-01-01 18:18:36
      韓國圍棋徹底入冬,中國棋手連勝2名世冠闖進決賽,才19歲四段

      韓國圍棋徹底入冬,中國棋手連勝2名世冠闖進決賽,才19歲四段

      真理是我親戚
      2026-01-01 18:50:36
      2026-01-02 02:27:00
      動點科技 incentive-icons
      動點科技
      關注值得關注的科技創新
      25482文章數 148762關注度
      往期回顧 全部

      科技要聞

      特斯拉Model 3車主首度全程自駕橫穿美國

      頭條要聞

      收到情報后 盧卡申科“提醒普京不要赴會”

      頭條要聞

      收到情報后 盧卡申科“提醒普京不要赴會”

      體育要聞

      2026,這些英超紀錄可能會被打破

      娛樂要聞

      跑調風波越演越烈!沈佳潤被網友喊話

      財經要聞

      巴菲特「身退,權還在」

      汽車要聞

      一汽-大眾2025年整車銷量超158萬輛 燃油車市占率創新高

      態度原創

      家居
      本地
      藝術
      游戲
      公開課

      家居要聞

      無形有行 自然與靈感詩意

      本地新聞

      即將過去的2025年,對重慶的影響竟然如此深遠

      藝術要聞

      你絕對想不到,這位東方畫家竟將印象派推向巔峰!

      LPL最慘選手誕生!圈內主播爆料RNG離譜合同,LPL概念神陪玩掙錢

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 本溪| 亚洲男人天堂网| 亚州脚交| 国产女高清在线看免费观看 | 欧美性交网| 永嘉县| 伊人久久精品久久亚洲一区| 色噜噜狠狠色综合av| 亚洲婷婷综合色高清在线| 国模在线视频| 一本色道av| 久久99精品久久久久久9| 久久精品人妻中文系列| 91老肥熟女九色老女人| 内射网站| 麻豆国产97在线 | 欧洲| 精品久久久久久久久久久aⅴ| 国产成人精品1024免费下载| 小泽玛利亚一区| AV色色色| 无码精品国产一区二区三区免费| 中文字幕无码专区一VA亚洲V专| 91免费在线播放| 色噜噜亚洲精品中文字幕 | 国产爆乳无码av在线播放| 日韩全网av在线| 天堂中文字幕| 老河口市| 十八禁在线观看视频播放免费 | 日本视频一两二两三区| 最新99热| 免费国产女王调教在线视频 | 伊人毛片| 日韩av一区二区精品不卡| 无人区码一码二码w358cc| 日韩av在线不卡一区二区三区 | 九九热精彩视频在线免费| 久久久久久久久久久久无码| 五级黄高潮片90分钟视频| 国产又爽又黄又无遮挡的激情视频| 人妻少妇嫩草被猛烈进入无码蜜桃|