<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      會議軟件Zoom也來搞AI了,稱在AI最難考試上“擊敗”了Gemini 3

      0
      分享至

      最近,視頻會議軟件公司 Zoom 發布了一條出人意料的消息:他們宣稱在“人類最后的考試”(Humanity s Last Exam,簡稱 HLE)這個號稱當前 AI 領域最具挑戰性的基準測試上,取得了 48.1% 的成績,比此前由 Google Gemini 3 Pro(帶工具)保持的 45.8% 高出 2.3 個百分點。

      這是什么概念?一家做視頻會議起家的 SaaS 公司,跑去和 OpenAI、Anthropic、Google 這些 AI 前沿實驗室在同一張考卷上比分數,而且還贏了(至少按他們自己的說法)。

      消息一出,許多人的第一反應是:“誰,Zoom?”甚至有人好奇:“難道 Zoom 現在也是個前沿 AI 實驗室了?”


      圖丨相關評論(來源:X)

      不過且慢,仔細看看,這個“SOTA”(state-of-the-art,最先進水平)的含金量,恐怕需要打個問號。

      先說 HLE 這個基準測試到底是什么。它由 Scale AI 與 Center for AI Safety(CAIS,人工智能安全中心)聯合推出,包含 2,500 道由全球近千位學科專家貢獻的高難度問題,涵蓋數學、物理、生物醫學、人文社科、計算機科學等數十個領域。

      設計初衷是應對“基準飽和”問題:此前流行的 MMLU 等測試,頂級模型早已刷到 90% 以上,區分度幾乎喪失。HLE 的難度足以讓大多數當前模型的得分停留在個位數到兩位數低端,被稱為“為衡量 AI 進展而設計的最后一道封閉式學術測試”。

      那么 Zoom 是怎么做到的?

      根據 Zoom 首席技術官黃學東在官方博客中的介紹,核心在于他們的“聯邦 AI 方法”(Federated AI Approach)。這套架構的思路說起來并不復雜:不依賴單一大模型,而是把 Zoom 自研的小型語言模型(SLM,Small Language Model)與 OpenAI、Anthropic、Google 等公司的閉源和開源模型組合起來,通過一套叫做“Z-scorer”的自研評分系統來選擇或精煉不同模型的輸出。

      具體到這次 HLE 測試,Zoom 使用了一種名為“探索-驗證-聯邦”(explore–verify–federate)的智能體工作流:不是讓單一模型生成長鏈推理,而是策略性地識別最有價值的推理路徑,再由多個模型通過“辯證協作”來生成、挑戰、修正答案,最終整合全部上下文做出判斷。

      所以,Zoom 并沒有從頭訓練自己的前沿模型,只是在現有模型之上做了聚合和腳手架。這次 48.1% 的成績也并未出現在 HLE 官方排行榜上。Scale AI 維護的 HLE 官方榜單上,列出的是各家廠商提交的單一模型成績,而 Zoom 的“聯邦 AI 系統”嚴格來說是一個由多模型協作加自研編排層組成的復合系統。


      圖丨在 HLE 全集基準測試上的表現(來源:Zoom)

      有評論者直言,這不過是“把問題分發給三個頂尖模型,榨出幾個百分點的提升,然后宣稱自己達到 SOTA”的策略,確實是創意,但這跟“Zoom AI”本身有多大關系呢?

      就在 Zoom 發布公告的同一天,另一家名為 Sup AI 的初創公司宣布以 52.15% 的準確率超越了所有現有系統,同樣采用的是多模型編排方案。HLE 官方排行榜還沒來得及更新,這個“SOTA”就已經易主了。可見這種基于工具調用和模型聚合的測試成績,也是一個相當卷的競技場。

      那么 Zoom 為什么要做這件事?

      要回答這個問題,得先理解 Zoom 這幾年的處境。疫情紅利消退后,這家公司一直在尋找新的增長敘事,而 AI 成了最順理成章的選項,為此,Zoom 挖來在微軟工作 30 余年的黃學東擔任 CTO。


      圖丨黃學東(來源:WikiPedia)

      2023 年 9 月,Zoom 推出了 AI Companion 功能,提供會議摘要、待辦事項提取、實時問答等能力,并且對原付費用戶免費開放,無需額外加購。

      背后支撐這些功能的,正是 Zoom 所謂的聯邦 AI 架構。簡單說,他們不是一味調用最貴的模型來處理所有任務,而是建了一套路由機制:簡單任務交給自研的 20 億參數小模型,復雜任務才調用外部大模型;同時用 Z-scorer 來判斷初次輸出的質量,如果不達標再讓第二個模型來修正。這樣一來,每次 API 調用的平均成本就被壓下來了。Zoom 自己在 2023 年底宣稱,這套方案能以 GPT-4 約 6% 的推理成本達到接近的輸出質量。

      2024 年起,Zoom 進一步深化了這個思路。今年 10 月,他們與 NVIDIA 合作,把 Nemotron 推理模型接入了聯邦架構,并且自研了一個 490 億參數的中等規模 LLM。盡管規模不大,但足以在其所涉及的企業協作場景里把事情干得更穩、更快、更便宜。

      這其實也是 2024 年以來企業 AI 領域一個越來越清晰的趨勢。對于絕大多數 SaaS 公司來說,從頭訓練一個前沿大模型既不現實也沒必要。于是,它們面臨兩條路:要么深度綁定某一家大模型廠商,要么走多模型編排路線,在上層建立自己的調度和優化能力。

      Zoom 選擇了后者,而且走得相當激進。它不僅同時接入 OpenAI 和 Anthropic 的模型,還自研了用于特定任務的小模型,再加上 Perplexity 提供的網絡搜索能力。這套架構的好處是靈活:新模型出來了可以快速接入,不同任務可以選用最合適的模型,成本也可以通過靈活的策略來控制。

      所以,與其說 Zoom“戰勝”了 OpenAI 和 Google,不如說他們驗證了另一條路徑的可行性:不造巨型模型,而是做好模型的調度和協同。

      誰能把不同模型、工具調用、企業數據與工作流拼成穩定、可控、高質量的生產力輸出,誰就能在企業市場占據優勢。這和微軟 CEO 納德拉提出的“AI 成為業務應用的邏輯編排層”思路一致,也類似于 Salesforce 試圖通過 Agentforce 把 AI Agent 深度嵌入 CRM 流程的策略。

      只不過,微軟背后有 Azure 和 OpenAI,Salesforce 有自己的 Data Cloud 和收購來的技術資產,而 Zoom 的護城河主要在于它龐大的會議用戶基礎和對“會議場景”的深度理解。

      這家公司在 2025 年 9 月的 Zoomtopia 大會上正式發布了 AI Companion 3.0,主打智能體 AI(Agentic AI)能力:不僅能總結會議、提取待辦事項,還能主動分析日程、自動安排會議、跨平臺(包括 Microsoft Teams 和 Google Meet)抓取信息、與 ServiceNow 等第三方 Agent 協作。黃學東將其定位為從“被動助手”到“主動協作者”的躍遷。

      按 Zoom 的說法,這套系統底層依然是聯邦多模型架構,前端則通過統一的 AI Companion 入口呈現給用戶。

      這意味著什么?意味著 Zoom 正在把 AI 能力從單點功能升級為平臺級服務。它不再滿足于“幫你總結會議”,而是試圖成為企業工作流中的 AI 中樞,一個能夠理解上下文、調用多種模型和工具、在不同應用間穿梭執行任務的智能層。這和微軟、Salesforce、ServiceNow 等巨頭的愿景高度重合,只不過各家的起點和路徑不同。

      在大模型能力快速商品化的背景下,差異化競爭的焦點正在向“編排能力”和“場景整合能力”轉移。訓練一個萬億參數的基礎模型需要數億美元和數萬塊 GPU,這注定是少數玩家的游戲;但如何把現有模型用好、用對、用便宜,這是每一家企業軟件公司都可以、也必須認真思考的問題。Zoom 的聯邦 AI 路線,本質上是對后一個問題的回答。

      參考資料:

      1.https://www.zoom.com/en/blog/humanitys-last-exam-zoom-ai-breakthrough/?utm_source=social&utm_medium=organic-social

      2.https://www.zoom.com/en/blog/federated-ai-approach-best-quality-for-most-popular-features/?utm_source=social&utm_medium=organic-social&DeviceId=92a0a21e-4914-432c-b54c-91f0bcba09eb&SessionId=1765775112166

      運營/排版:何晨龍

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      志愿軍三個副司令,回國后三種命:鄧華跌得最慘,韓先楚穩坐23年,只有他活成了兩代上將

      志愿軍三個副司令,回國后三種命:鄧華跌得最慘,韓先楚穩坐23年,只有他活成了兩代上將

      文史明鑒
      2025-12-12 21:08:17
      鄒兆龍憑什么拿《黑客帝國》分紅?因為劇組一個條件,只有他答應

      鄒兆龍憑什么拿《黑客帝國》分紅?因為劇組一個條件,只有他答應

      一盅情懷
      2025-12-13 15:00:04
      《阿凡達3》票房破千萬,用時24小時,20億票房夢要碎了

      《阿凡達3》票房破千萬,用時24小時,20億票房夢要碎了

      影視高原說
      2025-12-13 14:00:34
      iPhone17中國市場賣爆:激活量已達1329.53萬臺,市場份額飆升至25%?

      iPhone17中國市場賣爆:激活量已達1329.53萬臺,市場份額飆升至25%?

      王爺說圖表
      2025-12-14 19:16:40
      金晨發文悼念何晴:給過溫暖的媽媽!“母后”一路走好!

      金晨發文悼念何晴:給過溫暖的媽媽!“母后”一路走好!

      小娛樂悠悠
      2025-12-15 10:10:40
      眾星悼念何晴,黃綺珊十年前就為何晴祈禱,劉威半輩子都走不出

      眾星悼念何晴,黃綺珊十年前就為何晴祈禱,劉威半輩子都走不出

      好賢觀史記
      2025-12-15 09:33:38
      兒子留學英國順便結了個婚,7年后老兩口去探親,見到兒媳傻眼了

      兒子留學英國順便結了個婚,7年后老兩口去探親,見到兒媳傻眼了

      卡西莫多的故事
      2025-11-21 10:03:44
      夏洛特公主圣誕造型致敬戴安娜!40年時尚影響力今何在?

      夏洛特公主圣誕造型致敬戴安娜!40年時尚影響力今何在?

      最英國
      2025-12-14 18:06:18
      深度揭秘?|?職務犯罪中,你的手機真的被監聽了嗎?揭秘監委技術調查真相!

      深度揭秘?|?職務犯罪中,你的手機真的被監聽了嗎?揭秘監委技術調查真相!

      一分為三看人生
      2025-12-15 00:07:43
      詹姆斯太強!三分有紀錄遠超庫里!得分有紀錄遠超喬丹!

      詹姆斯太強!三分有紀錄遠超庫里!得分有紀錄遠超喬丹!

      氧氣是個地鐵
      2025-12-15 17:08:09
      被中國拒絕,美國開始不適應了!

      被中國拒絕,美國開始不適應了!

      達文西看世界
      2025-12-15 12:37:57
      鐵幕下的希望:烏克蘭堅決抗俄并向美甩出王炸

      鐵幕下的希望:烏克蘭堅決抗俄并向美甩出王炸

      書生論劍
      2025-12-13 00:44:49
      父子在悉尼海灘槍擊致16人死亡,兒子涉嫌和恐怖組織有關,案發前致電母親稱剛游完泳

      父子在悉尼海灘槍擊致16人死亡,兒子涉嫌和恐怖組織有關,案發前致電母親稱剛游完泳

      紅星新聞
      2025-12-15 12:17:18
      貴州茅臺回應將推出“控量”政策:仍在研究中 具體策略可能會在28日左右的渠道商聯誼會上正式發布

      貴州茅臺回應將推出“控量”政策:仍在研究中 具體策略可能會在28日左右的渠道商聯誼會上正式發布

      財聯社
      2025-12-15 13:04:04
      瘋了!單場4紅牌!豪門15輪不勝+墊底!賽后全隊沉默抗議

      瘋了!單場4紅牌!豪門15輪不勝+墊底!賽后全隊沉默抗議

      足球大號
      2025-12-15 14:58:49
      婚前老公問工資我隨口答1萬2,婚后第二天他竟要我每月交1萬家用

      婚前老公問工資我隨口答1萬2,婚后第二天他竟要我每月交1萬家用

      曉艾故事匯
      2025-12-05 17:18:12
      為取麝香,三名男子獵殺9只國家一級保護動物馬麝,警方披露:夜間利用無人機捕獵,高薪聘請專業“飛手”

      為取麝香,三名男子獵殺9只國家一級保護動物馬麝,警方披露:夜間利用無人機捕獵,高薪聘請專業“飛手”

      揚子晚報
      2025-12-14 07:55:03
      訂單不足!惠州一工廠放假近6個月,購買五險一金并支付生活費…

      訂單不足!惠州一工廠放假近6個月,購買五險一金并支付生活費…

      火山詩話
      2025-12-15 14:20:10
      王子文吃虧在個子太矮了,這雙“恨天高”也挽救不了她的身高。

      王子文吃虧在個子太矮了,這雙“恨天高”也挽救不了她的身高。

      手工制作阿殲
      2025-12-15 11:44:45
      陳夢也沒想到,孫穎莎1日3賽傷退之后,她的口碑意外實現“暴增”

      陳夢也沒想到,孫穎莎1日3賽傷退之后,她的口碑意外實現“暴增”

      李健政觀察
      2025-12-15 09:17:33
      2025-12-15 19:51:00
      DeepTech深科技 incentive-icons
      DeepTech深科技
      麻省理工科技評論獨家合作
      15995文章數 514399關注度
      往期回顧 全部

      科技要聞

      大佬冷酷預言:未來15年 人形機器人成廢鐵

      頭條要聞

      霸王茶姬創始人與"光伏二代"舉辦婚禮 兩人穿中式婚服

      頭條要聞

      霸王茶姬創始人與"光伏二代"舉辦婚禮 兩人穿中式婚服

      體育要聞

      戰勝完全體雷霆,馬刺“瘋狂動物城”只是半成品

      娛樂要聞

      何晴告別式現場,前夫許亞軍雙眼泛紅?

      財經要聞

      新農合漲到400元 農民斷繳背后的扎心真相

      汽車要聞

      主駕配按摩還可選6座 新款捷途X90PRO售13.59萬起

      態度原創

      教育
      時尚
      親子
      數碼
      本地

      教育要聞

      如何實現小初高貫通培養?北京七所學校亮出“新打法” | 現教沙龍

      伊姐周日熱推:電視劇《老舅》;電視劇《啞舍》......

      親子要聞

      加碼“低敏”賽道!海普諾凱能立多全新升級,以科研實證回應“敏寶”家庭剛需

      數碼要聞

      內存漲價潮愈演愈烈,博主稱明年中端新機將取消1TB版本

      本地新聞

      云游安徽|阜陽三朝風骨,傳承千年墨香

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 大香蕉资源网 | 四虎国产精品成人免费久久| 亚洲国产日韩a在线播放| 99久久99久久精品免费看小说。| 清流县| 亚洲 欧美 综合 在线 精品| 艳妇乳肉豪妇荡乳| 久久天天躁夜夜躁狠狠85| 超碰10000| 亚洲国产系列| 中文人妻熟妇乱又伦精品| 嫩草研究院久久久精品| 中文字幕在线一区| 罗平县| 国产真实野战在线视频| 亚洲国产精品无码久久一区二区| 国产精品护士| 谢通门县| 亚洲熟妇少妇任你躁在线观看无码| 婷婷五月激情综合| 超级碰碰碰| 旅游| 青草精品国产福利在线视频| 婷婷伊人綜合中文字幕小说 | 精精国产xxx在线观看| 97久草| 久久ww| 丁香色婷婷国产精品视频| 国产成人精品无码一区二区老年人| 人人操操| 亚洲色综网| 人妻一本久道久久综合久久鬼色 | 人人操网| 四虎精品免费永久免费视频| 日本丰满熟妇乱子伦| 久久av高潮av无码av喷吹| 崇阳县| 好了av四色综合无码| 狠狠躁夜夜躁人人爽天天bl| 欧美精品99久久久| 激情五月久久|