<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      商湯絕影發(fā)布端側多模態(tài)智能體基座大模型Sage ,PinchBench實測94%最佳任務完成率領跑主流大模型

      0
      分享至

      【TechWeb】2026 年 4 月 22 日——商湯絕影正式發(fā)布端側多模態(tài)智能體基座大模型 Sage。Sage 采用 MoE 架構,總參數(shù)量為 32B,激活參數(shù)僅 3B ,是行業(yè)內(nèi)首款在車端實現(xiàn)復雜智能體能力的基座大模型,在 PinchBench 上性能領跑全球一線云端大模型,已在英偉達 Orin X 端側平臺實現(xiàn)部署。

      AI 全面進入智能體時代,而汽車的復雜智能體能力依賴云端,端側模型受算力與參數(shù)限制,僅能實現(xiàn)簡單指令響應。智能座艙因此陷入兩難,依賴云端則有延遲與高 Token 成本,堅守端側則缺失真正智能體能力。Sage 的發(fā)布打破這一格局,首次將云端級智能體能力落地端側。

      作為端側智能體基座,Sage 可接入 OpenClaw、Hermes 等主流 Agent 框架,為更多端側智能體落地提供核心支撐,可覆蓋出行、家庭等全場景。

      Sage 的實力,已在國際公開評測中得到印證。在公開 Agent 評測基準 PinchBench 中,Sage 端側大模型最佳任務完成率達到 94%,超越Claude-Opus-4.6(93.3%)、Claude-Sonnet-4.6(88.0%)、GPT-5.4(90.5%)、Google-Gemini-3(87.0%)、Google-Gemma-4(83.9%)、Qwen3.5-27B(90.0%)、MiniMax-M2.7(89.8%)、MiMo-v2-Pro(87.4%)等國際主流云側和端側大模型。

      Sage 以僅3B激活的小參數(shù)量,超越眾多大參數(shù)量云側旗艦,打破 “只有大模型才能做好智能體任務” 的慣性認知,彰顯端側原生技術路線的高效優(yōu)勢。以 小米MiMo-v2-Pro 為例,其激活參數(shù)為 42B、總參數(shù)規(guī)模超 1T,而 Sage 激活參數(shù)僅 3B,所需激活算力僅為其 1/14;若按模型權重規(guī)模近似估算,顯存占用約為其 1/31,但在 PinchBench 上的最佳任務完成率仍高出 6.6 個百分點。

      PinchBench 是龍蝦之父Peter Steinberger推薦的公開 Agent 評測基準。作為面向真實 Agent工作流的評測榜單,PinchBench 不依賴固定不變的靜態(tài)題庫,而是隨著公開任務庫持續(xù)擴充和版本迭代不斷演進。其公開任務庫覆蓋寫作、研究、編碼、分析、郵件、文件處理、日程管理、記憶與技能調(diào)用等典型場景,重點考察模型在工具調(diào)用、多步推理和任務閉環(huán)執(zhí)行中的綜合能力。

      與此同時,PinchBench 評測要求模型完成真實任務執(zhí)行,并綜合衡量成功率、速度與成本,因此測試周期更長、資源消耗更高,單任務token消耗就可達數(shù)十萬量級。正因如此,模型在 PinchBench 上取得的精度表現(xiàn),更能體現(xiàn)其在復雜真實場景中的綜合能力與穩(wěn)定性。

      在北京車展期間,商湯絕影將正式推出搭載 Sage 端側多模態(tài)智能體基座大模型的Sage Box,為汽車邁入超級智能體時代筑牢核心根基。

      憑借兩大黑科技,Sage 讓座艙從“聽懂指令”到“說到做到”

      Sage 端側大模型在 PinchBench跑贏一眾國際主流云/端大模型背后真正的功臣,是商湯絕影圍繞 Sage 后訓練階段自研的兩項關鍵技術:SCOUT 和 ERL。

      以 SCOUT 和 ERL 為核心的后訓練技術體系,一項讓模型"學得又快又省",一項讓模型"做事不出錯",重點突破智能體在學習效率、訓練成本和復雜任務穩(wěn)定執(zhí)行上的行業(yè)挑戰(zhàn),解決了讓車載大模型從"能聽懂指令"進化到"能獨立辦成一件復雜的事"的行業(yè)公認難題。

      SCOUT:讓大模型學復雜任務,省 60% 算力

      SCOUT(Sub-Scale Collaboration On Unseen Tasks,分級協(xié)同學習框架) 技術重點解決大模型學習復雜出行場景任務時成本高、試錯慢的問題,在復雜任務能力注入過程中可節(jié)省約 60% 的 GPU 小時消耗。

      很多任務涉及空間規(guī)劃、設備聯(lián)動、多步?jīng)Q策,直接讓大模型自己試錯學習,既慢又燒算力。SCOUT 的思路是"探路與吸收解耦"——先派一個輕量小模型快速在任務里跑一遍,把走得通的路徑篩出來,再把這些高價值經(jīng)驗喂給大模型學習,形成"小模型先探路,大模型再吸收"的學習機制,在降低訓練成本的同時,也能夠快速掌握更多真實用車場景技能。

      ERL:讓模型自己擦掉錯誤步驟,任務成功率提升 20%

      已被機器學習頂級會議 ICLR 2026 收錄的ERL(Erasable Reinforcement Learning,可擦除強化學習) 技術,聚焦復雜任務鏈路中的錯誤識別與糾偏。用戶在真實使用中提出的需求,往往需要模型跨多個步驟完成推理和執(zhí)行,中間一旦某一步出現(xiàn)偏差,整個任務流程就可能失效。

      ERL 讓模型能夠自動識別推理過程中的錯誤步驟,對錯誤內(nèi)容進行擦除并重新生成,從源頭阻斷偏差擴散,就像給模型裝上了"邊想邊糾錯"的能力。這項技術讓 Sage 在多跳復雜推理基準上較此前 SOTA 取得顯著提升,裝車后 Sage 在復雜任務上的完成率提升了 20%。

      SCOUT 和 ERL 兩項技術前后協(xié)同共同推動 Sage 從語言大模型演進為能夠獨立完成復雜任務的智能體。疊加一體化多模態(tài)架構與原生訓練數(shù)據(jù)的優(yōu)勢,Sage 在能力、成本與量產(chǎn)可行性之間取得了平衡,為打造智能體中樞提供了核心 AI 支撐。

      端側跑出全球領先能力,Sage 定義智能上限

      如果說 PinchBench 94% 的任務完成率證明了 Sage 能"辦成復雜的事",那么真正決定座艙體驗的,是模型在各個專業(yè)維度上是不是都"夠用、夠穩(wěn)、夠聰明"。不同能力維度的公開基準上,Sage 全面領先本月最新發(fā)布的同量級端側旗艦模型 Google-Gemma4,把端側模型的能力天花板抬到了一個新的水位。

      MMLU Pro(跨學科專業(yè)知識)測試中,Sage 獲 76 分,領先同級端側模型約 10%,證明端側模型具備云端級通用知識密度;GPQA Diamond(研究生級專業(yè)推理)測試中,Sage 獲得 77 分,提升 33%,凸顯復雜推理深度;Human Semantic Understanding(座艙語義與視覺理解)測試中獲 91 分,提升 32%,依托原生數(shù)據(jù)建立獨特優(yōu)勢。

      在重點考察任務執(zhí)行能力的 τ2-bench(工具調(diào)用與任務閉環(huán))基準上,Sage 以 80 分的成績相較 Gemma 4 實現(xiàn) 38% 的提升,接近翻倍領先。這項基準專門評估模型調(diào)用工具、走完多步任務的實戰(zhàn)能力,也是區(qū)分"會聊天的模型"與"會辦事的智能體"的關鍵分水嶺。τ2-bench 上近一倍的領先,直接印證了 Sage 作為端側智能體基座在真實任務執(zhí)行環(huán)節(jié)上的絕對優(yōu)勢。

      從專業(yè)基準到場景體驗:Sage 真正"懂場景、會思考、能服務"

      這些專業(yè)能力落到真實車艙,轉化為一組直接影響用戶體驗的指標:Sage 場景推理精度超過 90%,長鏈路工具調(diào)用、邏輯規(guī)劃、環(huán)境感知任務成功率分別達 92%、89%、94%,復雜指令遵循率提升 40%。

      在 Orin X 平臺部署下,Sage 可實現(xiàn)首字響應(TTFT)約0.5秒、單 Token 推理延遲(TPOT)低至0.03秒、生成吞吐達到80 tk/S,平均任務時長優(yōu)于主流API 模型,為座艙智能體提供穩(wěn)定、實時、可持續(xù)在線的運行能力。

      模型可以一次性解析用戶的復合指令,自動聯(lián)動空調(diào)、影音、導航等車載系統(tǒng)完成任務閉環(huán);結合傳感器對乘員狀態(tài)與路況的感知,還能主動提供兒童模式、智能路線調(diào)整等服務。Sage 不再是"被動喚醒、單次響應"的語音助手,而是一個真正懂場景、會思考、能服務的出行伙伴。

      商湯絕影 Sage 端側多模態(tài)智能體基座大模型為艙駕一體方案打通了量產(chǎn)可行的模型路徑,打破了技術與落地之間的壁壘,推動智能座艙從基礎交互向高階艙駕融合智能體服務跨越。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      廣東女大學生被騙緬甸,對方威脅不給錢就輪奸,家人湊20萬卻無果

      廣東女大學生被騙緬甸,對方威脅不給錢就輪奸,家人湊20萬卻無果

      娛樂團長
      2026-04-24 10:14:00
      從金球先生到只剩6歐元!半數(shù)球星退役5年就破產(chǎn),原因不在亂花錢

      從金球先生到只剩6歐元!半數(shù)球星退役5年就破產(chǎn),原因不在亂花錢

      草莓解說體育
      2026-04-23 12:09:25
      我結扎10年,44歲妻子突然懷孕,我沒鬧,親子鑒定結果讓我懵了

      我結扎10年,44歲妻子突然懷孕,我沒鬧,親子鑒定結果讓我懵了

      云端小院
      2026-04-23 06:33:40
      日本專家表示:如果中日戰(zhàn)真的發(fā)生了,日本老百姓根本不需要害怕

      日本專家表示:如果中日戰(zhàn)真的發(fā)生了,日本老百姓根本不需要害怕

      安安說
      2026-04-23 11:40:47
      東莞5歲男孩公園內(nèi)被14歲少年騎電動車撞致頭骨骨折,當?shù)刈钚禄貞?>
    </a>
        <h3>
      <a href=瀟湘晨報
      2026-04-24 17:06:18
      許世友攜槍赴京悼念毛主席,遭機長拒飛,他質(zhì)問是誰下的命令?

      許世友攜槍赴京悼念毛主席,遭機長拒飛,他質(zhì)問是誰下的命令?

      輿圖看世界
      2026-04-05 12:35:06
      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      蘇州一對情侶,談了7年,女子提了18次分手,分手后在街頭痛哭!

      川渝視覺
      2026-04-17 22:13:14
      楊蘭蘭最新:不上課、不社交、英語差,喜歡買買買,香奈兒VVIP

      楊蘭蘭最新:不上課、不社交、英語差,喜歡買買買,香奈兒VVIP

      麥大人
      2025-10-09 16:23:06
      卡里克周一已會晤拉爵,回應曼聯(lián)轉正期限問題!不介意被對比索帥

      卡里克周一已會晤拉爵,回應曼聯(lián)轉正期限問題!不介意被對比索帥

      羅米的曼聯(lián)博客
      2026-04-24 12:05:08
      騎士G3慘敗賽后采訪:米切爾讓大家放寬心,全隊找出失利原因

      騎士G3慘敗賽后采訪:米切爾讓大家放寬心,全隊找出失利原因

      行舟問茶
      2026-04-24 18:08:23
      每月開銷2萬被罵敗家,兒媳撂攤子后婆婆罵道:你不賺錢,誰養(yǎng)家

      每月開銷2萬被罵敗家,兒媳撂攤子后婆婆罵道:你不賺錢,誰養(yǎng)家

      清水家庭故事
      2026-04-23 17:49:52
      《尋秦記》虧損后,古天樂不甘心,聯(lián)手5大影帝,再救港片一把

      《尋秦記》虧損后,古天樂不甘心,聯(lián)手5大影帝,再救港片一把

      八斗小先生
      2026-04-24 12:05:35
      18歲女孩奶茶店打暑假工 辭職后因店里繁忙被臨時召回 上班途中遇車禍搶救3個月不幸身亡

      18歲女孩奶茶店打暑假工 辭職后因店里繁忙被臨時召回 上班途中遇車禍搶救3個月不幸身亡

      閃電新聞
      2026-04-24 12:14:16
      搞權錢交易、“靠校吃校”,東莞一學校原副校長被“雙開”

      搞權錢交易、“靠校吃校”,東莞一學校原副校長被“雙開”

      南方都市報
      2026-04-24 11:24:30
      至少在已經(jīng)過去的25年里,中國的“財神”不是趙公明,而是WTO!

      至少在已經(jīng)過去的25年里,中國的“財神”不是趙公明,而是WTO!

      細雨中的呼喊
      2026-02-21 06:59:07
      中小學春秋假全面落地!2026年新政:孩子放假,家長帶薪同步休

      中小學春秋假全面落地!2026年新政:孩子放假,家長帶薪同步休

      手工制作阿愛
      2026-04-24 16:07:01
      波濤洶涌的“地球小姐”!

      波濤洶涌的“地球小姐”!

      文刀萬
      2026-04-24 12:44:49
      臺灣專家賴岳謙:印度確實有一點比中國強很多,那就是——嘴。

      臺灣專家賴岳謙:印度確實有一點比中國強很多,那就是——嘴。

      荊楚寰宇文樞
      2026-04-22 23:16:37
      鄭麗文成功了!國民黨3位元老出山,朱立倫的反撲計劃宣告失敗

      鄭麗文成功了!國民黨3位元老出山,朱立倫的反撲計劃宣告失敗

      愛看劇的阿峰
      2026-04-24 17:16:33
      回爐再造!北京推全日制大學生技師班,網(wǎng)友:如今缺少的就是技工

      回爐再造!北京推全日制大學生技師班,網(wǎng)友:如今缺少的就是技工

      火山詩話
      2026-04-24 06:42:52
      2026-04-24 18:36:49
      TechWeb incentive-icons
      TechWeb
      做有態(tài)度的互聯(lián)網(wǎng)資訊。
      17441文章數(shù) 43083關注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價格依然"屠夫級"

      頭條要聞

      媒體:伊朗將恢復往返中國航班 霍爾木茲決戰(zhàn)或收兵了

      頭條要聞

      媒體:伊朗將恢復往返中國航班 霍爾木茲決戰(zhàn)或收兵了

      體育要聞

      里程碑之戰(zhàn)拖后腿,哈登18分8失誤

      娛樂要聞

      停工16個月!趙露思證實接拍新劇

      財經(jīng)要聞

      19家企業(yè)要"鋁代銅",格力偏不

      汽車要聞

      零跑Lafa5 Ultra北京車展上市:11.88-12.48萬

      態(tài)度原創(chuàng)

      親子
      游戲
      手機
      本地
      公開課

      親子要聞

      4歲小孩當老師,來上一堂情緒管理課

      數(shù)毛社銳評PS獨占第一方新作!虛幻5粒子特效天花板

      手機要聞

      Nothing OS 4.1發(fā)布,看看更新了啥?

      本地新聞

      云游中國|逛世界風箏都 留學生探秘中國傳統(tǒng)文化

      公開課

      李玫瑾:為什么性格比能力更重要?

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 99视频精品全部免费 在线| 亚洲综合精品中文字幕| 久久综合综合久久综合| 三浦在线| 精品婷婷色一区二区三区蜜桃| 亚洲午夜亚洲精品国产成人| 久色精品国产亚洲av麻豆一| 99热精这里只有精品| 久久中文字幕无码一区二区| 18岁日韩内射颜射午夜久久成人| 麻豆色漫| 99免费精品| 亚洲男人在线| 国产无套视频在线观看香蕉| 国产亚洲人成网站在线观看| 国产精品一区久久av| 亚洲色婷婷| 国产亚洲AV电影院之毛片| 人妻无码一区二区三区免费| 会泽县| 久久久久久曰本av免费免费| 日本成人有码在线视频| 色综合久久88色综合天天| A片网| 国产caonila在线观看| 国产AV巨作丝袜秘书| 久久一本精品久久久ー99| 亚洲精品成人区在线观看| 在线一区二区三区人妻| 精品人伦一区二区三区潘金莲| 女人高潮被爽到呻吟观看| 欧美午夜精品一区二区三区电影| 精品国产免费一区二区三区香蕉| 亚洲精品无码乱码成人| 亚洲性爱电影| 国产高清在线a视频大全| 亚洲中文视频| 高清国产精品人妻一区二区| 91免费视频网| 无码人妻精品一区二区三区不卡 | 亚洲阿v天堂网2021|