<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文 申請(qǐng)入駐

      商湯絕影發(fā)布端側(cè)多模態(tài)智能體基座大模型Sage

      0
      分享至

      2026 年 4 月 22 日——商湯絕影正式發(fā)布端側(cè)多模態(tài)智能體基座大模型 Sage。Sage 采用 MoE 架構(gòu),總參數(shù)量為 32B,激活參數(shù)僅 3B ,是行業(yè)內(nèi)首款在車端實(shí)現(xiàn)復(fù)雜智能體能力的基座大模型,在 PinchBench 上性能領(lǐng)跑全球一線云端大模型,已在英偉達(dá) Orin X 端側(cè)平臺(tái)實(shí)現(xiàn)部署。

      AI 全面進(jìn)入智能體時(shí)代,而汽車的復(fù)雜智能體能力依賴云端,端側(cè)模型受算力與參數(shù)限制,僅能實(shí)現(xiàn)簡(jiǎn)單指令響應(yīng)。智能座艙因此陷入兩難,依賴云端則有延遲與高 Token 成本,堅(jiān)守端側(cè)則缺失真正智能體能力。Sage 的發(fā)布打破這一格局,首次將云端級(jí)智能體能力落地端側(cè)。

      作為端側(cè)智能體基座,Sage 可接入 OpenClaw、Hermes 等主流 Agent 框架,為更多端側(cè)智能體落地提供核心支撐,可覆蓋出行、家庭等全場(chǎng)景。

      Sage 的實(shí)力,已在國(guó)際公開評(píng)測(cè)中得到印證。在公開 Agent 評(píng)測(cè)基準(zhǔn) PinchBench 中,Sage 端側(cè)大模型最佳任務(wù)完成率達(dá)到 94%,超越Claude-Opus-4.6(93.3%)、Claude-Sonnet-4.6(88.0%)、GPT-5.4(90.5%)、Google-Gemini-3(87.0%)、Google-Gemma-4(83.9%)、Qwen3.5-27B(90.0%)、MiniMax-M2.7(89.8%)、MiMo-v2-Pro(87.4%)等國(guó)際主流云側(cè)和端側(cè)大模型。



      Sage 以僅3B激活的小參數(shù)量,超越眾多大參數(shù)量云側(cè)旗艦,打破 “只有大模型才能做好智能體任務(wù)” 的慣性認(rèn)知,彰顯端側(cè)原生技術(shù)路線的高效優(yōu)勢(shì)。以 小米MiMo-v2-Pro 為例,其激活參數(shù)為 42B、總參數(shù)規(guī)模超 1T,而 Sage 激活參數(shù)僅 3B,所需激活算力僅為其 1/14;若按模型權(quán)重規(guī)模近似估算,顯存占用約為其 1/31,但在 PinchBench 上的最佳任務(wù)完成率仍高出 6.6 個(gè)百分點(diǎn)。


      PinchBench 是龍蝦之父Peter Steinberger推薦的公開 Agent 評(píng)測(cè)基準(zhǔn)。作為面向真實(shí) Agent工作流的評(píng)測(cè)榜單,PinchBench 不依賴固定不變的靜態(tài)題庫(kù),而是隨著公開任務(wù)庫(kù)持續(xù)擴(kuò)充和版本迭代不斷演進(jìn)。其公開任務(wù)庫(kù)覆蓋寫作、研究、編碼、分析、郵件、文件處理、日程管理、記憶與技能調(diào)用等典型場(chǎng)景,重點(diǎn)考察模型在工具調(diào)用、多步推理和任務(wù)閉環(huán)執(zhí)行中的綜合能力。

      與此同時(shí),PinchBench 評(píng)測(cè)要求模型完成真實(shí)任務(wù)執(zhí)行,并綜合衡量成功率、速度與成本,因此測(cè)試周期更長(zhǎng)、資源消耗更高,單任務(wù)token消耗就可達(dá)數(shù)十萬(wàn)量級(jí)。正因如此,模型在 PinchBench 上取得的精度表現(xiàn),更能體現(xiàn)其在復(fù)雜真實(shí)場(chǎng)景中的綜合能力與穩(wěn)定性。

      在北京車展期間,商湯絕影將正式推出搭載 Sage 端側(cè)多模態(tài)智能體基座大模型的Sage Box,為汽車邁入超級(jí)智能體時(shí)代筑牢核心根基。

      憑借兩大黑科技,Sage 讓座艙從聽懂指令”到“說(shuō)到做到

      Sage 端側(cè)大模型在 PinchBench跑贏一眾國(guó)際主流云/端大模型背后真正的功臣,是商湯絕影圍繞 Sage 后訓(xùn)練階段自研的兩項(xiàng)關(guān)鍵技術(shù):SCOUT 和 ERL。

      以 SCOUT 和 ERL 為核心的后訓(xùn)練技術(shù)體系,一項(xiàng)讓模型"學(xué)得又快又省",一項(xiàng)讓模型"做事不出錯(cuò)",重點(diǎn)突破智能體在學(xué)習(xí)效率、訓(xùn)練成本和復(fù)雜任務(wù)穩(wěn)定執(zhí)行上的行業(yè)挑戰(zhàn),解決了讓車載大模型從"能聽懂指令"進(jìn)化到"能獨(dú)立辦成一件復(fù)雜的事"的行業(yè)公認(rèn)難題。

      SCOUT:讓大模型學(xué)復(fù)雜任務(wù),省 60% 算力

      SCOUT(Sub-Scale Collaboration On Unseen Tasks,分級(jí)協(xié)同學(xué)習(xí)框架) 技術(shù)重點(diǎn)解決大模型學(xué)習(xí)復(fù)雜出行場(chǎng)景任務(wù)時(shí)成本高、試錯(cuò)慢的問(wèn)題,復(fù)雜任務(wù)能力注入過(guò)程中可節(jié)省約 60% 的 GPU 小時(shí)消耗

      很多任務(wù)涉及空間規(guī)劃、設(shè)備聯(lián)動(dòng)、多步?jīng)Q策,直接讓大模型自己試錯(cuò)學(xué)習(xí),既慢又燒算力。SCOUT 的思路是"探路與吸收解耦"——先派一個(gè)輕量小模型快速在任務(wù)里跑一遍,把走得通的路徑篩出來(lái),再把這些高價(jià)值經(jīng)驗(yàn)喂給大模型學(xué)習(xí),形成"小模型先探路,大模型再吸收"的學(xué)習(xí)機(jī)制,在降低訓(xùn)練成本的同時(shí),也能夠快速掌握更多真實(shí)用車場(chǎng)景技能。

      (上述技術(shù)成果論文已上傳arXiv:https://arxiv.org/abs/2601.21754)

      ERL:讓模型自己擦掉錯(cuò)誤步驟,任務(wù)成功率提升 20%

      被機(jī)器學(xué)習(xí)頂級(jí)會(huì)議 ICLR 2026 收錄ERL(Erasable Reinforcement Learning,可擦除強(qiáng)化學(xué)習(xí)) 技術(shù)聚焦復(fù)雜任務(wù)鏈路中的錯(cuò)誤識(shí)別與糾偏。用戶在真實(shí)使用中提出的需求,往往需要模型跨多個(gè)步驟完成推理和執(zhí)行,中間一旦某一步出現(xiàn)偏差,整個(gè)任務(wù)流程就可能失效。

      ERL 讓模型能夠自動(dòng)識(shí)別推理過(guò)程中的錯(cuò)誤步驟,對(duì)錯(cuò)誤內(nèi)容進(jìn)行擦除并重新生成,從源頭阻斷偏差擴(kuò)散,就像給模型裝上了"邊想邊糾錯(cuò)"的能力。這項(xiàng)技術(shù)讓 Sage 在多跳復(fù)雜推理基準(zhǔn)上較此前 SOTA 取得顯著提升,裝車后 Sage 在復(fù)雜任務(wù)上的完成率提升了 20%

      (上述技術(shù)成果論文已上傳arXiv:https://arxiv.org/abs/2510.00861)

      SCOUT 和 ERL 兩項(xiàng)技術(shù)前后協(xié)同共同推動(dòng) Sage 從語(yǔ)言大模型演進(jìn)為能夠獨(dú)立完成復(fù)雜任務(wù)的智能體。疊加一體化多模態(tài)架構(gòu)與原生訓(xùn)練數(shù)據(jù)的優(yōu)勢(shì),Sage 在能力、成本與量產(chǎn)可行性之間取得了平衡,為打造智能體中樞提供了核心 AI 支撐。

      端側(cè)跑出全球領(lǐng)先能力,Sage 定義智能上限

      如果說(shuō) PinchBench 94% 的任務(wù)完成率證明了 Sage 能"辦成復(fù)雜的事",那么真正決定座艙體驗(yàn)的,是模型在各個(gè)專業(yè)維度上是不是都"夠用、夠穩(wěn)、夠聰明"。不同能力維度的公開基準(zhǔn)上,Sage 全面領(lǐng)先本月最新發(fā)布的同量級(jí)端側(cè)旗艦?zāi)P?Google-Gemma4,把端側(cè)模型的能力天花板抬到了一個(gè)新的水位。

      MMLU Pro(跨學(xué)科專業(yè)知識(shí))測(cè)試中,Sage 獲 76 分,領(lǐng)先同級(jí)端側(cè)模型約 10%,證明端側(cè)模型具備云端級(jí)通用知識(shí)密度;GPQA Diamond(研究生級(jí)專業(yè)推理)測(cè)試中,Sage 獲得 77 分,提升 33%,凸顯復(fù)雜推理深度;Human Semantic Understanding(座艙語(yǔ)義與視覺理解)測(cè)試中獲 91 分,提升 32%,依托原生數(shù)據(jù)建立獨(dú)特優(yōu)勢(shì)。


      在重點(diǎn)考察任務(wù)執(zhí)行能力的 τ2-bench(工具調(diào)用與任務(wù)閉環(huán))基準(zhǔn)上,Sage 以 80 分的成績(jī)相較 Gemma 4 實(shí)現(xiàn) 38% 的提升,接近翻倍領(lǐng)先。這項(xiàng)基準(zhǔn)專門評(píng)估模型調(diào)用工具、走完多步任務(wù)的實(shí)戰(zhàn)能力,也是區(qū)分"會(huì)聊天的模型"與"會(huì)辦事的智能體"的關(guān)鍵分水嶺。τ2-bench 上近一倍的領(lǐng)先,直接印證了 Sage 作為端側(cè)智能體基座在真實(shí)任務(wù)執(zhí)行環(huán)節(jié)上的絕對(duì)優(yōu)勢(shì)。

      從專業(yè)基準(zhǔn)到場(chǎng)景體驗(yàn):Sage 真正"懂場(chǎng)景、會(huì)思考、能服務(wù)"

      這些專業(yè)能力落到真實(shí)車艙,轉(zhuǎn)化為一組直接影響用戶體驗(yàn)的指標(biāo):Sage 場(chǎng)景推理精度超過(guò) 90%,長(zhǎng)鏈路工具調(diào)用、邏輯規(guī)劃、環(huán)境感知任務(wù)成功率分別達(dá) 92%、89%、94%,復(fù)雜指令遵循率提升 40%。

      在 Orin X 平臺(tái)部署下,Sage 可實(shí)現(xiàn)首字響應(yīng)(TTFT)約0.5秒、單 Token 推理延遲(TPOT)低至0.03秒、生成吞吐達(dá)到80 tk/S,平均任務(wù)時(shí)長(zhǎng)優(yōu)于主流API 模型為座艙智能體提供穩(wěn)定、實(shí)時(shí)、可持續(xù)在線的運(yùn)行能力。

      模型可以一次性解析用戶的復(fù)合指令,自動(dòng)聯(lián)動(dòng)空調(diào)、影音、導(dǎo)航等車載系統(tǒng)完成任務(wù)閉環(huán);結(jié)合傳感器對(duì)乘員狀態(tài)與路況的感知,還能主動(dòng)提供兒童模式、智能路線調(diào)整等服務(wù)。

      Sage 不再是"被動(dòng)喚醒、單次響應(yīng)"的語(yǔ)音助手,而是一個(gè)真正懂場(chǎng)景、會(huì)思考、能服務(wù)的出行伙伴。

      商湯絕影 Sage 端側(cè)多模態(tài)智能體基座大模型為艙駕一體方案打通了量產(chǎn)可行的模型路徑,打破了技術(shù)與落地之間的壁壘,推動(dòng)智能座艙從基礎(chǔ)交互向高階艙駕融合智能體服務(wù)跨越。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點(diǎn)推薦
      如果你身邊有人嘲笑掘金挑錯(cuò)對(duì)手,你還是趕緊跟他絕交吧?

      如果你身邊有人嘲笑掘金挑錯(cuò)對(duì)手,你還是趕緊跟他絕交吧?

      稻谷與小麥
      2026-04-24 23:48:38
      快訊!伊朗政權(quán)變天了!

      快訊!伊朗政權(quán)變天了!

      故事終將光明磊落
      2026-04-24 17:29:03
      全球怕是僅有印度這么想!72%印度人認(rèn)為:印軍可以輕松擊敗中國(guó)

      全球怕是僅有印度這么想!72%印度人認(rèn)為:印軍可以輕松擊敗中國(guó)

      老赳說(shuō)歷史
      2026-04-23 17:49:12
      癌癥患者是咋發(fā)現(xiàn)自己得癌的?網(wǎng)友:老人要瞞著,不然心態(tài)容易崩

      癌癥患者是咋發(fā)現(xiàn)自己得癌的?網(wǎng)友:老人要瞞著,不然心態(tài)容易崩

      帶你感受人間冷暖
      2026-04-07 00:15:06
      法國(guó)法院再引爭(zhēng)議:保姆投毒案量刑遭質(zhì)疑

      法國(guó)法院再引爭(zhēng)議:保姆投毒案量刑遭質(zhì)疑

      晚風(fēng)也遺憾
      2026-04-23 15:19:51
      10年麻將館老板娘口述:凡是愛打牌的,沒一個(gè)日子過(guò)得好

      10年麻將館老板娘口述:凡是愛打牌的,沒一個(gè)日子過(guò)得好

      蘭亭墨未干
      2026-04-11 00:28:10
      下周天氣又有反轉(zhuǎn)極端溫度將達(dá)→

      下周天氣又有反轉(zhuǎn)極端溫度將達(dá)→

      上觀新聞
      2026-04-24 16:31:04
      趙庫(kù)里6記三分球轟20+2+5!新援兩雙,遼籃三勝江蘇,附加賽對(duì)陣山東

      趙庫(kù)里6記三分球轟20+2+5!新援兩雙,遼籃三勝江蘇,附加賽對(duì)陣山東

      君馬體育
      2026-04-24 23:20:18
      晨起后我才發(fā)現(xiàn):你以為那是性,其實(shí)只是身體最原始的表態(tài)

      晨起后我才發(fā)現(xiàn):你以為那是性,其實(shí)只是身體最原始的表態(tài)

      徐德文科學(xué)頻道
      2026-04-23 22:26:49
      天雷滾滾,今天3家公司被實(shí)施st退市風(fēng)險(xiǎn)警示停牌,12萬(wàn)股東踩雷

      天雷滾滾,今天3家公司被實(shí)施st退市風(fēng)險(xiǎn)警示停牌,12萬(wàn)股東踩雷

      丁丁鯉史紀(jì)
      2026-04-24 10:58:29
      這個(gè)被低估的水果,憑什么叫代謝超級(jí)食物?

      這個(gè)被低估的水果,憑什么叫代謝超級(jí)食物?

      心事寄山海
      2026-04-24 08:58:36
      剛剛宣布,降息50個(gè)基點(diǎn)

      剛剛宣布,降息50個(gè)基點(diǎn)

      中國(guó)基金報(bào)
      2026-04-24 19:35:36
      伊朗急著換談判桌:巴基斯坦為什么被拋棄,土耳其憑什么上位

      伊朗急著換談判桌:巴基斯坦為什么被拋棄,土耳其憑什么上位

      民間胡扯老哥
      2026-04-23 15:14:14
      “南航空姐”咆哮外籍乘務(wù)不懂中文,空少還原鬧劇首次曝光!這事如果發(fā)生在新加坡……

      “南航空姐”咆哮外籍乘務(wù)不懂中文,空少還原鬧劇首次曝光!這事如果發(fā)生在新加坡……

      新加坡眼
      2026-04-23 14:39:44
      CBA宣布離譜決定

      CBA宣布離譜決定

      宗介說(shuō)體育
      2026-04-24 09:57:42
      知名男演員官宣結(jié)婚生女,妻子比他大8歲,為懷孕生女吃了不少苦

      知名男演員官宣結(jié)婚生女,妻子比他大8歲,為懷孕生女吃了不少苦

      娛人細(xì)品
      2026-04-24 16:55:46
      官方:羅馬與拉涅利結(jié)束合作,俱樂部對(duì)加帥的執(zhí)教充滿信心

      官方:羅馬與拉涅利結(jié)束合作,俱樂部對(duì)加帥的執(zhí)教充滿信心

      懂球帝
      2026-04-24 18:27:06
      1940年秋:墨索里尼的荒誕參戰(zhàn)夢(mèng)

      1940年秋:墨索里尼的荒誕參戰(zhàn)夢(mèng)

      烽火瞭望者
      2026-04-24 14:47:07
      A股,尾盤傳來(lái)一個(gè)“重磅利好”信號(hào),下周,或?qū)⒂瓉?lái)大變盤!

      A股,尾盤傳來(lái)一個(gè)“重磅利好”信號(hào),下周,或?qū)⒂瓉?lái)大變盤!

      夜深愛雜談
      2026-04-24 21:31:35
      后悔已來(lái)不及了,美商務(wù)部長(zhǎng):中方改變主意,美方想賣卻賣不出去

      后悔已來(lái)不及了,美商務(wù)部長(zhǎng):中方改變主意,美方想賣卻賣不出去

      混沌錄
      2026-04-24 15:46:15
      2026-04-25 00:28:49
      車叫獸 incentive-icons
      車叫獸
      有料、有態(tài)度的汽車媒體
      6850文章數(shù) 46230關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4牽手華為,價(jià)格依然"屠夫級(jí)"

      頭條要聞

      航班提前起飛10分鐘 大學(xué)生把海航告了

      頭條要聞

      航班提前起飛10分鐘 大學(xué)生把海航告了

      體育要聞

      上海男籃23連勝+主場(chǎng)全勝 姚明之后最強(qiáng)一季

      娛樂要聞

      停工16個(gè)月!趙露思證實(shí)接拍新劇

      財(cái)經(jīng)要聞

      LG財(cái)閥內(nèi)斗:百億美元商業(yè)帝國(guó)爭(zhēng)奪戰(zhàn)

      汽車要聞

      零跑Lafa5 Ultra北京車展上市:11.88-12.48萬(wàn)

      態(tài)度原創(chuàng)

      教育
      時(shí)尚
      親子
      游戲
      軍事航空

      教育要聞

      好書共讀 好文共享-《書香家庭》

      今日熱點(diǎn):愛奇藝回應(yīng)暫停頁(yè)面廣告爭(zhēng)議;經(jīng)紀(jì)公司否認(rèn)THEBOYZ解約成功……

      親子要聞

      聽說(shuō)醫(yī)院產(chǎn)檢水很深?

      《光與影:33號(hào)遠(yuǎn)征隊(duì)》發(fā)售一周年 銷量破800萬(wàn)

      軍事要聞

      美伊陷入互相封鎖僵局

      無(wú)障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 伊人二区| 国产传媒_色哟哟| 亚洲一区二区经典在线播放| 精品三级在线| 屄视频| 日韩欧美中文字幕公布| 四虎永久在线精品国产馆v视影院| 亚洲小说少妇区图片| 亚洲精品成a人在线观看| 成人麻豆日韩在无码视频| 日韩人妻精品无码制服| 国精品无码一区二区三区在线看| 麻豆AV电影| 久久人人妻人人爽人人爽| 日本一区二区视频在线播放| 国偷自产视频一区二区久| 国产精品一线二线三线区| 多人乱p视频在线免费观看| 人妻精品动漫h无码网站| 性生生活大片又黄又| 久久久久久曰本av免费免费| 色噜噜狠狠色综合成人网| 极品无码国模国产在线观看| 91福利电影| 国产av成人精品播放| 在线视频 亚洲精品| 亚洲一区av无码专区在线观看| aa性欧美老妇人牲交免费| 男人猛躁进女人免费播放| 国产永久免费高清在线观看| 性爱视频网址| 夜夜躁很很躁日日躁麻豆| 成人午夜亚洲影视在线观看| 国产两女互慰高潮视频在线观看 | 天天操夜夜操| 亚洲国产色播AV在线| 少妇av在线| 人人干人人爽| 免费一级做a爰片性色毛片| 日本在线亚洲| 艳妇乳肉豪妇荡乳xxx|