<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      從“數(shù)據(jù)融合”邁向“原生架構(gòu)”:商湯發(fā)布 NEO 架構(gòu),重新定義多模態(tài)模型效能邊界

      0
      分享至

      商湯科技正式發(fā)布并開源了與南洋理工大學(xué) S-Lab合作研發(fā)的全新多模態(tài)模型架構(gòu) —— NEO,為日日新 SenseNova 多模態(tài)模型奠定了新一代架構(gòu)的基石。

      作為行業(yè)內(nèi)率先實現(xiàn)深層次融合的可用原生多模態(tài)架構(gòu)(Native VLM),NEO 從底層原理出發(fā),打破了傳統(tǒng)“模塊化”范式的桎梏,以“專為多模態(tài)而生”的創(chuàng)新設(shè)計,通過核心架構(gòu)層面的多模態(tài)深層融合,實現(xiàn)了性能、效率和通用性的整體突破,重新定義了多模態(tài)模型的效能邊界,標(biāo)志著人工智能多模態(tài)技術(shù)正式邁入“原生架構(gòu)”的新時代。



      論文網(wǎng)址:https://arxiv.org/abs/2510.14979

      打破瓶頸:告別“拼湊”,擁抱“原生”



      當(dāng)前,業(yè)內(nèi)主流的多模態(tài)模型大多遵循“視覺編碼器+投影器+語言模型”的模塊化范式。這種基于大語言模型(LLM)的擴(kuò)展方式,雖然實現(xiàn)了圖像輸入的兼容,但本質(zhì)上仍以語言為中心,圖像與語言的融合僅停留在數(shù)據(jù)層面。這種“拼湊”式的設(shè)計不僅學(xué)習(xí)效率低下,更限制了模型在復(fù)雜多模態(tài)場景下(比如涉及圖像細(xì)節(jié)捕捉或復(fù)雜空間結(jié)構(gòu)理解)的處理能力。

      商湯 NEO 架構(gòu)正是為了解決這一痛點而生。早在2024 年下半年,商湯便在國內(nèi)率先突破多模態(tài)原生融合訓(xùn)練技術(shù),以單一模型在 SuperCLUE 語言評測 和 OpenCompass 多模態(tài)評測中奪冠,并基于這一核心技術(shù)打造了日日新 SenseNova 6.0,實現(xiàn)多模態(tài)推理能力領(lǐng)先。之后,在2025 年 7 月發(fā)布日日新 SenseNova 6.5 通過實現(xiàn)編碼器層面的早期融合,把多模態(tài)模型性價比提升 3 倍,并在國內(nèi)率先推出商用級別的圖文交錯推理。商湯此次更進(jìn)一步,徹底摒棄了傳統(tǒng)的模塊化結(jié)構(gòu),從底層原理出發(fā),推出了從零設(shè)計的 NEO 原生架構(gòu)。

      三大內(nèi)核創(chuàng)新:實現(xiàn)視覺和語言的深層統(tǒng)一



      NEO 架構(gòu)以極致效率和深度融合為核心理念,通過在注意力機(jī)制、位置編碼和語義映射三個關(guān)鍵維度的底層創(chuàng)新,讓模型天生具備了統(tǒng)一處理視覺與語言的能力:

      • 原生圖塊嵌入 (Native Patch Embedding): 摒棄了離散的圖像 tokenizer,通過獨(dú)創(chuàng)的 Patch Embedding Layer (PEL) 自底向上構(gòu)建從像素到詞元的連續(xù)映射。這種設(shè)計能更精細(xì)地捕捉圖像細(xì)節(jié),從根本上突破了主流模型的圖像建模瓶頸。
      • 原生三維旋轉(zhuǎn)位置編碼 (Native-RoPE): 創(chuàng)新性地解耦了三維時空頻率分配,視覺維度采用高頻、文本維度采用低頻,完美適配兩種模態(tài)的自然結(jié)構(gòu)。這使得 NEO 不僅能精準(zhǔn)捕獲圖像的空間結(jié)構(gòu),更具備向視頻處理、跨幀建模等復(fù)雜場景無縫擴(kuò)展的潛力。
      • 原生多頭注意力 (Native Multi-Head Attention): 針對不同模態(tài)特點,NEO 在統(tǒng)一框架下實現(xiàn)了文本 token 的自回歸注意力和視覺 token 的雙向注意力并存。這種設(shè)計極大地提升了模型對空間結(jié)構(gòu)關(guān)聯(lián)的利用率,從而更好地支撐復(fù)雜的圖文混合理解與推理。

      此外,配合創(chuàng)新的 Pre-Buffer & Post-LLM 雙階段融合訓(xùn)練策略,NEO 能夠在吸收原始 LLM 完整語言推理能力的同時,從零構(gòu)建強(qiáng)大的視覺感知能力,徹底解決了傳統(tǒng)跨模態(tài)訓(xùn)練中語言能力受損的難題。

      實測表現(xiàn):十分之一的數(shù)據(jù),追平旗艦級性能



      在架構(gòu)創(chuàng)新的驅(qū)動下,NEO 展現(xiàn)出了驚人的數(shù)據(jù)效率與性能優(yōu)勢:

      極高數(shù)據(jù)效率: 僅需業(yè)界同等性能模型 1/10 的數(shù)據(jù)量(3.9億圖像文本示例),NEO 便能開發(fā)出頂尖的視覺感知能力。無需依賴海量數(shù)據(jù)及額外視覺編碼器,其簡潔的架構(gòu)便能在多項視覺理解任務(wù)中追平 Qwen2-VL、InternVL3 等優(yōu)質(zhì)模塊化旗艦?zāi)P汀?/p>

      性能卓越且均衡: 在 MMMU、MMB、MMStar、SEED-I、POPE 等多項公開權(quán)威評測中,NEO 架構(gòu)均斬獲高分,展現(xiàn)出優(yōu)于其他原生 VLM 的綜合性能,真正實現(xiàn)了原生架構(gòu)的“精度無損”。

      極致推理性價比: 特別是在 0.6B-8B 的參數(shù)區(qū)間內(nèi),NEO 在邊緣部署方面優(yōu)勢顯著。它不僅實現(xiàn)了精度與效率的雙重躍遷,更大幅降低了推理成本,顯著提升了多模態(tài)視覺感知的“性價比”。

      開源共建:構(gòu)建下一代 AI 基礎(chǔ)設(shè)施

      架構(gòu)是模型的“骨架”,只有骨架扎實,才能支撐起多模態(tài)技術(shù)的未來。NEO 架構(gòu)的早期融合設(shè)計支持任意分辨率與長圖像輸入,能夠無縫擴(kuò)展至視頻、具身智能等前沿領(lǐng)域,實現(xiàn)了從底層到頂層、端到端的真正融合。從應(yīng)用角度,端到端的“原生一體化”設(shè)計,為機(jī)器人具身交互、智能終端多模態(tài)響應(yīng)、視頻理解、3D交互及具身智能等多元化場景的應(yīng)用,提供了堅實的技術(shù)支撐。

      目前,商湯已正式開源基于 NEO 架構(gòu)的 2B 與 9B 兩種規(guī)格模型,以推動開源社區(qū)在原生多模態(tài)架構(gòu)上的創(chuàng)新與應(yīng)用。商湯科技表示,致力于通過開源協(xié)作與場景落地雙輪驅(qū)動,將 NEO 打造為可擴(kuò)展、可復(fù)用的下一代 AI 基礎(chǔ)設(shè)施,推動原生多模態(tài)技術(shù)從實驗室走向廣泛的產(chǎn)業(yè)化應(yīng)用,加速構(gòu)建下一代產(chǎn)業(yè)級原生多模態(tài)技術(shù)標(biāo)準(zhǔn)。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      42歲男子長期被職場PUA抱住醫(yī)生大哭,稱一到公司門口就開始心慌,醫(yī)生:他把領(lǐng)導(dǎo)的評價,當(dāng)成對自己全部價值的判斷

      42歲男子長期被職場PUA抱住醫(yī)生大哭,稱一到公司門口就開始心慌,醫(yī)生:他把領(lǐng)導(dǎo)的評價,當(dāng)成對自己全部價值的判斷

      大風(fēng)新聞
      2026-03-28 21:28:03
      動真格了!沙特電力巨頭宣布在華投資300億美元!

      動真格了!沙特電力巨頭宣布在華投資300億美元!

      達(dá)文西看世界
      2026-03-29 09:54:36
      4月首款新機(jī)官宣:4月1日,正式發(fā)布

      4月首款新機(jī)官宣:4月1日,正式發(fā)布

      科技堡壘
      2026-03-29 11:19:43
      乘風(fēng)2026官宣:無人氣擔(dān)當(dāng),甄嬛姐妹相會,范瑋琪或是爭議焦點

      乘風(fēng)2026官宣:無人氣擔(dān)當(dāng),甄嬛姐妹相會,范瑋琪或是爭議焦點

      李守智
      2026-03-29 10:47:19
      戰(zhàn)爭已到臨界點!以色列下達(dá)決戰(zhàn)書:48小時定生死,立刻啟用核彈

      戰(zhàn)爭已到臨界點!以色列下達(dá)決戰(zhàn)書:48小時定生死,立刻啟用核彈

      夢史
      2026-03-28 12:31:05
      蘋果突然給3億舊iPhone發(fā)"死亡通知":不升級就等被偷

      蘋果突然給3億舊iPhone發(fā)"死亡通知":不升級就等被偷

      算力游俠
      2026-03-28 10:47:23
      5億遺產(chǎn),67%歸妻,16.5%留女!張雪峰留給世界的最后賬本!

      5億遺產(chǎn),67%歸妻,16.5%留女!張雪峰留給世界的最后賬本!

      新浪財經(jīng)
      2026-03-27 10:53:31
      醫(yī)生告誡:每天睡前玩手機(jī)的人,不用半年時間,睡眠或有這6變化

      醫(yī)生告誡:每天睡前玩手機(jī)的人,不用半年時間,睡眠或有這6變化

      岐黃傳人孫大夫
      2026-03-24 23:55:03
      買車就送一年閃充,有人動了歪心思!如果比亞迪不管,就被薅禿了

      買車就送一年閃充,有人動了歪心思!如果比亞迪不管,就被薅禿了

      小李車評李建紅
      2026-03-29 08:00:03
      59歲鞏俐身材引熱議,外套都快撐不住豐腴身材了,卻被夸少女體態(tài)

      59歲鞏俐身材引熱議,外套都快撐不住豐腴身材了,卻被夸少女體態(tài)

      一盅情懷
      2026-03-16 16:52:57
      痞幼因網(wǎng)紅身份,在別墅區(qū)被鄰居集體“抵制”

      痞幼因網(wǎng)紅身份,在別墅區(qū)被鄰居集體“抵制”

      笑飲孤鴻非
      2026-03-29 06:41:39
      庫班轉(zhuǎn)發(fā)!美媒嘲諷尼科:交易東契奇讓你從私人飛機(jī)降為坐經(jīng)濟(jì)艙

      庫班轉(zhuǎn)發(fā)!美媒嘲諷尼科:交易東契奇讓你從私人飛機(jī)降為坐經(jīng)濟(jì)艙

      羅說NBA
      2026-03-29 09:55:36
      界面調(diào)查|一位“90后”網(wǎng)約車司機(jī)之死:被騙網(wǎng)貸、被催債和致命的絕望

      界面調(diào)查|一位“90后”網(wǎng)約車司機(jī)之死:被騙網(wǎng)貸、被催債和致命的絕望

      界面新聞
      2026-03-29 10:33:24
      收銀員不識貨!網(wǎng)友白菜價撿漏64GB內(nèi)存惹人羨慕

      收銀員不識貨!網(wǎng)友白菜價撿漏64GB內(nèi)存惹人羨慕

      游民星空
      2026-03-29 19:05:19
      辣目洋子回應(yīng)參加浪姐后變瘦:身體上是疲憊的,心靈上是非常開心

      辣目洋子回應(yīng)參加浪姐后變瘦:身體上是疲憊的,心靈上是非常開心

      韓小娛
      2026-03-29 10:59:45
      三板退市股狂飆!59天拉58個板,大漲超1000%

      三板退市股狂飆!59天拉58個板,大漲超1000%

      21世紀(jì)經(jīng)濟(jì)報道
      2026-03-29 20:30:44
      重慶某設(shè)計院員工帶頭罷工被辭退,辭退員工把領(lǐng)導(dǎo)眼鏡打飛了!

      重慶某設(shè)計院員工帶頭罷工被辭退,辭退員工把領(lǐng)導(dǎo)眼鏡打飛了!

      黯泉
      2026-03-29 20:11:11
      張雪峰自曝每天就睡兩個小時,助理非要給他買除顫儀

      張雪峰自曝每天就睡兩個小時,助理非要給他買除顫儀

      金牌娛樂
      2026-03-29 08:06:36
      美國經(jīng)過與伊朗的戰(zhàn)爭以后,大概率將會徹底打消與中國的武力沖突

      美國經(jīng)過與伊朗的戰(zhàn)爭以后,大概率將會徹底打消與中國的武力沖突

      安安說
      2026-03-29 13:41:15
      41歲女子被羈押821天被判無罪,獲賠13天后被叫停!當(dāng)事人回應(yīng)昌江通報:堅信法律

      41歲女子被羈押821天被判無罪,獲賠13天后被叫停!當(dāng)事人回應(yīng)昌江通報:堅信法律

      大象新聞
      2026-03-29 17:45:20
      2026-03-29 22:24:49
      財經(jīng)新媒體 incentive-icons
      財經(jīng)新媒體
      源于《財經(jīng)》,廣于財經(jīng)。
      4769文章數(shù) 34210關(guān)注度
      往期回顧 全部

      科技要聞

      馬斯克承認(rèn)xAI"建錯了",11位創(chuàng)始人均離職

      頭條要聞

      動車被困隧道內(nèi)停車斷電4個小時 乘客:有人緊張暈倒

      頭條要聞

      動車被困隧道內(nèi)停車斷電4個小時 乘客:有人緊張暈倒

      體育要聞

      絕殺衛(wèi)冕冠軍后,他單手指天把勝利獻(xiàn)給父親

      娛樂要聞

      張凌赫事件持續(xù)升級!官方點名怒批

      財經(jīng)要聞

      Kimi、Minimax 們的算力荒

      汽車要聞

      嵐圖泰山X8配置曝光 四激光雷達(dá)/華為新一代座艙

      態(tài)度原創(chuàng)

      房產(chǎn)
      數(shù)碼
      手機(jī)
      游戲
      軍事航空

      房產(chǎn)要聞

      首日430組來訪,單日120組認(rèn)籌!海口首個真四代,徹底爆了!

      數(shù)碼要聞

      DDR5內(nèi)存價格回落!專家:仍將持續(xù)下探

      手機(jī)要聞

      舊手機(jī)回收價暴漲五六倍引關(guān)注,央視揭秘漲價背后主要原因

      外網(wǎng)熱議JKL與Tian回歸TES:2024版陣容重聚,期待與爭議并存

      軍事要聞

      美兩棲攻擊艦載3500名增援到達(dá)

      無障礙瀏覽 進(jìn)入關(guān)懷版