<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      世界引擎:Post-Training開啟Physical AGI新紀(jì)元

      0
      分享至



      一年前,DeepSeek R1 橫空出世,人們才意識到,真正讓模型產(chǎn)生推理能力質(zhì)變的,不必是更大的預(yù)訓(xùn)練規(guī)模 —— 后訓(xùn)練,用強(qiáng)化學(xué)習(xí)、過程獎勵、閉環(huán)反饋,以極低的代價解鎖了原本需要數(shù)倍算力才能觸達(dá)的能力邊界。
      這場范式革命,正在物理世界重演。
      自動駕駛系統(tǒng)已經(jīng)在海量駕駛數(shù)據(jù)上完成了預(yù)訓(xùn)練,但距離真正的 Physical AGI,仍有一道鴻溝:模型知道 "該怎么開",卻不知道「為什么這樣開更好」。真正的進(jìn)化,需要閉環(huán)、需要反饋、需要在與世界的交互中不斷修正。
      香港大學(xué)李弘揚(yáng)團(tuán)隊聯(lián)合華為、上海創(chuàng)智學(xué)院給出了他們的答案 —— 世界引擎:以后訓(xùn)練為核心范式,以閉環(huán)仿真為訓(xùn)練環(huán)境,驅(qū)動自動駕駛系統(tǒng)在海量真實與合成場景的交互中,涌現(xiàn)出真正的決策能力。



      • 代碼地址:https://github.com/OpenDriveLab/WorldEngine
      • 主頁:https://opendrivelab.com/WorldEngine/

      作為自動駕駛領(lǐng)域的重要學(xué)術(shù)力量,2022 年底,OpenDriveLab 推出UniAD—— 第一個將感知、預(yù)測、規(guī)劃統(tǒng)一在單一框架下的端到端系統(tǒng),以「規(guī)劃為中心」重新定義了自動駕駛的建模范式,成為學(xué)術(shù)界公認(rèn)的里程碑。

      但 UniAD 之后,一個更深的問題浮出水面:端到端系統(tǒng)在學(xué)術(shù) benchmark 上表現(xiàn)優(yōu)異,真實世界卻是另一回事。

      雨夜里逆行的電動車,施工路段突然倒下的錐桶,大客車后方的鬼探頭 —— 這些長尾場景,在訓(xùn)練數(shù)據(jù)里幾乎不存在。靠更大的數(shù)據(jù)集、更深的網(wǎng)絡(luò),無法根本性地解決。

      OpenDriveLab 開始從兩個方向同時推進(jìn)。一方面,MTGS 通過多次遍歷的 3D 高斯?jié)姙R技術(shù),構(gòu)建出高保真的可渲染駕駛場景 —— 這是閉環(huán)仿真的物理基礎(chǔ)。另一方面,Nexus、Omega 等世界模型工作聚焦于反事實難例高動態(tài)交互模擬,突破真實數(shù)據(jù)對長尾場景覆蓋的天然局限。

      至此,一個核心問題自然浮現(xiàn):有了高保真仿真環(huán)境,有了能生成難例的世界模型,如何讓端到端系統(tǒng)真正在其中安全進(jìn)化?

      答案,就是后訓(xùn)練

      2025 年 4 月,華為發(fā)布 ADS 4.0,正式披露了全新技術(shù)架構(gòu) WEWA。其中云端核心World Engine,正是華為與 OpenDriveLab 聯(lián)合開發(fā)的成果。(https://auto.huawei.com/cn/ads)華為將這套架構(gòu)的目標(biāo)定義為:面向自動駕駛,從類人到超人。

      World Engine,由此登場。

      World Engine:邁向物理 AI 的后訓(xùn)練時代

      如果說預(yù)訓(xùn)練讓自動駕駛系統(tǒng)學(xué)會了「模仿」,那后訓(xùn)練要解決的,是如何讓系統(tǒng)學(xué)會「判斷」。

      World Engine 的設(shè)計哲學(xué),正是圍繞這一目標(biāo)展開。它不是一個單一模型,而是一套完整的后訓(xùn)練 pipeline,由三個核心能力構(gòu)成:

      • 3DGS 仿真環(huán)境—— 基于 3DGS 構(gòu)建的高保真視覺輸入,為后訓(xùn)練提供了真正意義上的閉環(huán)反饋。系統(tǒng)的每一個決策,都能在環(huán)境中得到即時響應(yīng),而不是停留在數(shù)據(jù)回放。
      • 難例挖掘 & 擴(kuò)散生成—— 真實世界的長尾場景稀缺且難以復(fù)現(xiàn)。World Engine 首先從海量真實駕駛數(shù)據(jù)中主動挖掘難例,再以世界模型為工具,對這些難例進(jìn)行擴(kuò)散生成后,依托仿真環(huán)境進(jìn)行渲染,放大長尾場景的密度與多樣性,讓系統(tǒng)在訓(xùn)練中「見過」它在路上可能遇到的一切。
      • 基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練——World Engine 在仿真生成的大規(guī)模難例場景上,以強(qiáng)化學(xué)習(xí)驅(qū)動系統(tǒng)優(yōu)化,將安全價值規(guī)范內(nèi)化為獎勵信號,讓系統(tǒng)不只是「開得快」,更是「開得對」。

      三者協(xié)同,構(gòu)成了一個完整的飛輪:仿真生成難例,難例驅(qū)動后訓(xùn)練,后訓(xùn)練強(qiáng)化決策能力。



      圖 1 World Engine 架構(gòu)總覽

      從暴露弱點到超越弱點

      三個模塊,一套飛輪。

      難例挖掘與擴(kuò)散生成

      World Engine 首先讓模型「自己暴露弱點」。將預(yù)訓(xùn)練好的端到端模型在訓(xùn)練集上做開環(huán)推理,以 PDMS 作為評判標(biāo)準(zhǔn),自動篩選出模型表現(xiàn)差的場景 —— 碰撞、偏離道路、自車停滯不前。這些場景,就是模型的能力邊界所在。

      挖掘出難例之后,World Engine 并不止步于此。行為世界模型(Behaviour World Model) 以解耦擴(kuò)散的方式,對這些難例場景進(jìn)行變體生成 —— 在保持真實地圖拓?fù)渑c場景布局的前提下,引入對抗性交通行為,批量合成高密度的安全關(guān)鍵場景。真實數(shù)據(jù)的長尾,由此被系統(tǒng)性地放大。



      圖 2 難例擴(kuò)散生成典型 case

      高保真閉環(huán)仿真

      難例場景需要一個足夠真實的舞臺。World Engine 內(nèi)置了基于3DGS 的場景重建 pipeline—— 融合同一路段的多次真實駕駛記錄,構(gòu)建出扎根于真實世界的高保真三維場景。這不是憑空生成的虛擬沙盒,而是閉環(huán)訓(xùn)練的真實物理基礎(chǔ)。



      圖 3 高保真閉環(huán)仿真效果圖

      基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練

      有了大規(guī)模難例數(shù)據(jù),World Engine 以離線強(qiáng)化學(xué)習(xí)驅(qū)動端到端模型持續(xù)優(yōu)化。獎勵信號將舒適性、避障、道路合規(guī)等安全價值直接內(nèi)化為訓(xùn)練目標(biāo)。模型不再只是模仿人類駕駛員,而是在與難例的反復(fù)博弈中,學(xué)會真正的安全決策。



      圖 4 navsim 測試難例集對比

      World Engine 發(fā)現(xiàn)了什么?

      數(shù)據(jù)量上做加法,不如在訓(xùn)練范式上做乘法



      圖 5 驗證 Data Scaling: 將預(yù)訓(xùn)練數(shù)據(jù)集場景數(shù)量從 12k 增廣至 103k 進(jìn)行對比

      自動駕駛行業(yè)有一個長期信仰:數(shù)據(jù)越多,模型越安全。World Engine 給出了一個更復(fù)雜的答案。

      將預(yù)訓(xùn)練數(shù)據(jù)從 1.3 萬個場景一路擴(kuò)大到 10.3 萬個,在日常駕駛場景上,scaling law 如期生效 —— 數(shù)據(jù)越多,表現(xiàn)越好。但在安全關(guān)鍵的長尾場景上,曲線很快躺平。原因并不意外:真實路測中危險場景本就極度稀缺,堆再多常規(guī)數(shù)據(jù),模型在關(guān)鍵時刻依然束手無策。

      數(shù)據(jù) scaling,在長尾場景這件事上,撞上了天花板。

      World Engine 的后訓(xùn)練給出了另一條路徑:在仿真環(huán)境中以強(qiáng)化學(xué)習(xí)反復(fù)博弈難例場景,將避障、合規(guī)、舒適性直接編碼為優(yōu)化目標(biāo),同時確保系統(tǒng)不丟失預(yù)訓(xùn)練階段習(xí)得的基礎(chǔ)駕駛能力。從同一個基礎(chǔ)模型出發(fā),后訓(xùn)練直接跨越了 scaling 曲線,實現(xiàn)了等效于將預(yù)訓(xùn)練數(shù)據(jù)擴(kuò)大約 14 倍的閉環(huán)性能增益。

      一塊都不能少

      后訓(xùn)練有效,但增益從何而來?World Engine 對自身的三個核心模塊做逐一拆解。



      圖 6 navsim 數(shù)據(jù)集上不同訓(xùn)練后范式對比

      光喂數(shù)據(jù)沒用。拿到稀有場景數(shù)據(jù),模仿學(xué)習(xí)幾乎不改善閉環(huán)表現(xiàn)。模型學(xué)會了「照做」,沒學(xué)會「判斷」。強(qiáng)化學(xué)習(xí)才是那個開關(guān)。

      練什么比怎么練更重要。同樣是強(qiáng)化學(xué)習(xí),在普通場景上練,閉環(huán)成功率反而下降 —— 就像一個學(xué)生只刷簡單題,考試遇到難題反而更慌。只有聚焦難例,能力才真正提升。

      仿真不是有就行,得「活」起來。當(dāng)仿真里的其他車輛只是錄像回放,收益有限;當(dāng)它們開始對自車行為做出反應(yīng)、甚至主動制造對抗,閉環(huán)成功率從 76% 一路拉到 89% 。World Engine 的行為世界模型,補(bǔ)上的正是這最后一環(huán)。

      從仿真到路測:World Engine 的工業(yè)級答卷

      學(xué)術(shù) benchmark 之外,World Engine 接受了一次更嚴(yán)苛的考驗 —— 華為 ADS 系統(tǒng)的工業(yè)級驗證。

      基礎(chǔ)模型在超過 8 萬小時真實駕駛數(shù)據(jù)上完成預(yù)訓(xùn)練,覆蓋全國 100 余座城市、逾千萬條駕駛片段。這已經(jīng)是一個極強(qiáng)的起點。World Engine 后訓(xùn)練在此基礎(chǔ)上繼續(xù)發(fā)力。

      工業(yè)閉環(huán)仿真



      圖 7 ADS 工業(yè)級閉環(huán)仿真結(jié)果對比

      團(tuán)隊利用華為 ADS 的工業(yè)級閉環(huán)仿真平臺對后訓(xùn)練模型進(jìn)行了全面評估 —— 超過1 萬個測試場景,累計模擬駕駛里程逾3000 公里,全部為高密度交互的事件性場景,而非平淡的常規(guī)巡航。結(jié)果橫跨六項安全指標(biāo),全面改善,其中切入碰撞更是下降 45.5%。

      實車路測

      仿真之后,World Engine 走上了上海真實路面。測試路線涵蓋城市快速路與城區(qū)道路,總計約200 公里,重復(fù)測試三次完成。



      圖 8 上海市內(nèi)高架測試路線



      圖 9 上海市城區(qū)測試路線

      測試覆蓋的場景,是城市駕駛中真正讓人驚出冷汗的時刻:夜間施工區(qū)的臨時改道、行人從視覺盲區(qū)橫穿、無保護(hù)左轉(zhuǎn)后的施工區(qū)。這些場景的共同特征是 —— 即便是經(jīng)驗豐富的人類駕駛員,也需要高度集中注意力,稍有遲疑就可能出事。



      典型實車場景 1



      典型實車場景 2



      典型實車場景 3

      而 World Engine 后訓(xùn)練模型全程無需人工介入。

      Post Training,不止于自動駕駛

      World Engine 的故事,從自動駕駛出發(fā)。但它真正想回答的問題,遠(yuǎn)不止于此。

      回到最核心的洞見:當(dāng)真實世界無法為你提供足夠的關(guān)鍵失敗場景時,就主動去創(chuàng)造它們。在這些失敗中反復(fù)博弈,在這些邊界上持續(xù)進(jìn)化。這個邏輯,和駕駛無關(guān) —— 它是所有 Physical AI 系統(tǒng)共同面臨的根本困境。

      Physical AI 與數(shù)字 AI 最本質(zhì)的區(qū)別,在于不可逆性。語言模型說錯一句話,刷新重來;推薦系統(tǒng)給錯一個結(jié)果,下一次糾正。但物理世界里,機(jī)器人打碎了一個杯子,手術(shù)機(jī)器人劃錯了一刀,自動駕駛追尾了一輛車 —— 錯誤已經(jīng)發(fā)生,無法撤銷。這意味著,Physical AI 必須在真正上線之前,就已經(jīng) "見過" 那些最危險的時刻。

      但現(xiàn)實是,這些最危險的時刻,恰恰是最難收集的數(shù)據(jù)。

      這些領(lǐng)域,和自動駕駛面對的是同一個結(jié)構(gòu)性困境:最需要學(xué)習(xí)的場景,天然地缺席于訓(xùn)練數(shù)據(jù)。

      World Engine 提供的范式正是針對這一困境的系統(tǒng)性回答。具體的技術(shù)實現(xiàn)會因領(lǐng)域而異:3DGS 渲染可以換成物理引擎或視頻世界模型,行為世界模型可以換成機(jī)械臂動力學(xué)仿真或人體運(yùn)動生成 —— 但核心邏輯不變:不被動等待數(shù)據(jù),主動生成經(jīng)驗;不只模仿人類,在與世界的博弈中涌現(xiàn)能力。

      OpenDriveLab 正在將這條路延伸到更廣闊的具身智能領(lǐng)域。從端到端自動駕駛出發(fā),走向能在物理世界中感知、推理、行動、進(jìn)化的通用智能體 —— 這是具身智能研究的終極命題,也是 Physical AGI 真正的意涵所在。

      自動駕駛,是這場旅程的第一個戰(zhàn)場。

      而 Post-Training,將是 Physical AGI 時代最重要的基礎(chǔ)設(shè)施之一。

      項目作者簡介

      World Engine 由香港大學(xué)助理教授、上海創(chuàng)智學(xué)院全時導(dǎo)師李弘揚(yáng)博士與華為蘇鵬博士共同擔(dān)任項目負(fù)責(zé)人,李天羽(上海創(chuàng)智學(xué)院)、陳立(香港大學(xué))、王曹俊(上海創(chuàng)智學(xué)院)、劉浩晨(南洋理工大學(xué))為項目核心貢獻(xiàn)者,共同主導(dǎo)新范式的研究與實現(xiàn);蘇鵬博士團(tuán)隊從產(chǎn)業(yè)視角出發(fā),推動技術(shù)的量產(chǎn)落地與應(yīng)用部署。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關(guān)推薦
      熱點推薦
      如果馬寅初沒提出人口論,也沒有計劃生育,如今我國會怎么樣?

      如果馬寅初沒提出人口論,也沒有計劃生育,如今我國會怎么樣?

      舊史新譚
      2026-04-24 15:49:04
      網(wǎng)友稱被臺球助教仙人跳,轉(zhuǎn)賬兩千摸了之后對方就報警索賠

      網(wǎng)友稱被臺球助教仙人跳,轉(zhuǎn)賬兩千摸了之后對方就報警索賠

      映射生活的身影
      2026-04-25 16:25:10
      55歲阿姨相親當(dāng)晚同居醒來竟不知對方姓名

      55歲阿姨相親當(dāng)晚同居醒來竟不知對方姓名

      大熊歡樂坊
      2026-03-11 15:00:36
      “全美最受歡迎的漢堡”要來北京了!劉嘉玲、奧巴馬都曾被“圈粉”!網(wǎng)友催開業(yè)…

      “全美最受歡迎的漢堡”要來北京了!劉嘉玲、奧巴馬都曾被“圈粉”!網(wǎng)友催開業(yè)…

      北京商報
      2026-04-21 21:54:51
      觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

      觸目驚心!央視曝光上海一中醫(yī)館:從醫(yī)生到病人全是演員!

      番外行
      2026-04-24 08:59:12
      6位央企高管酒后大鬧國外機(jī)場,為何2年多才被曝出結(jié)果?誰在捂?

      6位央企高管酒后大鬧國外機(jī)場,為何2年多才被曝出結(jié)果?誰在捂?

      西門老爹
      2026-04-25 15:07:02
      廣東1男子賣豬肉45年,家徒四壁,誰料,外面養(yǎng)著1000多個孩子

      廣東1男子賣豬肉45年,家徒四壁,誰料,外面養(yǎng)著1000多個孩子

      好笑娛樂君每一天
      2026-04-24 01:15:33
      為什么在中國,面包不能像饅頭那樣當(dāng)主食?看完網(wǎng)友評論我笑噴了

      為什么在中國,面包不能像饅頭那樣當(dāng)主食?看完網(wǎng)友評論我笑噴了

      長風(fēng)文史
      2026-04-24 17:09:55
      清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

      清朝一個很特殊的官職,叫“道臺”,幾乎沒人能說清他是干啥的

      抽象派大師
      2026-04-24 12:23:42
      爭議?19歲王鈺棟近5輪0球!怒噴主裁染黃,不滿隊友:揮拳+叫罵

      爭議?19歲王鈺棟近5輪0球!怒噴主裁染黃,不滿隊友:揮拳+叫罵

      我愛英超
      2026-04-25 21:22:42
      開拓者慘遭逆轉(zhuǎn)!阿夫迪亞打掉牙,楊瀚森創(chuàng)紀(jì)錄!主教練要背大鍋

      開拓者慘遭逆轉(zhuǎn)!阿夫迪亞打掉牙,楊瀚森創(chuàng)紀(jì)錄!主教練要背大鍋

      不想長大的莫扎特
      2026-04-25 19:38:09
      男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現(xiàn)驚人現(xiàn)象

      男子用2條毒蛇泡酒,12年后打開本想品嘗美酒,誰知出現(xiàn)驚人現(xiàn)象

      詭譎怪談
      2025-04-01 17:37:59
      國家為什么不會任由房價持續(xù)下跌?

      國家為什么不會任由房價持續(xù)下跌?

      流蘇晚晴
      2026-04-23 19:53:23
      谷愛凌月跑量160公里,凌晨5點半就開跑,她說:用毅力創(chuàng)造自己!

      谷愛凌月跑量160公里,凌晨5點半就開跑,她說:用毅力創(chuàng)造自己!

      馬拉松跑步健身
      2026-04-25 21:12:35
      針對中國的協(xié)議,美歐還是聯(lián)手了,不到24小時,中方反制已經(jīng)落下

      針對中國的協(xié)議,美歐還是聯(lián)手了,不到24小時,中方反制已經(jīng)落下

      共工之錨
      2026-04-26 00:17:17
      太慘了!燃油車再迎大降價:最大跌幅50%,豪華車帶頭“跳水”

      太慘了!燃油車再迎大降價:最大跌幅50%,豪華車帶頭“跳水”

      沙雕小琳琳
      2026-04-23 02:29:16
      血本無歸!華晨宇斥資數(shù)億的演唱會場,如今被拆得渣都不剩

      血本無歸!華晨宇斥資數(shù)億的演唱會場,如今被拆得渣都不剩

      南萬說娛26
      2026-04-25 09:40:53
      血脂高不高,看頭就知道!血脂高的人,會有4個表現(xiàn),看看有沒有

      血脂高不高,看頭就知道!血脂高的人,會有4個表現(xiàn),看看有沒有

      DrX說
      2026-04-24 15:00:03
      黃一鳴回應(yīng):沒結(jié)婚一天找8個男的也沒關(guān)系 承認(rèn)跟40歲大叔交往過

      黃一鳴回應(yīng):沒結(jié)婚一天找8個男的也沒關(guān)系 承認(rèn)跟40歲大叔交往過

      奇思妙想草葉君
      2026-04-24 22:03:45
      她是最好命豪門闊太,僅拍一部戲就結(jié)婚隱退,被演員老公寵愛30年

      她是最好命豪門闊太,僅拍一部戲就結(jié)婚隱退,被演員老公寵愛30年

      陳意小可愛
      2026-04-25 17:04:36
      2026-04-26 01:55:00
      機(jī)器之心Pro incentive-icons
      機(jī)器之心Pro
      專業(yè)的人工智能媒體
      12852文章數(shù) 142636關(guān)注度
      往期回顧 全部

      科技要聞

      DeepSeek V4發(fā)布!黃仁勛預(yù)言的"災(zāi)難"降臨

      頭條要聞

      媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

      頭條要聞

      媒體:美軍在中東罕見高密度集結(jié) 伊朗開始調(diào)整戰(zhàn)術(shù)

      體育要聞

      那一刻開始,兩支球隊的命運(yùn)悄然改變了

      娛樂要聞

      《我們的爸爸2》第一季完美爸爸翻車了

      財經(jīng)要聞

      90%訂單消失,中東旺季沒了

      汽車要聞

      2026款樂道L90亮相北京車展 樂道L80正式官宣

      態(tài)度原創(chuàng)

      教育
      親子
      旅游
      公開課
      軍事航空

      教育要聞

      一根風(fēng)箏線,牽起一個校長的教育夢

      親子要聞

      發(fā)生率僅十萬分之一!這種稀有血型跨省緊急調(diào)配,只為守護(hù)母嬰安全

      旅游要聞

      美猴王VS水蜜桃,連云港、無錫文旅“雙向奔赴”

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      美防長:戰(zhàn)事不會“沒完沒了”

      無障礙瀏覽 進(jìn)入關(guān)懷版 主站蜘蛛池模板: 久久综合色之久久综合色 | 麻豆国产97在线 | 欧洲| 亚洲国产精品久久久久久久| 大黑人交xxxx18视频| 搡老熟女老女人一区二区| 欧美日韩导航| chinese熟女老女人hd视频| 天天摸天天做天天爽天天舒服| 国产精品麻豆欧美日韩ww| 美女黄18以下禁止观看| 亚洲精品自拍在线视频| 阳城县| 热99re久久免费视精品频| 美国黄色片一区二区三区| 国产精品人妻一码二码尿失禁| 精品无码久久久久久久久久| 人妻窝窝WWW聚色窝| 亚洲人成亚洲人成在线观看| www.久久se精品一区二区.com| yy111111少妇影院免费观看| www.熟女| 亚洲成A∨人片在线网| 一本本月无码-| 亚洲中文字幕无码专区| 浏阳市| 亚洲综合无码精品| 国产成人精品综合在线观看| 激情图区| 国禁国产you女视频网站| 一根材综合成网| 国产v综合v亚洲欧美久久| 国产区成人精品视频| 聂拉木县| 免费无码一区无码东京热| 国产浮力第一页草草影院| 欧美人人妻人人澡人人尤物| 亚洲老熟女| 国产精品国产三级国产午| 久久精品一区二区三区四区| 成人片黄网站色大片免费毛片| 97福利在线|