<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網(wǎng)易首頁 > 網(wǎng)易號 > 正文 申請入駐

      世界引擎:Post-Training開啟Physical AGI新紀元

      0
      分享至



      一年前,DeepSeek R1 橫空出世,人們才意識到,真正讓模型產(chǎn)生推理能力質(zhì)變的,不必是更大的預訓練規(guī)模 —— 后訓練,用強化學習、過程獎勵、閉環(huán)反饋,以極低的代價解鎖了原本需要數(shù)倍算力才能觸達的能力邊界。
      這場范式革命,正在物理世界重演。
      自動駕駛系統(tǒng)已經(jīng)在海量駕駛數(shù)據(jù)上完成了預訓練,但距離真正的 Physical AGI,仍有一道鴻溝:模型知道 "該怎么開",卻不知道「為什么這樣開更好」。真正的進化,需要閉環(huán)、需要反饋、需要在與世界的交互中不斷修正。
      香港大學李弘揚團隊聯(lián)合華為、上海創(chuàng)智學院給出了他們的答案 —— 世界引擎:以后訓練為核心范式,以閉環(huán)仿真為訓練環(huán)境,驅(qū)動自動駕駛系統(tǒng)在海量真實與合成場景的交互中,涌現(xiàn)出真正的決策能力。



      • 代碼地址:https://github.com/OpenDriveLab/WorldEngine
      • 主頁:https://opendrivelab.com/WorldEngine/

      作為自動駕駛領域的重要學術力量,2022 年底,OpenDriveLab 推出UniAD—— 第一個將感知、預測、規(guī)劃統(tǒng)一在單一框架下的端到端系統(tǒng),以「規(guī)劃為中心」重新定義了自動駕駛的建模范式,成為學術界公認的里程碑。

      但 UniAD 之后,一個更深的問題浮出水面:端到端系統(tǒng)在學術 benchmark 上表現(xiàn)優(yōu)異,真實世界卻是另一回事。

      雨夜里逆行的電動車,施工路段突然倒下的錐桶,大客車后方的鬼探頭 —— 這些長尾場景,在訓練數(shù)據(jù)里幾乎不存在。靠更大的數(shù)據(jù)集、更深的網(wǎng)絡,無法根本性地解決。

      OpenDriveLab 開始從兩個方向同時推進。一方面,MTGS 通過多次遍歷的 3D 高斯?jié)姙R技術,構建出高保真的可渲染駕駛場景 —— 這是閉環(huán)仿真的物理基礎。另一方面,Nexus、Omega 等世界模型工作聚焦于反事實難例高動態(tài)交互模擬,突破真實數(shù)據(jù)對長尾場景覆蓋的天然局限。

      至此,一個核心問題自然浮現(xiàn):有了高保真仿真環(huán)境,有了能生成難例的世界模型,如何讓端到端系統(tǒng)真正在其中安全進化?

      答案,就是后訓練

      2025 年 4 月,華為發(fā)布 ADS 4.0,正式披露了全新技術架構 WEWA。其中云端核心World Engine,正是華為與 OpenDriveLab 聯(lián)合開發(fā)的成果。(https://auto.huawei.com/cn/ads)華為將這套架構的目標定義為:面向自動駕駛,從類人到超人。

      World Engine,由此登場。

      World Engine:邁向物理 AI 的后訓練時代

      如果說預訓練讓自動駕駛系統(tǒng)學會了「模仿」,那后訓練要解決的,是如何讓系統(tǒng)學會「判斷」。

      World Engine 的設計哲學,正是圍繞這一目標展開。它不是一個單一模型,而是一套完整的后訓練 pipeline,由三個核心能力構成:

      • 3DGS 仿真環(huán)境—— 基于 3DGS 構建的高保真視覺輸入,為后訓練提供了真正意義上的閉環(huán)反饋。系統(tǒng)的每一個決策,都能在環(huán)境中得到即時響應,而不是停留在數(shù)據(jù)回放。
      • 難例挖掘 & 擴散生成—— 真實世界的長尾場景稀缺且難以復現(xiàn)。World Engine 首先從海量真實駕駛數(shù)據(jù)中主動挖掘難例,再以世界模型為工具,對這些難例進行擴散生成后,依托仿真環(huán)境進行渲染,放大長尾場景的密度與多樣性,讓系統(tǒng)在訓練中「見過」它在路上可能遇到的一切。
      • 基于強化學習的后訓練——World Engine 在仿真生成的大規(guī)模難例場景上,以強化學習驅(qū)動系統(tǒng)優(yōu)化,將安全價值規(guī)范內(nèi)化為獎勵信號,讓系統(tǒng)不只是「開得快」,更是「開得對」。

      三者協(xié)同,構成了一個完整的飛輪:仿真生成難例,難例驅(qū)動后訓練,后訓練強化決策能力。



      圖 1 World Engine 架構總覽

      從暴露弱點到超越弱點

      三個模塊,一套飛輪。

      難例挖掘與擴散生成

      World Engine 首先讓模型「自己暴露弱點」。將預訓練好的端到端模型在訓練集上做開環(huán)推理,以 PDMS 作為評判標準,自動篩選出模型表現(xiàn)差的場景 —— 碰撞、偏離道路、自車停滯不前。這些場景,就是模型的能力邊界所在。

      挖掘出難例之后,World Engine 并不止步于此。行為世界模型(Behaviour World Model) 以解耦擴散的方式,對這些難例場景進行變體生成 —— 在保持真實地圖拓撲與場景布局的前提下,引入對抗性交通行為,批量合成高密度的安全關鍵場景。真實數(shù)據(jù)的長尾,由此被系統(tǒng)性地放大。



      圖 2 難例擴散生成典型 case

      高保真閉環(huán)仿真

      難例場景需要一個足夠真實的舞臺。World Engine 內(nèi)置了基于3DGS 的場景重建 pipeline—— 融合同一路段的多次真實駕駛記錄,構建出扎根于真實世界的高保真三維場景。這不是憑空生成的虛擬沙盒,而是閉環(huán)訓練的真實物理基礎。



      圖 3 高保真閉環(huán)仿真效果圖

      基于強化學習的后訓練

      有了大規(guī)模難例數(shù)據(jù),World Engine 以離線強化學習驅(qū)動端到端模型持續(xù)優(yōu)化。獎勵信號將舒適性、避障、道路合規(guī)等安全價值直接內(nèi)化為訓練目標。模型不再只是模仿人類駕駛員,而是在與難例的反復博弈中,學會真正的安全決策。



      圖 4 navsim 測試難例集對比

      World Engine 發(fā)現(xiàn)了什么?

      數(shù)據(jù)量上做加法,不如在訓練范式上做乘法



      圖 5 驗證 Data Scaling: 將預訓練數(shù)據(jù)集場景數(shù)量從 12k 增廣至 103k 進行對比

      自動駕駛行業(yè)有一個長期信仰:數(shù)據(jù)越多,模型越安全。World Engine 給出了一個更復雜的答案。

      將預訓練數(shù)據(jù)從 1.3 萬個場景一路擴大到 10.3 萬個,在日常駕駛場景上,scaling law 如期生效 —— 數(shù)據(jù)越多,表現(xiàn)越好。但在安全關鍵的長尾場景上,曲線很快躺平。原因并不意外:真實路測中危險場景本就極度稀缺,堆再多常規(guī)數(shù)據(jù),模型在關鍵時刻依然束手無策。

      數(shù)據(jù) scaling,在長尾場景這件事上,撞上了天花板。

      World Engine 的后訓練給出了另一條路徑:在仿真環(huán)境中以強化學習反復博弈難例場景,將避障、合規(guī)、舒適性直接編碼為優(yōu)化目標,同時確保系統(tǒng)不丟失預訓練階段習得的基礎駕駛能力。從同一個基礎模型出發(fā),后訓練直接跨越了 scaling 曲線,實現(xiàn)了等效于將預訓練數(shù)據(jù)擴大約 14 倍的閉環(huán)性能增益。

      一塊都不能少

      后訓練有效,但增益從何而來?World Engine 對自身的三個核心模塊做逐一拆解。



      圖 6 navsim 數(shù)據(jù)集上不同訓練后范式對比

      光喂數(shù)據(jù)沒用。拿到稀有場景數(shù)據(jù),模仿學習幾乎不改善閉環(huán)表現(xiàn)。模型學會了「照做」,沒學會「判斷」。強化學習才是那個開關。

      練什么比怎么練更重要。同樣是強化學習,在普通場景上練,閉環(huán)成功率反而下降 —— 就像一個學生只刷簡單題,考試遇到難題反而更慌。只有聚焦難例,能力才真正提升。

      仿真不是有就行,得「活」起來。當仿真里的其他車輛只是錄像回放,收益有限;當它們開始對自車行為做出反應、甚至主動制造對抗,閉環(huán)成功率從 76% 一路拉到 89% 。World Engine 的行為世界模型,補上的正是這最后一環(huán)。

      從仿真到路測:World Engine 的工業(yè)級答卷

      學術 benchmark 之外,World Engine 接受了一次更嚴苛的考驗 —— 華為 ADS 系統(tǒng)的工業(yè)級驗證。

      基礎模型在超過 8 萬小時真實駕駛數(shù)據(jù)上完成預訓練,覆蓋全國 100 余座城市、逾千萬條駕駛片段。這已經(jīng)是一個極強的起點。World Engine 后訓練在此基礎上繼續(xù)發(fā)力。

      工業(yè)閉環(huán)仿真



      圖 7 ADS 工業(yè)級閉環(huán)仿真結果對比

      團隊利用華為 ADS 的工業(yè)級閉環(huán)仿真平臺對后訓練模型進行了全面評估 —— 超過1 萬個測試場景,累計模擬駕駛里程逾3000 公里,全部為高密度交互的事件性場景,而非平淡的常規(guī)巡航。結果橫跨六項安全指標,全面改善,其中切入碰撞更是下降 45.5%。

      實車路測

      仿真之后,World Engine 走上了上海真實路面。測試路線涵蓋城市快速路與城區(qū)道路,總計約200 公里,重復測試三次完成。



      圖 8 上海市內(nèi)高架測試路線



      圖 9 上海市城區(qū)測試路線

      測試覆蓋的場景,是城市駕駛中真正讓人驚出冷汗的時刻:夜間施工區(qū)的臨時改道、行人從視覺盲區(qū)橫穿、無保護左轉(zhuǎn)后的施工區(qū)。這些場景的共同特征是 —— 即便是經(jīng)驗豐富的人類駕駛員,也需要高度集中注意力,稍有遲疑就可能出事。



      典型實車場景 1



      典型實車場景 2



      典型實車場景 3

      而 World Engine 后訓練模型全程無需人工介入。

      Post Training,不止于自動駕駛

      World Engine 的故事,從自動駕駛出發(fā)。但它真正想回答的問題,遠不止于此。

      回到最核心的洞見:當真實世界無法為你提供足夠的關鍵失敗場景時,就主動去創(chuàng)造它們。在這些失敗中反復博弈,在這些邊界上持續(xù)進化。這個邏輯,和駕駛無關 —— 它是所有 Physical AI 系統(tǒng)共同面臨的根本困境。

      Physical AI 與數(shù)字 AI 最本質(zhì)的區(qū)別,在于不可逆性。語言模型說錯一句話,刷新重來;推薦系統(tǒng)給錯一個結果,下一次糾正。但物理世界里,機器人打碎了一個杯子,手術機器人劃錯了一刀,自動駕駛追尾了一輛車 —— 錯誤已經(jīng)發(fā)生,無法撤銷。這意味著,Physical AI 必須在真正上線之前,就已經(jīng) "見過" 那些最危險的時刻。

      但現(xiàn)實是,這些最危險的時刻,恰恰是最難收集的數(shù)據(jù)。

      這些領域,和自動駕駛面對的是同一個結構性困境:最需要學習的場景,天然地缺席于訓練數(shù)據(jù)。

      World Engine 提供的范式正是針對這一困境的系統(tǒng)性回答。具體的技術實現(xiàn)會因領域而異:3DGS 渲染可以換成物理引擎或視頻世界模型,行為世界模型可以換成機械臂動力學仿真或人體運動生成 —— 但核心邏輯不變:不被動等待數(shù)據(jù),主動生成經(jīng)驗;不只模仿人類,在與世界的博弈中涌現(xiàn)能力。

      OpenDriveLab 正在將這條路延伸到更廣闊的具身智能領域。從端到端自動駕駛出發(fā),走向能在物理世界中感知、推理、行動、進化的通用智能體 —— 這是具身智能研究的終極命題,也是 Physical AGI 真正的意涵所在。

      自動駕駛,是這場旅程的第一個戰(zhàn)場。

      而 Post-Training,將是 Physical AGI 時代最重要的基礎設施之一。

      項目作者簡介

      World Engine 由香港大學助理教授、上海創(chuàng)智學院全時導師李弘揚博士與華為蘇鵬博士共同擔任項目負責人,李天羽(上海創(chuàng)智學院)、陳立(香港大學)、王曹俊(上海創(chuàng)智學院)、劉浩晨(南洋理工大學)為項目核心貢獻者,共同主導新范式的研究與實現(xiàn);蘇鵬博士團隊從產(chǎn)業(yè)視角出發(fā),推動技術的量產(chǎn)落地與應用部署。

      特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      人活著,其實就兩件事,想通了,后半輩子都順了

      人活著,其實就兩件事,想通了,后半輩子都順了

      小書蟲媽媽
      2026-04-20 08:55:59
      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      最高院:提供 “口交” “肛交”等進入式性服務,是否屬賣淫行為?

      周軍律師聊案子
      2026-04-21 09:50:16
      不能原諒!港獨藝人道歉求和,想來內(nèi)地撈金,過往行徑被扒好惡心

      不能原諒!港獨藝人道歉求和,想來內(nèi)地撈金,過往行徑被扒好惡心

      法老不說教
      2026-04-21 19:16:37
      1935年,如果將瀘定橋炸毀,紅軍可能全軍覆沒,劉文輝為何沒炸?

      1935年,如果將瀘定橋炸毀,紅軍可能全軍覆沒,劉文輝為何沒炸?

      健康快樂丁
      2025-03-29 20:30:04
      中國軍艦大片震撼上新!“雷達一開,其他都是透明的……”

      中國軍艦大片震撼上新!“雷達一開,其他都是透明的……”

      環(huán)球網(wǎng)資訊
      2026-04-22 09:00:22
      愿無大礙,文班進攻時面部朝下重摔倒地,現(xiàn)已返回更衣室

      愿無大礙,文班進攻時面部朝下重摔倒地,現(xiàn)已返回更衣室

      懂球帝
      2026-04-22 09:00:12
      “法院干警配偶低價拍得銀行6000萬債權”引質(zhì)疑,多方回應

      “法院干警配偶低價拍得銀行6000萬債權”引質(zhì)疑,多方回應

      澎湃新聞
      2026-04-21 14:58:02
      等不到特朗普訪華了,美國提前對華攤牌:要求秘魯把中國趕出港口

      等不到特朗普訪華了,美國提前對華攤牌:要求秘魯把中國趕出港口

      書紀文譚
      2026-04-21 23:04:19
      新秀王之蔑視?埃奇庫姆登全美熱搜!30+10+6三分創(chuàng)6紀錄超魔術師

      新秀王之蔑視?埃奇庫姆登全美熱搜!30+10+6三分創(chuàng)6紀錄超魔術師

      顏小白的籃球夢
      2026-04-22 09:45:10
      山師大附中胡雪梅心梗去世,年僅41歲,學生痛別:老師可以休息了

      山師大附中胡雪梅心梗去世,年僅41歲,學生痛別:老師可以休息了

      天天熱點見聞
      2026-04-22 06:47:54
      一夜被吞!四川27家銀行集體解散,釋放啥信號?普通人一定要看

      一夜被吞!四川27家銀行集體解散,釋放啥信號?普通人一定要看

      牛鍋巴小釩
      2026-04-21 11:43:16
      伊朗軍艦軍演返航時遭美軍擊沉致87死,幸存船員講述細節(jié):那里并非戰(zhàn)區(qū),事先沒有收到任何警告,他們的目標是殺人

      伊朗軍艦軍演返航時遭美軍擊沉致87死,幸存船員講述細節(jié):那里并非戰(zhàn)區(qū),事先沒有收到任何警告,他們的目標是殺人

      每日經(jīng)濟新聞
      2026-04-22 00:08:27
      高峰現(xiàn)狀:離開那英后娶了同學,住北京郊區(qū)小院,和兒子形同陌路

      高峰現(xiàn)狀:離開那英后娶了同學,住北京郊區(qū)小院,和兒子形同陌路

      冷紫葉
      2026-04-21 13:26:25
      美伊停火倒計時歸零!雙方代表都沒啟程!特朗普放狠話,油價暴漲

      美伊停火倒計時歸零!雙方代表都沒啟程!特朗普放狠話,油價暴漲

      軍機Talk
      2026-04-22 10:20:32
      俄羅斯刪除20年法院數(shù)據(jù):審判記錄一夜清空,戰(zhàn)爭信息正在被封住

      俄羅斯刪除20年法院數(shù)據(jù):審判記錄一夜清空,戰(zhàn)爭信息正在被封住

      桂系007
      2026-04-21 23:55:34
      “挪用父親公司1700萬”女孩發(fā)聲:一次打賞10萬沒感覺,現(xiàn)實中買包都嫌貴;把女主播推上位有成就感,后來她有了更多大姐,就去刷男團……

      “挪用父親公司1700萬”女孩發(fā)聲:一次打賞10萬沒感覺,現(xiàn)實中買包都嫌貴;把女主播推上位有成就感,后來她有了更多大姐,就去刷男團……

      都市快報橙柿互動
      2026-04-21 23:46:41
      印尼豪賭大潰敗,再次證明了:中國行,但你真不行

      印尼豪賭大潰敗,再次證明了:中國行,但你真不行

      閱微札記
      2026-04-21 11:52:23
      左手幻覺,右手投毒,普通人憑什么相信AI?

      左手幻覺,右手投毒,普通人憑什么相信AI?

      果殼
      2026-04-20 20:09:40
      網(wǎng)盤禁止傳播存儲國外影視劇,這意味著什么?

      網(wǎng)盤禁止傳播存儲國外影視劇,這意味著什么?

      十柱
      2026-04-21 14:04:56
      再出名有啥用?51歲老來得女的劉德華,如今還是為女兒操碎了心

      再出名有啥用?51歲老來得女的劉德華,如今還是為女兒操碎了心

      荒野老五
      2026-04-22 03:39:25
      2026-04-22 11:23:00
      機器之心Pro incentive-icons
      機器之心Pro
      專業(yè)的人工智能媒體
      12826文章數(shù) 142633關注度
      往期回顧 全部

      科技要聞

      凌晨突發(fā)!ChatGPT Images 2.0發(fā)布

      頭條要聞

      牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

      頭條要聞

      牛彈琴:伊朗發(fā)出讓人毛骨悚然的警告 玩的就是心跳

      體育要聞

      一到NBA季后賽,四屆DPOY就成了主角

      娛樂要聞

      復婚無望!baby黃曉明陪小海綿零交流

      財經(jīng)要聞

      伊朗拒絕出席 特朗普宣布延長停火期限

      汽車要聞

      四款全球首秀+AI落地 大眾汽車集團在華轉(zhuǎn)型全面提速

      態(tài)度原創(chuàng)

      本地
      數(shù)碼
      時尚
      公開課
      軍事航空

      本地新聞

      春色滿城關不住|白鵑梅浪漫盛放,吳山藏了一片四月雪

      數(shù)碼要聞

      零刻Mate Pro多功能擴展塢上市:USB4 v2 + 4盤位,1059元

      頂流復工,已判若兩人

      公開課

      李玫瑾:為什么性格比能力更重要?

      軍事要聞

      特朗普宣布延長停火 伊朗表態(tài)

      無障礙瀏覽 進入關懷版