
撰文 | Bruce 編輯|馬青竹
“華為不會走向VLA的路徑。我們認為這樣的路徑看似取巧,其實并不是走向真正自動駕駛的路徑。華為更看重WA,也就是World Action,中間省掉language這個環節。”
近日,華為智能汽車解決方案BU CEO靳玉志談及技術路線時稱。
目前,理想、小鵬、卓馭和元戎啟行等選擇了VLA的技術方向。而且小鵬、理想近期均宣布推送VLA。
與上述幾家不同,華為ADS4采用了WEWA技術架構。據官方介紹,這一架構可使端到端時延降低50%,通行效率提升20%,重剎率降低30%。
8月下旬,靳玉志在社交平臺預告,“下個月,首批ADS4將陸續推送。”
伴隨華為ADS4到來,WEWA將影響新車尊界S800、問界M8等,并通過OTA,覆蓋已搭載華為乾崑方案的合作車型。
而根據靳玉志公布的數據,搭載華為乾崑智駕的汽車數量已正式突破百萬輛。從上車規模看,WEWA的影響不容小覷。
那么,WEWA究竟與VLA有何不同,華為乾崑為何會選擇這一架構?
生成數據,解決“難例”場景
靳玉志曾對WEWA如此評價:“比VLM、VLA更智能。”
WEWA架構由兩部分組成,其一,World Engine(WE),指云端的“世界引擎”;其二,World Action Model(WA),指車端的“世界行為模型”。
![]()
世界引擎基于“難例”擴散生成模型,可生成“高質量、高密度”的“難例”場景數據。
華為乾崑官方解釋,所謂“難例”場景,包括前車急剎、突然出現的行人、無保護左轉等。并表示,真正對安全產生威脅的“難例”場景十分罕見,難以人工采集。
靳玉志披露的數據顯示,“華為(今年4月)已在云端世界引擎進行了6億公里的高速L3仿真與驗證,已為高速L3量產做好準備。”
值得注意的是,采用VLA路徑的廠商(如理想、元戎啟行)也同樣重視仿真技術,特別是通過世界模型生成極端場景數據來訓練和強化模型。
比如,理想會通過生成方式獲得仿真數據,并用于訓練模型。理想的MindVLA,也會基于仿真實現閉環強化學習。
通過自研的世界模型仿真系統,理想復刻了“99%的中國路況”,生成2000余種如暴雨淹路、隧道失效等傳統方案難以解決的長尾場景。
不過,在仿真基礎上,VLA路線的各家更依賴真實行駛數據。
![]()
比如,元戎啟行認為,現實世界中很多復雜微妙的臨界態,模擬器很難被描述。
臨界態,主要指處于性能邊界或安全邊界時所產生和依賴的數據。比如,要模擬綢緞,一塊布要用顯卡渲染,需要把布拆成幾十上百萬份,在現實世界中采集,更為高效。
卓馭的VLA,同樣依賴大規模真實道路場景數據訓練,具有數十億參數規模。通過融合視覺和大語言模型的能力,VLA可解析行人橫穿、道路施工、特殊車輛等長尾場景。
所以,華為的WEWA更強調生成仿真,VLA偏好真實路測數據,是區別之一。但真實路測與仿真并非截然對立,而是不同技術路線各有側重和組合。
基模型、多模態與算力平臺
模型控車方面,這兩個路線也有區別。
WEWA采用的世界行為模型,其工作流程是,基于攝像頭、雷達/激光雷達、車內/外麥克風等獲得的全模態感知數據,直接推理和決策。
這一過程中,主要涉及三項能力。
基于專為智能輔助駕駛和自動駕駛打造的原生基模型的能力,可以做到更低的時延。
全模態(視覺、聽覺、觸覺)感知能力,可構建全維度環境模型。
MoE多專家能力,可根據實時環境調用最優決策專家,降低計算負載,提高決策速度和準確性,提升響應能力。
在云端生成各類“難例”場景數據,用于訓練大模型。之后,將訓練好的云端世界模型,通過蒸餾部署到車端。再由車端模型通過多模態感知,基于MoE等能力做出決策,輸出行駛軌跡等。
VLA模型因其語言模型的特性,其推理過程可能更易于被理解和解釋。而WEWA架構的世界行為模型則側重于對物理世界的直接推演和預測,如何呈現和輸出思維鏈,有待進一步跟蹤觀察。
WEWA與VLA的區別,還體現在算力平臺層面。VLA模型的部署,目前主要在英偉達Thor、圖靈等新一代算力平臺上。
原因在于,模型參數規模變大對功耗和并行計算提出要求。同時,需要有高效的硬件加速設計,讓系統更好地做實時數據分析。Thor U、圖靈等新一代算力平臺符合這一需求。
WA模型可以直接從視覺等信息輸入實現控車,無需轉換成語言符號,避免了精度損失和信息轉換的延遲。也許可以降低對大算力的依賴。
拼體驗,“Talk is cheap”
無論何種架構,最終還要看體驗如何。
基于WEWA的華為ADS4,能力再次進化。在靳玉志發布的一則視頻中,華為ADS4 Beta避開了路上一個下水道井蓋。
![]()
“在WEWA架構的加持下,對突發狀況的處理非常類人,甚至‘超人’。避開了井蓋,并減速通過,整個過程行云流水,非常絲滑。”靳玉志表示。
VLA的體驗同樣揭開了面紗。
就在靳玉志宣布華為ADS4推送計劃的前一天,小鵬宣布,“全新小鵬P7和小鵬G7的全場景VLA來了”。
從小鵬公布的信息看,其VLA可以實現的功能,主要包括預判遮擋盲區的“鬼探頭”、路口盲區提前減速、面對積水路面提前減速等。
理想也公布了VLA的進展,將于本月開啟全量推送。搭載VLA的理想i8,可以在無燈控路口、無保護右轉燈場景以更類人的方式通過。
可以預見,新一輪功能體驗對決很快將至。
值得注意,Momenta創始人、CEO曹旭東近期發聲表示:
“VLM、VLA是很好的方向,但是錦上添花的方向。提升要用強化學習,把端到端大模型放到通過海量真實數據構建起來的仿真環境去做探索,成功就給獎勵,失敗就給懲罰,學習到什么是安全駕駛和高效駕駛。把模型的上限和安全的上限提升100到1000倍,甚至1000到10000倍。”
無論WEWA,還是VLA,一位智駕從業人士告訴筆者,部分觀點甚至沒有討論的必要,“Talk is cheap,在車上用起來才是硬道理。”
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產業鏈進化,關注新產品、新科技、商業邏輯與商業人物,影響圈層中有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.