版權聲明:本文版權為網易汽車所有,轉載請注明出處。
網易汽車12月11日報道 近日,理想汽車自動駕駛研發高級副總裁郎咸朋通過微博,就宇樹科技創始人王興興此前提出的“VLA技術路線擔憂”進行了回應。郎咸朋明確指出,VLA是理想認為最優的自動駕駛模型方案,而具身智能的關鍵在于整體系統能力。這一表述不僅回應了技術爭議,也提供了理想對自動駕駛未來發展路徑的清晰判斷。
![]()
用效果說話:OTA 8.1是VLA方法論的階段性驗證
郎咸朋強調,“空談架構不如看療效”,理想堅持VLA路線的前提,是基于數百萬輛車形成的數據閉環。OTA 8.1的更新為這一觀點提供了直觀驗證。感知能力的升級是首要變化,通過使用2D ViT技術將感知分辨率從1K提升至2K,識別距離從100米延長至200米,車輛能夠更早識別紅綠燈,實現更加平順和舒適的制動體驗。感知能力提升,為模型生成軌跡和控制信號提供了更高質量的輸入,這與郎咸朋提出的“模型必須與具身智能系統整體適配”高度契合,也說明具身智能不是單一大腦強就夠,而是系統協同的重要體現。
OTA 8.1在路徑選擇與決策能力上的優化同樣顯著。在主輔路切換和岔路選擇等關鍵場景中,無效變道明顯減少,決策更加精準。理想通過約600萬Clips優質駕駛數據對模型重新訓練,使VLA能夠持續通過強化學習迭代,不斷接近人類駕駛邏輯。郎咸朋同時指出,世界模型更適合云端考場,用于仿真和數據生成,而車端推理仍由VLA執行。這種車端務實、云端高逼真訓練的分工模式,體現了理想對系統架構的務實思考。
![]()
VLA為何是理想的長期堅持:系統論邏輯下的生成式模型
郎咸朋與王興興在觀點上最大差異在于,前者認為模型關鍵不在于架構本身,而在于與具身智能系統的適配度。VLA作為生成式模型,可直接生成軌跡與控制信號,表現出用戶反饋中的擬人化行為。通過結合大量真實數據與云端仿真數據的持續迭代,VLA逐步形成對空間關系、交通意圖和駕駛習慣的理解能力。相比傳統端到端+VLM模仿學習,VLA強化學習機制能夠處理“未學過”的場景,實現更廣泛泛化能力。
百萬輛車構建的數據閉環是理想對VLA信心的核心。郎咸朋指出,理想不僅擁有十幾億公里的存量數據,還通過150萬輛車獲取實時新增數據。在篩選過程中發現,約40%的駕駛數據存在偏向道路一側或不嚴格遵守限速的現象,這些數據被保留以保持對真實世界駕駛行為的學習。VLA追求的是接近真實駕駛的自然行為,而非幾何意義上的規范軌跡。
系統適配也在底盤層面體現。以VMM(車輛運動管理)模塊為例,減速任務中車輛會根據策略劃分卡鉗制動與液壓制動比例,實現安全性和舒適性的平衡。這說明理想的技術體系不是單一模型,而是通過感知、模型、操作系統、芯片與底盤的全鏈路協同,將系統能力貫穿到每一個決策與執行環節。從這個視角看,“VLA是否最優”已經不是孤立模型問題,而是系統架構下的路徑選擇問題。
具身智能視角:VLA是通往“汽車類具身機器人”的關鍵
郎咸朋的回應還明確了理想未來發展方向,自動駕駛是具身智能,而具身智能不是單一技術點,而是系統能力的綜合體現。李想曾在內部會議中指出,未來五到十年,具身機器人將呈現汽車類與人形類兩種形態。理想選擇以汽車類具身機器人為核心,這是其技術與產品戰略的基礎。
理想在具身智能方向的積累體現在感知、模型、操作系統、算力和本體的全棧協同。郎咸朋強調,“整體系統能力”才是具身智能的本質定義,單項突破無法構建真正的智能體。
VLA之所以成為汽車具身智能的核心,是因為它能夠理解物理世界,并在空間理解、思維推理與駕駛行為生成上形成統一邏輯。它融合視覺、語言與行為,具備鏈式推理能力,生成接近人類司機風格的軌跡,同時通過語言交互形成記憶與駕駛偏好。這正是理想堅持VLA作為長期技術路線的核心邏輯,也是其認為VLA是“最好的自動駕駛方案”的根本原因。
![]()
結語:技術爭議仍將持續,但路徑選擇更清晰
郎咸朋的回應并不是一場“技術路線之爭”的終局,而是一家深度投入自動駕駛與具身智能的企業,基于技術能力、資源稟賦與產品策略所作出的長期判斷。
對于行業來說,VLA、世界模型、端到端等路線的爭論不會馬上結束,但隨著更大規模的車端部署、更成熟的云端仿真體系以及更長期的數據閉環積累,技術路線最終會通過效果決勝,而非觀點決勝。
從OTA 8.1的體驗提升,到理想具身智能系統框架的逐漸清晰,可以確認的是:理想正在用一個越來越系統化、越來越工程化的方式構建其自動駕駛體系。而VLA是否最終成為定義行業的主流路徑,仍需時間驗證。
對于用戶與行業觀察者來說,此次回應至少提供了一個清晰信號:VLA不是一個模型,而是一個系統;自動駕駛不是一個功能,而是具身智能的第一場戰役。
