網易首頁 > 網易號 > 正文申請入駐

理想的VLA，不只是輔助駕駛

2026-01-22 17:01:21　來源: 金融界

北京舉報

分享至

當一輛車開始學會“觀察、思考、然后行動”，它就不再僅僅是一個交通工具。2025年，隨著理想i8的交付，全球首個量產的VLA（視覺-語言-行為）司機大模型駛入現實。這并非一次尋常的輔助駕駛升級，而是一次關乎AI如何理解物理世界的本質躍遷。理想的VLA，將引領我們去往何處？答案或許遠超輔助駕駛本身。

從“模仿”到“思考”的必然

理想汽車的輔助駕駛演進歷程，在某種程度上，是中國智能汽車產業技術攻堅與認知深化的一面鏡子，也深刻揭示了VLA的里程碑式意義。理想汽車輔助駕駛早期應用的BEV鳥瞰圖、NPN先驗網絡、無圖方案均屬于“人工時代”的產物，依賴工程師編寫的海量規則，其天花板是無法窮盡的極端場景。隨后到來的“端到端+VLM”架構讓理想汽車輔助駕駛邁入了“AI時代”，本質是通過模仿人類駕駛數據來學習，但理想汽車董事長兼CEO李想認為端到端方案仍是“猴子開車”——能模仿行為，卻不理解物理世界背后的邏輯。

真正的轉折點出現在2025年初。當端到端模型的訓練數據超過1000萬Clips（視頻片段）后，理想汽車研發團隊發現性能提升放緩。同時，“模仿學習”固有的缺陷開始顯現：模型缺乏深度推理能力，導致駕駛行為有時違反常理，在面對復雜博弈時安全感不足。VLM視覺語言模型的引入試圖補足“大腦”，但其與端到端控制模型之間的“溝通壁壘”和較慢的推理速度，成了新的瓶頸。

正是在此背景下，VLA技術路線被推至臺前。但與此同時，行業內也同步出現了選擇世界模型作為車端推理模型的技術路線。一時間，行業內外對于兩種新興的技術路線產生了分歧，選擇VLA路線的認為世界模型受到車端算力等約束，而選擇世界模型的則認為VLA路線是“過渡技術”。理想汽車自動駕駛高級副總裁郎咸朋的觀點一針見血：“空談架構不如看療效。”他表示，堅持VLA有兩個原因：第一，因為理想汽車擁有超過150萬輛車提供的海量真實數據，同時理想汽車構建了數據閉環（意味著可以將海量數據真正應用于VLA司機大模型的訓練，提升輔助駕駛性能）；第二，在當前的算力下，VLA能夠讓輔助駕駛的駕駛水平接近人類駕駛員。截至2025年底，VLA司機大模型推送后月使用率達到80%，VLA指令使用次數達到1225.4萬次“從目前用戶使用的反饋看，在某些場景下理想的VLA已經具備了對物理世界的認知涌現。具體表現是用戶會越來越多的發現之前端到端沒有的擬人行為。”郎咸朋說。

郎咸朋提到的“擬人行為”實際上正是理想汽車面向未來的關鍵。擬人行為背后不再是簡單模仿人類，而是需要模型能看到物理世界并且會思考。這也是李想眼中，AI演進的必然結果——從昆蟲動物智能（對應規則算法）到哺乳動物智能（對應端到端+VLM），再到人類智能（對應VLA司機大模型）。VLA司機大模型具備思維鏈式的推理能力，更貼近人類理解世界的方式，并且可以把人類語義融入行為判斷，最顯性的能力就是用戶可以通過語音指揮車輛。VLA，正是為汽車賦予“人類智能”的關鍵一步。

從輔助駕駛到具身智能基座的野望

VLA的價值，遠不止于提升輔助駕駛的通行效率和擬人化程度。在理想的規劃中，它正成為下一代AI系統的技術基座。在2025年第三季度電話會上，李想將公司的未來賽道明確為“具身智能”，在他看來，將汽車定義為“具身智能產品”，而非簡單的電動車或智能終端，是價值升維的關鍵。這意味著汽車將從被動響應指令的工具，轉變為能自動、主動提供服務的機器人。

VLA，正是這個“機器人大腦”的核心基座。它讓汽車開始具備“思維鏈”推理能力，能理解復雜場景并做出決策；其語言智能使得人車自然交互成為可能；而通過行為強化學習，它還在不斷進化，無限逼近人類駕駛的“老司機”體感。這一能力的持續進化近期迎來了一個新的節點。2026年1月21日，隨著OTA 8.2正式推送，AD Max平臺的VLA司機大模型迎來重磅升級。理想汽車自動駕駛研發高級副總裁郎咸朋對新版本的VLA司機大模型總結道：“這個版本用戶體驗提升最明顯的就是更加像人在開車了，大幅度減少了機械感的頓挫以及無效變道。” 他進一步透露，團隊針對早期版本為保障安全而妥協的舒適性與效率，通過對數據重新清洗和篩選，并替換約200萬段優質駕駛數據進行強化訓練，使模型能力獲得了顯著提升。基于過去兩個月在北京、上海、深圳、杭州等多地累計上千公里的實際對比測試，郎咸朋認為：“我非常確認OTA 8.2后的VLA就是行業領先。”

當VLA的能力邊界隨著數據與算力持續擴展，最終突破L3/L4級自動駕駛門檻時，汽車就將蛻變為真正的“汽車機器人”。理想在輔助駕駛上的深耕，實質上是在鍛造一套通用的具身智能AI系統：感知、模型、操作系統、算力、本體。

更具深遠意義的是，理想的探索正在引發廣泛的產業漣漪。2025年以來，部分領先的輔助駕駛企業、汽車企業，均開始關注或探索VLA路線。這驗證了其技術方向的前瞻性。理想的實踐，不僅為其自身構筑了深厚的技術護城河，更如同一個探針，為行業驗證了一條將大規模數據、先進算法與工程化能力深度融合，從而鍛造出可進化、能思考的“硅基生命體”的可行路徑。

理想汽車向具身智能的堅定轉型，或許正釋放出一個強烈信號：輔助駕駛產業的終極形態，可能并非只是“無人駕駛”，而是孵化出成熟的具身智能產品；傳統汽車產業與人工智能的深度融合，催生的將是一個全新的“具身智能產業”。

這場變革的核心，不再是功能的簡單疊加或單一技術的突破，而是如何系統性地打造一個能理解物理世界、可學習進化、并能安全高效交互的AI系統。VLA司機大模型，是理想給出的當下答案，也是它面向那個更廣闊未來所交出的第一張船票。當汽車開始真正學會觀察、思考與行動，一場關于出行、關于機器人、乃至關于人機共存的產業新敘事，才剛剛拉開序幕。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.