當一輛車開始學會“觀察、思考、然后行動”,它就不再僅僅是一個交通工具。2025年,隨著理想i8的交付,全球首個量產的VLA(視覺-語言-行為)司機大模型駛入現實。這并非一次尋常的輔助駕駛升級,而是一次關乎AI如何理解物理世界的本質躍遷。理想的VLA,將引領我們去往何處?答案或許遠超輔助駕駛本身。
![]()
從“模仿”到“思考”的必然
理想汽車的輔助駕駛演進歷程,在某種程度上,是中國智能汽車產業技術攻堅與認知深化的一面鏡子,也深刻揭示了VLA的里程碑式意義。理想汽車輔助駕駛早期應用的BEV鳥瞰圖、NPN先驗網絡、無圖方案均屬于“人工時代”的產物,依賴工程師編寫的海量規則,其天花板是無法窮盡的極端場景。隨后到來的“端到端+VLM”架構讓理想汽車輔助駕駛邁入了“AI時代”,本質是通過模仿人類駕駛數據來學習,但理想汽車董事長兼CEO李想認為端到端方案仍是“猴子開車”——能模仿行為,卻不理解物理世界背后的邏輯。
真正的轉折點出現在2025年初。當端到端模型的訓練數據超過1000萬Clips(視頻片段)后,理想汽車研發團隊發現性能提升放緩。同時,“模仿學習”固有的缺陷開始顯現:模型缺乏深度推理能力,導致駕駛行為有時違反常理,在面對復雜博弈時安全感不足。VLM視覺語言模型的引入試圖補足“大腦”,但其與端到端控制模型之間的“溝通壁壘”和較慢的推理速度,成了新的瓶頸。
![]()
正是在此背景下,VLA技術路線被推至臺前。但與此同時,行業內也同步出現了選擇世界模型作為車端推理模型的技術路線。一時間,行業內外對于兩種新興的技術路線產生了分歧,選擇VLA路線的認為世界模型受到車端算力等約束,而選擇世界模型的則認為VLA路線是“過渡技術”。理想汽車自動駕駛高級副總裁郎咸朋的觀點一針見血:“空談架構不如看療效。”他表示,堅持VLA有兩個原因:第一,因為理想汽車擁有超過150萬輛車提供的海量真實數據,同時理想汽車構建了數據閉環(意味著可以將海量數據真正應用于VLA司機大模型的訓練,提升輔助駕駛性能);第二,在當前的算力下,VLA能夠讓輔助駕駛的駕駛水平接近人類駕駛員。截至2025年底,VLA司機大模型推送后月使用率達到80%,VLA指令使用次數達到1225.4萬次“從目前用戶使用的反饋看,在某些場景下理想的VLA已經具備了對物理世界的認知涌現。具體表現是用戶會越來越多的發現之前端到端沒有的擬人行為。”郎咸朋說。
郎咸朋提到的“擬人行為”實際上正是理想汽車面向未來的關鍵。擬人行為背后不再是簡單模仿人類,而是需要模型能看到物理世界并且會思考。這也是李想眼中,AI演進的必然結果——從昆蟲動物智能(對應規則算法)到哺乳動物智能(對應端到端+VLM),再到人類智能(對應VLA司機大模型)。VLA司機大模型具備思維鏈式的推理能力,更貼近人類理解世界的方式,并且可以把人類語義融入行為判斷,最顯性的能力就是用戶可以通過語音指揮車輛。VLA,正是為汽車賦予“人類智能”的關鍵一步。
![]()
從輔助駕駛到具身智能基座的野望
VLA的價值,遠不止于提升輔助駕駛的通行效率和擬人化程度。在理想的規劃中,它正成為下一代AI系統的技術基座。在2025年第三季度電話會上,李想將公司的未來賽道明確為“具身智能”,在他看來,將汽車定義為“具身智能產品”,而非簡單的電動車或智能終端,是價值升維的關鍵。這意味著汽車將從被動響應指令的工具,轉變為能自動、主動提供服務的機器人。
VLA,正是這個“機器人大腦”的核心基座。它讓汽車開始具備“思維鏈”推理能力,能理解復雜場景并做出決策;其語言智能使得人車自然交互成為可能;而通過行為強化學習,它還在不斷進化,無限逼近人類駕駛的“老司機”體感。這一能力的持續進化近期迎來了一個新的節點。2026年1月21日,隨著OTA 8.2正式推送,AD Max平臺的VLA司機大模型迎來重磅升級。理想汽車自動駕駛研發高級副總裁郎咸朋對新版本的VLA司機大模型總結道:“這個版本用戶體驗提升最明顯的就是更加像人在開車了,大幅度減少了機械感的頓挫以及無效變道。” 他進一步透露,團隊針對早期版本為保障安全而妥協的舒適性與效率,通過對數據重新清洗和篩選,并替換約200萬段優質駕駛數據進行強化訓練,使模型能力獲得了顯著提升。基于過去兩個月在北京、上海、深圳、杭州等多地累計上千公里的實際對比測試,郎咸朋認為:“我非常確認OTA 8.2后的VLA就是行業領先。”
![]()
當VLA的能力邊界隨著數據與算力持續擴展,最終突破L3/L4級自動駕駛門檻時,汽車就將蛻變為真正的“汽車機器人”。理想在輔助駕駛上的深耕,實質上是在鍛造一套通用的具身智能AI系統:感知、模型、操作系統、算力、本體。
更具深遠意義的是,理想的探索正在引發廣泛的產業漣漪。2025年以來,部分領先的輔助駕駛企業、汽車企業,均開始關注或探索VLA路線。這驗證了其技術方向的前瞻性。理想的實踐,不僅為其自身構筑了深厚的技術護城河,更如同一個探針,為行業驗證了一條將大規模數據、先進算法與工程化能力深度融合,從而鍛造出可進化、能思考的“硅基生命體”的可行路徑。
理想汽車向具身智能的堅定轉型,或許正釋放出一個強烈信號:輔助駕駛產業的終極形態,可能并非只是“無人駕駛”,而是孵化出成熟的具身智能產品;傳統汽車產業與人工智能的深度融合,催生的將是一個全新的“具身智能產業”。
![]()
這場變革的核心,不再是功能的簡單疊加或單一技術的突破,而是如何系統性地打造一個能理解物理世界、可學習進化、并能安全高效交互的AI系統。VLA司機大模型,是理想給出的當下答案,也是它面向那個更廣闊未來所交出的第一張船票。當汽車開始真正學會觀察、思考與行動,一場關于出行、關于機器人、乃至關于人機共存的產業新敘事,才剛剛拉開序幕。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.