
撰文 | 張祥威 編輯|馬青竹
2025年最后一個月,部分車企獲得L3級自動駕駛路測牌照,為明年的新一輪競賽埋下伏筆。
另一邊,無人駕駛公司也在持續打磨L4。
最近,Waymo的無人駕駛出租車因大規模停電,在十字路口紅綠燈全黑時出現大面積“趴窩”,引發嚴重擁堵。
![]()
有行業人士分析,深層問題在于其采用“規則驅動”而非AI驅動。
可見智駕仍需進化,至少從技術角度看,仍有不少謎題待解。
諸如:
“端到端+VLM”的下一站,是不是VLA?
“一段式端到端+強化學習”,是否比VLA更先進?
世界行為模型和VLA相比究竟有何不同?
VLA和世界模型,究竟誰才是更優解?
當智駕領域疑云彌漫,厘清問題,可以更好地辨別孰強孰弱,也許還能照見“陷阱”。
那么,智駕進化到2025年底,究竟有沒有理出一條清晰的路線圖?
大亂斗
12月下旬,英偉達全球副總裁、汽車事業部負責人吳新宙,在上海浦東測試了多家車企和供應商的智駕方案。據悉,其對文遠知行、地平線的方案評價頗高。
但過去一年的經驗證明,單說體驗層面,似乎有點你追我趕,名次波動頻繁,其實難以直接斷言不同方案的優劣。
例如,基于規則驅動的智駕表現,在某個時間段內也許比基于數據驅動更加穩定。不同代際的模型架構,在某個時間點也會出現“舊”打敗“新”的情況。
即便就技術本身而言,行業有共識,更不缺爭議。
去年還被各家一致夸贊的“端到端”,如今被理想、小馬智行等競相指出存在技術局限。
行業普遍認為:“端到端的本質是模仿學習,存在overfit(過擬合)和不可解釋等問題。”面對訓練過的場景會表現出色,但遇到從未在訓練集中見過的新場景時,就有可能導致決策錯誤。一句話,學得太死板。
邁入「端到端」時代值得慶祝,但需補充新的能力,各家的技術路線由此分化。
截至目前,據《出行百人會/AutocarMax》不完全統計,市面上的核心智駕模型至少有6種,分別為VLA、WEWA、“端到端+強化學習”和世界模型等。
![]()
一類采用“端到端+VLM+強化學習”。如地平線,在一段式端到端的基礎上,借助云端的“VLM+強化學習”來訓練語義模型,從而處理可變車道等需要理解交通規則的場景。
另一類堅信VLA。這一技術陣營包括理想、小鵬、卓馭和元戎啟行等。其核心觀點為,“端到端+VLM”存在延時和信息損失,可支持實現L3,但要實現L4則離不開VLA。
值得注意的是,對于“端到端+VLM”的協作,早期有人將其比喻為教練坐在副駕指揮駕駛員開車,后來也有人將其比作賽車手和領航員(參數丨圖片)的配合關系。無論如何,基本可以認為,端到端的確存在能力的局限性。
據悉,小米汽車正一邊布局“端到端+世界模型+強化學習”,同時也在投入VLA研發。小米汽車智能駕駛VLA負責人陳龍指出,其要做的VLA是將端到端和VLM的能力融合在一起,如果VLA在各種場景下都比端到端好,那么將全面切向VLA這一新方案。
![]()
還有一類采用“端到端+強化學習”,代表公司是Momenta。
其創始人、CEO曹旭東認為,“VLM、VLA是很好的方向,但屬于錦上添花。想要提升,要用到強化學習,把端到端大模型放到通過海量真實數據構建起來的仿真環境去做探索。”
Momenta這種訓練大模型的方法,類似給ChatGPT喂大量數據,最終產生類人的通識。
至于采用WEWA技術的公司,代表是華為。
其做法是,輸入視覺、“觸覺”等多模態信息,直接輸出控車指令。這一過程中,跳過語言轉換環節(VLA會將視頻等信息轉化為語言Token,然后輸出控車指令),以避免精度損失和信息轉換延遲。
華為智能汽車解決方案BU CEO靳玉志曾表態,“不會走VLA的路徑,這樣的路徑看似取巧,其實并不是走向真正自動駕駛的路徑。華為更看重WA,也就是World Action。”
![]()
最后還有一類選擇世界模型的公司,如小馬智行和蔚來。
小馬智行副總裁、北京研發中心負責人張寧曾告訴我們,公司在2023年布局端到端研發,后來發現其不能解決所有問題,便轉向世界模型。
從規則驅動,到數據驅動,如今又來到“認知驅動”,智駕技術持續進化,背后有沒有一些共識?
共識
上述各家方案,雖稱謂不一,但均未繞開“端到端、VLM、VLA、世界模型、強化學習”等技術范疇。拆解這些技術,可以發現一些共識。
共識一,智駕模型不僅要會模仿,還要能“理解”。
陳龍在加入小米汽車前,曾在英國自動駕駛初創企業Wayve供職,不僅與團隊共同提出了“視覺-語言-行為”的模型框架,還是LINGO系列模型的核心開發者之一。
他認為,“端到端就像教動物學開車,但動物并不理解開車背后的行為。而VLA是在學習了人類世界的知識、交通規則、價值觀的基礎上,同時具備推理能力。”
這一觀點與理想類似。
![]()
前理想汽車智能駕駛技術負責人賈鵬,曾在拆解算法原型時表示:
“端到端模型的目的是學習行駛軌跡,但行駛軌跡是不確定的,即使同一個司機,在不同的場景、不同的時間,駕駛行為也不太一樣。如果只是一味地通過模仿學習人,只能模仿對的,不知道什么是錯的,會出現很多詭異的駕駛行為。”
基于此,理想在訓練過程中引入強化學習,讓系統知道對與錯,從而得出一個駕駛技巧、價值觀均正確的模型。
共識二,目標逐漸趨同,要打造智能駕駛領域的基礎模型。
近日,地平線創始人余凱與元戎啟行創始人周光討論智駕前景時,二人一致認為,如果能迅速構建基礎模型,智駕將從L2+更快通往L4,L3的存在階段將變得很短暫。
目前,各家的做法可大致分為幾項:
通過去掉人工監督和標注等做法,減少信息損失和時延,提升模型的效率;
通過更大規模的優質數據,覆蓋更多corner case,提升模型的泛化能力;
通過預訓練、強化學習或世界學習等,提升模型對物理世界規律的理解能力;
通過思維鏈、VLA或世界模型等,提升長時序推理能力。
只不過細節有差別。例如,Momenta強調的強化學習,主要通過海量真實數據構建起來的仿真環境來訓練模型,這是因為其已經搭載在足夠多的量產車型上。
![]()
而小馬智行提出的世界模型,據我們了解更接近強化學習。這意味著,除了采集數據的規模不同,兩家的目標存在相似性。
如果跳出智駕,在人形機器人等更廣泛的具身智能領域,則在研發“通用模型”。一種設想是,未來或許會出現由人形機器人開車的情況。
未來,究竟是汽車機器人自己行動,還是由人形機器人坐進來開車,又或者是兩種可能性都會發生?
結語
智駕從陷入corner case的汪洋大海,到受ChatGPT啟示,借助大語言模型相對輕松地游走在數據海洋,再到現在,正忙于煉出一顆類人的駕駛大腦。
可以看到,模型開車的技巧在提升,已經能在小路上做出博弈等動作。也要看到,智駕領域的corner case并未被完全解決。
回看文章開頭的那些問題,有的由發展階段不同導致,也有的更多是技術細節的差別。在游戲沒有通關前,或許真的存在多種解法。無論如何,提升模型能力,才是根本。
—THE END—
出行百人會 | AutocarMax
追蹤汽?出行產業鏈進化,關注新產品、新科技、商業邏輯與商業人物,影響圈層中有影響力的人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.