![]()
2025年,中美車企的股價(jià)表現(xiàn)可謂是冰火兩重天。
比亞迪、小鵬等各路本土車企股價(jià)一路震蕩下行。
特斯拉盡管面臨歐洲區(qū)銷量接近腰斬、中國區(qū)銷量萎靡不振、大漂亮區(qū)銷量隨著懂王取消電動(dòng)車補(bǔ)貼而受到壓制的諸多不利局面,股價(jià)卻在銷量節(jié)節(jié)下滑之際逆勢(shì)走出了一條震蕩上行的曲線。
事后諸葛亮地來看,推動(dòng)特斯拉股價(jià)上行的發(fā)動(dòng)機(jī)是其于6月22日落地的Robotaxi。
此舉標(biāo)志著特斯拉以強(qiáng)AI的純視覺方案、依靠沒有多少冗余機(jī)制的量產(chǎn)乘用車實(shí)現(xiàn)了L4級(jí)無人出租車服務(wù),完成了L2到L4的驚天一躍。
半年之后,國內(nèi)兩款車型首次拿到L3量產(chǎn)準(zhǔn)入。
在26年開年的新品發(fā)布會(huì)上,小鵬汽車更是直接宣布跨過L3,直通L4。
L4無人駕駛出租車玩家們的護(hù)城河一夜崩塌,這背后到底發(fā)生了什么呢?
習(xí)慣了線性增長的人類總是很難理解指數(shù)級(jí)增長的概念。
在過去的兩三年里,自動(dòng)駕駛系統(tǒng)的性能開啟了一輪氣勢(shì)磅礴的指數(shù)級(jí)增長。
而推動(dòng)這一曲線成立的根本動(dòng)力,就是23年就有大聰明認(rèn)為會(huì)失效、到現(xiàn)在還依然活蹦亂跳的Scaling Law。
Scaling Law描繪出了一條“算法-數(shù)據(jù)-算力”協(xié)同推動(dòng)自動(dòng)駕駛性能提升的三重曲線。正是在算法、數(shù)據(jù)、算力三要素的乘法效應(yīng)下,系統(tǒng)性能才得以從線性增長轉(zhuǎn)化為指數(shù)級(jí)增長。
算法層面,基于端到端范式的視覺語言動(dòng)作模型和世界模型,基本消滅了由碎片化的AI模型、神經(jīng)元算法和許多固定規(guī)則拼湊得雜亂無章的分模塊方案的諸多缺陷。
![]()
數(shù)據(jù)層面,得益于L2+級(jí)輔助駕駛系統(tǒng)的快速普及,海量車隊(duì)源源不斷地產(chǎn)生天然符合真實(shí)世界物理規(guī)律和車輛運(yùn)動(dòng)學(xué)的真實(shí)路采數(shù)據(jù);
得益于物理規(guī)律模擬得越來越好,越來越符合剛體動(dòng)力學(xué)、摩擦力、重力等物理約束,云端世界模型/世界模擬器能夠以極低的成本實(shí)現(xiàn)常規(guī)場景的飽和覆蓋和長尾場景的按需創(chuàng)造。
海量真實(shí)路采數(shù)據(jù)與高質(zhì)量合成數(shù)據(jù)的組合拳正在以前所未有的效率和規(guī)模攻克著制約自動(dòng)駕駛系統(tǒng)性能提升的數(shù)據(jù)瓶頸。
![]()
算力層面,雖說并非不值一提,但確實(shí)沒有太高的優(yōu)先級(jí)。
在算法-數(shù)據(jù)-算力三要素里,算法范式的轉(zhuǎn)變和數(shù)據(jù)瓶頸的突破主導(dǎo)了尺度定律可以向自動(dòng)駕駛領(lǐng)域完美遷移。
正是基于尺度定律,Momenta創(chuàng)始人曹旭東最近才敢于斷言,到2028-2030年,自動(dòng)駕駛將穩(wěn)定地超越甚至大幅度超越人類的駕駛能力。
這不是基于美好祈愿的無腦預(yù)言,而是基于對(duì)尺度定律推動(dòng)的增長曲線的合理推斷。
理想汽車之前有過一個(gè)判斷,分模塊方案只能實(shí)現(xiàn)L2,端到端方案可以實(shí)現(xiàn)L3,大模型才能實(shí)現(xiàn)L4。
換言之,端到端將自動(dòng)駕駛能力等級(jí)由L2推進(jìn)到了L3,大模型進(jìn)一步將自動(dòng)駕駛能力等級(jí)提高到了L4。
我們借花獻(xiàn)佛,遵循分模塊到端到端、端到端到大模型的路線簡單談一談,這兩個(gè)關(guān)鍵節(jié)點(diǎn)相繼解決了被代替方案的哪些缺陷。
![]()
分模塊到端到端更多的是一種開發(fā)范式的轉(zhuǎn)變。
原來通過人為設(shè)計(jì)的接口連接各個(gè)模塊、通過規(guī)則編碼駕駛決策的方式,轉(zhuǎn)變?yōu)橛梢粋€(gè)大一統(tǒng)的深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)統(tǒng)一處理感知定位-規(guī)劃決策、通過神經(jīng)網(wǎng)絡(luò)和海量數(shù)據(jù)驅(qū)動(dòng)駕駛策略學(xué)習(xí)的方式。
![]()
接口連接各個(gè)模塊到大一統(tǒng)神經(jīng)網(wǎng)絡(luò)的轉(zhuǎn)變,消除了模塊間的信息墻,實(shí)現(xiàn)了從感知到?jīng)Q策的全量信息傳遞,使系統(tǒng)能夠利用數(shù)據(jù)中的全部信息進(jìn)行全局優(yōu)化。
系統(tǒng)能夠從全量信息中模仿學(xué)習(xí)到人類駕駛員的平滑、預(yù)判性操作,駕駛風(fēng)格更像一個(gè)經(jīng)驗(yàn)豐富的老司機(jī),提升了舒適性,也增強(qiáng)了安全性。
規(guī)則編碼轉(zhuǎn)向數(shù)據(jù)驅(qū)動(dòng)意味著系統(tǒng)的能力不再依賴于天才工程師的靈光一現(xiàn),而是能夠建立起強(qiáng)大的進(jìn)化閉環(huán),在“量產(chǎn)車收集數(shù)據(jù)-模型訓(xùn)練-OTA升級(jí)-收集更多數(shù)據(jù)”的飛輪效應(yīng)下,推動(dòng)自動(dòng)駕駛系統(tǒng)的能力持續(xù)快速地迭代。
![]()
端到端方案實(shí)現(xiàn)了在已知場景分布內(nèi)高度擬人化的駕駛,但對(duì)于訓(xùn)練數(shù)據(jù)分布外的場景,端到端方案缺乏基于常識(shí)的推理能力。
VLA在視覺V和動(dòng)作A之間引入語言L這一強(qiáng)大的認(rèn)知中間層,由于大語言模型壓縮了人類世界的海量常識(shí)與邏輯推理能力,VLA模型得以像人類一樣進(jìn)行“思維鏈”推理,顯式地理解場景語義,從而解決了傳統(tǒng)端到端在復(fù)雜交通標(biāo)識(shí)理解、他車意圖預(yù)測(cè)、社會(huì)性交互等方面的短板。
世界模型則致力于通過海量觀察,從物理本源從頭學(xué)起,直接構(gòu)建起對(duì)物理世界運(yùn)行規(guī)律的“第一性原理”認(rèn)知。
![]()
總之,VLA/世界行為模型在數(shù)據(jù)驅(qū)動(dòng)的骨架上注入了認(rèn)知的靈魂,解決了端到端方案的“語義脆弱”問題,為處理訓(xùn)練數(shù)據(jù)分布外的極端長尾場景提供了在線推理的工具。
基于數(shù)據(jù)的視角,自動(dòng)駕駛的開發(fā)流程也在發(fā)生著一場靜默但深刻的范式轉(zhuǎn)移。
傳統(tǒng)開發(fā)范式以數(shù)據(jù)為起點(diǎn),采取“采集數(shù)據(jù)-訓(xùn)練模型-測(cè)試驗(yàn)證”的開環(huán)流程。
在新范式下,開發(fā)的起點(diǎn)從“準(zhǔn)備訓(xùn)練數(shù)據(jù)”轉(zhuǎn)移到了“發(fā)現(xiàn)問題”上,形成了“仿真測(cè)試-針對(duì)性生成數(shù)據(jù)-閉環(huán)訓(xùn)練”的迭代循環(huán)。
![]()
![]()
自此,在云端世界模型的推動(dòng)下,自動(dòng)駕駛的開發(fā)范式完成了從“有什么數(shù)據(jù)就學(xué)什么”到“缺什么能力就造什么數(shù)據(jù)”的根本性轉(zhuǎn)變。
且不談在虛擬世界中完成高風(fēng)險(xiǎn)測(cè)試的極致安全,單就學(xué)習(xí)方式而言,這種針對(duì)能力短板定向生成訓(xùn)練數(shù)據(jù)的范式可以極大地加速發(fā)現(xiàn)問題-解決問題的迭代效率,從根本上破解數(shù)據(jù)的難題。
![]()
畢竟,自動(dòng)駕駛行業(yè)缺的不是泛泛的數(shù)據(jù),缺的是能夠暴露和修補(bǔ)自家特定模型能力短板的針對(duì)性數(shù)據(jù),只有這樣的數(shù)據(jù),才能稱得上真正的高價(jià)值、高質(zhì)量!
在尺度定律的指引下,在算法范式、數(shù)據(jù)范式革命的技術(shù)洪流中,傳統(tǒng)L4玩家賴以筑起高墻的規(guī)則編碼的護(hù)城河,已經(jīng)在數(shù)據(jù)驅(qū)動(dòng)的端到端范式面前悄然瓦解。
他們堅(jiān)信的L2與L4之間存在巨大技術(shù)鴻溝和不可飛躍的天塹的認(rèn)知,也在VLA與世界模型面前被徹底證偽。
通往L4的道路,不再是Robotaxi玩家的專屬賽道了,它們能卷得過那些如狼似虎的L2賽道老玩家嗎?
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.