輔助駕駛(智駕)已經(jīng)成為現(xiàn)在的標(biāo)配,首先必須明確一個(gè)認(rèn)知:輔助駕駛目前僅僅是輔助駕駛,絕不能代替人類開車。 那么在目前狀態(tài)下,輔助駕駛究竟誰行誰不行呢?各種路線、方案是什么情況?特斯拉到底是不是國內(nèi)慫包、國外無敵呢?今天就來聊一聊!
兩種硬件技術(shù)路線
目前市面上的智駕方案根據(jù)硬件架構(gòu)和對地圖的依賴程度,分為兩大技術(shù)派系。
1. 融合感知:以華為ADS為代表。它們通過激光雷達(dá)、毫米波雷達(dá)與攝像頭的冗余配合,為系統(tǒng)提供一層“物理護(hù)盾”。
![]()
在黑夜、大雨或強(qiáng)光逆光等視覺容易“致盲”的極端環(huán)境下,激光雷達(dá)提供的厘米級三維測距能守住安全下限。
2. 純視覺:以特斯拉FSD以及小鵬最新的“鷹眼”方案為代表。這一流派主張完全模仿人類雙眼,通過海量數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)來“腦補(bǔ)”深度信息。
![]()
雖然這種方案在硬件成本上更低,且因?yàn)榫邆錁O高的語義捕捉潛力(讀懂路牌、交警手勢)而被認(rèn)為擁有更高的技術(shù)上限(上限指的不是安全,而是信息密度);但安全下限的保障極度依賴于云端數(shù)據(jù)計(jì)算中心的規(guī)模化訓(xùn)練與海量數(shù)據(jù)的實(shí)時(shí)閉環(huán)。
小鵬VLA模型是什么?
在智駕大模型領(lǐng)域,目前形成了兩條邏輯截然不同的進(jìn)化路徑,物理直覺WA(World Action)和認(rèn)知推理VLA(Vision-Language-Action)。
![]()
小鵬、理想為代表的一些品牌,使用的就是VLA大模型,路徑非常簡單,模型計(jì)算中心會實(shí)時(shí)標(biāo)定視頻每一幀畫面中出現(xiàn)的內(nèi)容信息,然后將畫面轉(zhuǎn)換成文字描述,模型會根據(jù)文字描述生成下一步指令,最后將指令下發(fā)到車輛電腦,完成車輛的動(dòng)作操作。
![]()
VLA的最大好處是大模型不需要告訴車具體怎么躲,無需做人工標(biāo)定,而是讓車學(xué)會自主思考,完成一系列動(dòng)作。這是一個(gè)厚積薄發(fā)的過程,雖然起步極難,但一旦“開竅”,表現(xiàn)將遠(yuǎn)超人類。
VLA最大的問題是不依賴于云端模型數(shù)據(jù)規(guī)模量和質(zhì)量,而且必須依賴更強(qiáng)大的車機(jī)硬件芯片,以及絕對低延時(shí)的網(wǎng)絡(luò)通訊狀態(tài),因?yàn)楹A恳曨l數(shù)據(jù)都需要轉(zhuǎn)換成文字描述信息,一旦硬件運(yùn)算能力不足,網(wǎng)絡(luò)延時(shí)高,那么車輛動(dòng)作就會滯后。要知道,高速行駛的汽車,每一秒的誤判都會造成重大交通事故,是對生命的嚴(yán)峻挑戰(zhàn)!
![]()
這就是為什么理想、小鵬,不僅要放棄低效率的英偉達(dá),采用自研運(yùn)算芯片,而且還要對VLA進(jìn)行本地大模型部署,就是為了降低對網(wǎng)絡(luò)通訊的高度依賴。
特斯拉與華為,是一套模型?
華為一直認(rèn)為VLA方案是“投機(jī)取巧”,因?yàn)閳D像轉(zhuǎn)換文字描述的過程中,不僅多了一道運(yùn)算,而且必然會有細(xì)節(jié)信息的遺漏,造成不可估計(jì)的后果。
![]()
華為認(rèn)為開車應(yīng)是“肌肉記憶”,追求極速物理反應(yīng),所以需要省去了語言中介。所以從ASD4.0開始,華為直接宣布絕不走VLA路線,而是堅(jiān)持 WA(World Action)物理直覺,世界行為模型。這就是馬斯克所說的“第一性原理”,所以特斯拉FSD也是WA模型,當(dāng)然還包括蔚來。
![]()
簡單來說,WA模型更像是黑盒操作,模型的學(xué)習(xí)過程叫 “自監(jiān)督學(xué)習(xí)” (Self-supervised Learning),主要是玩“預(yù)測未來”的游戲,沒有動(dòng)作指令的專有代碼行。核心步驟有三:
第一步:看電影。把海量的駕駛視頻,喂給云端超算。
第二步:做填空。AI會遮住視頻的下一幀,然后自己猜:“根據(jù)現(xiàn)在的路況,下一秒前車會往哪走?我的車該在哪?”
第三步:對答案。AI把自己猜的結(jié)果和真實(shí)的下一幀視頻對比。如果猜錯(cuò)了(比如它覺得應(yīng)該加速,但視頻里老司機(jī)剎車了),它就自動(dòng)調(diào)整自己內(nèi)部的神經(jīng)元權(quán)重。
這就是“學(xué)習(xí)”的過程: 循環(huán)往復(fù)幾億次后,它就掌握了物理世界的運(yùn)行規(guī)律。這就不再需要工程師去標(biāo)定參數(shù),而是AI在大數(shù)據(jù)中自動(dòng)找到了最優(yōu)參數(shù)。
![]()
為了防止模型不會學(xué)壞,只能變成“老司機(jī)”,AI會自動(dòng)選擇那些駕駛分高、沒有事故、動(dòng)作平順的“老司機(jī)”視頻作為教科書,也就是“黃金樣本”。如果視頻里出現(xiàn)了急剎車、碰撞或人工接管,AI 會標(biāo)記為“負(fù)面樣本”,避免學(xué)習(xí)。
此外華為和特斯拉一樣,都是通過模型蒸餾出一個(gè)子模型,直接OTA到車機(jī)系統(tǒng)中,出生就是滿級選手,不需要后天的系統(tǒng)學(xué)習(xí),并且完全是本地部署,本地響應(yīng),可以完全擺脫對于網(wǎng)絡(luò)的依賴。
![]()
另外,華為和特斯拉一樣,都會在后臺另外部署一套備份安全系統(tǒng)。華為叫做CAS4.0,如果AI判斷失誤,那么CAS4.0系統(tǒng)讀取雷達(dá)信息物理級別糾錯(cuò),避免碰撞風(fēng)險(xiǎn)。特斯拉則是使用雙AI芯片,使用另外一顆AI芯片監(jiān)督正在工作的AI芯片,是否出現(xiàn)判斷錯(cuò)誤。
總之,WA的“學(xué)習(xí)”本質(zhì)上是從“邏輯驅(qū)動(dòng)”變成了“數(shù)據(jù)驅(qū)動(dòng)”。華為和特斯拉之所以強(qiáng),不是因?yàn)樗麄児こ處煂懘a快,而是因?yàn)樗麄兗依锏摹八懔χ行摹贝蟆⑽菇o AI 的“高質(zhì)量視頻”多。
到底行不行!
說了半天,那么目前市場上已知的這些智能輔助駕駛技術(shù),到底行不行!
![]()
1.華為智駕:就目前來看,老練且領(lǐng)先,華為依然是目前頂級的存在,“端到端”不僅是口號,更體現(xiàn)在極高的博弈上限和系統(tǒng)穩(wěn)定性。憑借雄厚的經(jīng)濟(jì)實(shí)力和“堆人、堆算力”的狀態(tài),華為實(shí)現(xiàn)了感知與規(guī)控的深度閉環(huán)。它的智駕在窄路博弈、復(fù)雜環(huán)島等場景下的表現(xiàn)最為穩(wěn)健,是目前公認(rèn)的第一梯隊(duì)。
![]()
2.小鵬:小鵬正在經(jīng)歷從“融合感知”向“純視覺”的劇變。雖然取消了激光雷達(dá),但憑借在 VLA 大模型上的厚積薄發(fā),小鵬在處理城市復(fù)雜路口、長尾場景時(shí)的智能化程度正迅速提升。它證明了通過正確的方向選擇,可以拋棄冗余硬件,實(shí)現(xiàn)更高效的智能。
![]()
3.比亞迪:雖然比亞迪車賣得便宜、銷量高,但在高階智駕算法上仍有很長的路要走。比亞迪需要在產(chǎn)品研發(fā)和算法迭代上投入更多精力,才能跟上腳步。
![]()
4.特斯拉:與華為一樣,都是WA模型方案。雖然特斯拉在國外表現(xiàn)驚人,但因?yàn)橹袊袌鍪芟抻跀?shù)據(jù)出境、地圖法規(guī)等客觀環(huán)境,F(xiàn)SD的實(shí)際體驗(yàn)與國內(nèi)頭部梯隊(duì)相比有不小的差距。在沒有針對中國路況進(jìn)行本土化打磨之前,6.4萬元的FSD選裝包在現(xiàn)階段性價(jià)比不高。
總結(jié)
現(xiàn)階段智駕是輔助而非替代,責(zé)任始終在人,切勿以命試險(xiǎn)。由于多種模型方案,多種技術(shù)路線并行發(fā)展,使得目前智駕正經(jīng)歷智能手機(jī)初期的“參差不齊”,隨著算力的增強(qiáng)與技術(shù)的成熟,L3/L4 級的輔助駕駛終將像手機(jī)一樣普惠大眾,成為汽車的基礎(chǔ)配置。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.