當Waymo的2500輛Robotaxi在舊金山灣區、洛杉磯、鳳凰城、奧斯汀、亞特蘭大五大城市的街頭自如穿梭,自動駕駛行業儼然已叩響規模化商業化的大門。
然而,在車隊擴張的熱鬧表象之下,自動駕駛領域的技術流派分歧仍未消弭。純視覺與多傳感器融合的感知路線該如何抉擇?系統架構該堅守模塊化還是擁抱端到端?在AI大模型賦能下,VLA與世界模型又誰能定義自動駕駛的“靈魂”?
這些懸而未決的爭議,正悄然左右著自動駕駛的未來走向,也讓這場技術路線之爭充滿了更多看點。
![]()
純視覺與多傳感器融合的路線之爭
感知是自動駕駛的基石,而“如何讓車輛看見世界”,則是行業內對峙多年的核心議題,兩大技術陣營的較量可追溯至2004年。
當年,美國國防高級研究計劃局(DARPA)在莫哈韋沙漠發起挑戰賽,以200萬美元獎金吸引了數十支頂尖高校與科研機構團隊,試圖攻克車輛環境感知難題。
最終,卡內基梅隆大學、斯坦福大學等團隊采用的激光雷達方案脫穎而出,其生成的高精度3D點云圖,為早期自動駕駛技術發展奠定了核心路線,這一方案也被谷歌旗下的Waymo繼承并持續深耕。
但激光雷達方案存在致命短板——高昂的成本。一套激光雷達系統在當時造價高達7.5 萬美元,這在當時注定其只能走小規模精英化路線,難以適配大規模商業化的需求。
十年后,特斯拉扛起了純視覺路線的大旗,給出了截然不同的解題思路。其核心邏輯是“人類靠雙眼和大腦就能開車,機器也應如此”。
2014年,特斯拉Autopilot系統問世,搭載Mobileye視覺方案,確立了以攝像頭為核心的感知路徑。2016年,馬斯克公開宣稱“激光雷達是徒勞的”,將純視覺路線推向行業焦點。
特斯拉通過8個環繞式攝像頭模擬人類視野,依托深度學習算法從二維圖像中重建三維駕駛環境。這一方案的優勢極為顯著:成本極低,可支撐大規模量產;更關鍵的是,量產車輛能收集海量真實路況數據,形成“數據飛輪”,反哺算法持續迭代,實現“越用越強”的閉環。
![]()
不過,純視覺方案的局限性也十分突出。攝像頭屬于被動傳感器,性能高度依賴環境光照,在逆光、眩光、黑夜、大雨、大霧等復雜場景下,感知能力會大幅衰減,遠不及激光雷達的穩定性。
以激光雷達為核心的多傳感器融合陣營則認為,在可見的未來,機器智能難以復刻人類基于經驗的常識與直覺,惡劣環境下必須依靠激光雷達等硬件冗余,來彌補軟件算法的不足。
簡言之,純視覺路線將技術壓力全部集中于算法,賭的是AI智能化的突破。多傳感器融合則更側重工程落地的安全性,選擇的是經過驗證的穩妥方案。
目前,Waymo、小鵬、蔚來等主流車企與自動駕駛公司,均站在多傳感器融合陣營,在他們看來,安全是自動駕駛不可逾越的紅線,而硬件冗余是保障安全的核心途徑。
值得一提的是,兩條路線并非完全割裂,正呈現相互融合的趨勢:純視覺方案開始引入更多類型的傳感器補充感知能力;多傳感器融合方案中,視覺算法的地位也持續提升,成為理解場景語義的關鍵核心。
激光雷達與毫米波雷達的互補博弈
即便在多傳感器融合陣營內部,也存在一場關于傳感器選型的細分爭議:毫米波雷達成本僅數百元,而早期激光雷達動輒數萬美元,為何車企仍愿為激光雷達投入高額成本?
激光雷達(LiDAR)可通過發射激光束并測算返回時間,構建出超高精度的3D點云圖像,能精準解決其他傳感器難以應對的極端場景(Corner Case)。其角分辨率極高,可清晰識別行人姿態、車輛輪廓,甚至路面微小障礙物。
在L4/L5級商業自動駕駛領域,激光雷達是唯一能同時滿足高精度感知與靜態物體檢測的傳感器,為了實現基礎自動駕駛功能與安全冗余,這筆成本堪稱車企必須支付的 “入場券”。
但激光雷達并非完美無缺。激光本質是紅外光,波長極短,當雨滴、霧滴、雪花、煙塵等顆粒的尺寸與激光波長接近時,會引發激光散射與吸收,產生大量“噪聲”點云,嚴重影響感知精度。
![]()
4D毫米波雷達則恰好能彌補這一短板,其具備全天候工作能力,在惡劣天氣下可憑借強穿透性,率先探測前方障礙物并輸出距離、速度數據。不過,毫米波雷達的回波點極為稀疏,僅能形成少量點云,無法像激光雷達那樣勾勒物體輪廓與形狀,還可能因電子干擾出現“幽靈識別”的誤判。低分辨率的缺陷,決定了它只能作為輔助傳感器上車,無法成為感知核心。
由此可見,激光雷達與4D毫米波雷達并非替代關系,而是形成了“常規場景靠毫米波雷達控成本,復雜場景靠激光雷達保安全”的互補邏輯,不同車型會根據定位采用差異化配置:L4級Robotaxi與豪華車型,通常采用“激光雷達為主、毫米波雷達為輔”的策略,不計成本堆砌傳感器以追求極致安全與性能上限;L2+、L3級量產經濟型車型,則以“攝像頭 + 毫米波雷達”為基礎,僅在車頂等關鍵位置配備1-2顆激光雷達,打造高性價比的感知方案。
車企圍繞傳感器的選型爭議,本質是一場以最低成本實現最高安全的技術探索與商業博弈。未來,各類傳感器的融合將進一步深化,催生出更多元化的感知搭配方案。
端到端與模塊化的架構對決
如果說傳感器是自動駕駛的“眼睛”,那算法架構就是其“大腦”,而“大腦”的構建模式,正經歷模塊化與端到端的激烈對決。
長期以來,自動駕駛系統普遍采用模塊化設計,將完整駕駛任務拆解為感知、預測、規劃、控制等獨立子任務。每個模塊各司其職,配備專屬算法與優化目標,如同一條分工明確的流水線。
這種架構的優勢十分明顯:可解釋性強、支持并行開發、便于調試維護。但它的缺陷也同樣致命——局部最優不等于全局最優,各模塊在信息傳遞過程中,會對原始數據進行簡化與抽象,導致大量關鍵信息在層層流轉中丟失,最終制約系統的整體性能上限。
2022-2023年,以特斯拉FSD V12為代表的“端到端”模型橫空出世,徹底顛覆了傳統架構范式。這一方案的靈感源于人類駕駛學習邏輯:新手司機不會先鉆研光學原理與交通規則,而是通過觀察教練操作直接習得駕駛技能。
![]()
端到端模型摒棄了人為的模塊劃分,通過學習海量人類駕駛數據,構建起龐大的神經網絡,可直接將傳感器輸入的原始數據,映射為方向盤轉角、油門開度、剎車力度等終端駕駛控制指令。
與模塊化架構相比,端到端模型全程無信息損耗,性能上限更高,還能大幅簡化開發流程;但其“黑箱”特質也帶來了嚴峻挑戰,一旦發生事故,工程師難以追溯問題根源,無法判斷是算法誤判還是數據缺陷,后續優化更是無從下手。
端到端模型的出現,推動自動駕駛從“規則驅動”轉向“數據驅動”,但“黑箱”風險讓眾多重視安全的車企望而卻步,且海量訓練數據的需求,也只有具備大規模車隊的企業才能滿足。
為此,行業衍生出折中方案——“顯式端到端”,即在端到端模型中保留可行駛區域、目標軌跡等中間輸出,力求在性能突破與可解釋性之間找到平衡。
VLA與世界模型的智能定義之爭
隨著AI發展,新的戰場在大模型內部開辟。這關乎自動駕駛的靈魂,它應該是輔助駕駛的思考者,還是執行者?
世界模型信奉“先建模、再決策”的邏輯,更追求對駕駛場景的深度認知與過程可控,也被稱為認知派。
該路線認為,自動駕駛系統要像人類駕駛員一樣,先在“大腦”中構建出周圍環境的數字化虛擬模型,再基于這個模型模擬不同駕駛策略的潛在結果,最終篩選出最優方案。它強調AI需先理解世界的運行規律,再結合傳統自動駕駛模塊完成決策,將大模型的認知能力與成熟的工程控制方案結合,規避純算法決策的幻覺風險。
VLA(視覺-語言-動作模型)信奉能力“涌現”,追求結果最優,被稱為端到端的終極形態。該流派主張只要模型足夠大、數據足夠多,AI就能自己從零開始學會駕駛的一切細節和規則,無需預先構建顯性的環境模型,最終其駕駛能力會超越人類和基于規則的系統。它直接將傳感器輸入的視覺信息、環境語言描述與終端控制動作綁定,實現從感知到執行的一站式決策。
![]()
圍繞VLA與世界模型的爭議,本質是自動駕駛智能決策邏輯的路線分歧,也延續了模塊化與端到端方案的核心辯論。
從可解釋性來看,VLA存在著難以溯源的黑箱困境。如果一輛搭載VLA功能的車輛發生了一次急剎車,工程師幾乎無法追溯原因:是因為它把陰影誤判為坑洞?還是它學到了某個人類司機的不良習慣?這種無法調試、無法驗證的特性,與汽車行業嚴格的功能安全標準形成了根本性沖突。
世界模型的核心是“先構建環境認知模型,再分步推演決策”,其決策鏈路本就分為“感知-建模-規劃-控制”等明確模塊,每個環節都有獨立的輸出和可監測的運行狀態,因此具備全程可分解、可分析、可優化的特質。
世界模型與VLA的核心差異之一就是可溯源性,其模塊化的決策鏈路能讓工程師精準定位問題環節。如果遇到復雜路況,工程師可以清晰看到完整決策過程:傳統感知模塊識別到未知物體、世界模型將其建模為“被風吹動的塑料袋”,并模擬其運動軌跡,規劃模塊據此決定“無需緊急剎車,僅輕微減速避讓即可”。即便發生事故,也能精準界定是建模環節的疏漏,還是規劃模塊的判斷失誤。
除了可解釋性的兩極分化,訓練成本與數據需求也是車企猶疑不決的核心原因之一。
VLA需要海量的“視頻-控制信號”配對數據,即輸入一段8攝像頭同步視頻,必須輸出對應的方向盤轉角、油門開合度、剎車力度等實時控制信號。這類數據不僅采集難度大,且標注制作成本極高,僅少數擁有大規模車隊的企業能夠支撐。
世界模型的優勢則在于數據來源的廣泛性,它可先利用互聯網規模的“圖像-文本”“環境-規則”等多模態數據完成預訓練,構建起基礎的世界認知框架,再通過真實駕駛數據和仿真場景數據進行微調,既能降低數據采集成本,也能通過仿真推演補足極端場景的數據缺口。
回顧自動駕駛的派系之爭,不難發現,這些技術博弈從未以某一方的完全勝利告終,而是在碰撞中不斷融合,走向更高層次的技術統一:激光雷達與視覺正整合為多模態感知系統,實現全場景精準感知;模塊化架構開始吸納端到端的優勢,平衡性能與可解釋性;AI大模型則為所有系統注入認知智能,推動自動駕駛向更高階進化。
那些曾困擾行業的技術謎題,或許沒有絕對標準答案,但每一次爭議與探索,都成為自動駕駛技術迭代的重要注腳,持續推動著這一賽道向前邁進。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.