12月9日,在2025地平線生態大會上,地平線副總裁、首席架構師蘇箐表示,隨著FSD、HSD這類城區輔助駕駛系統成熟,過去涇渭分明的L2與L4“兩個世界”,如今已被打通。因此,行業出現了一條清晰的AD產業發展路線:在經歷城區L2系統大規模普及的關鍵大節點之后,隨后會經歷作為短暫過渡的小節點L3,最終迎來極低成本部署、可快速區域擴張的L4,屆時將同時以乘用車和Robotaxi雙形態落地。這條連續、可兌現的路徑,大概率將是未來AD產業發展的核心敘事。
![]()
以下為蘇箐的演講正文:
大家都知道上個月我們HSD才剛剛量產,包括我在內,基本上整個團隊都還在工程模式,沒有切換到所謂的思想模式,所以今天講的很多東西可能比較零碎,但確實是這幾年在過程中的一些實實在在的感悟,看看對大家有沒有用。
我特意放了這個小圖標,如果大家看過去年我們的產品活動,我當時講了很多,但今年實實在在做的過程中,雖然整體路徑清晰,但也能看到前方還有更難的問題 —— 你知道這些問題肯定能解決,但今天該怎么解,還沒有答案。所以坦率地說,我其實有點無話可說,確實是在這樣的狀態里。
我算是剛從 SOP 的壓力中抽身,所以在講自己的東西之前,想先對行業里所有從事這項工作的同仁們致敬、感謝。為什么?從行業外看,自動駕駛好像很簡單:任何人學一年駕駛就能開好車,但對計算機來說,情況幾乎是反向的 ——越是人類覺得難的事(比如高等數學、邏輯分析),計算機越容易;越是人類與生俱來的基本技能,計算機越難掌握。開車已經很接近這種基本技能了,再比如在家煎個荷包蛋,從某種角度說,對計算機而言難度極高。所以絕大多數行業外的人,很難理解自動駕駛團隊面臨的困難和壓力。但我們干了這么多年,太清楚了:這是智力和體力的雙重壓榨,過程極度痛苦。SOP 的時間節點就在那里,方法論擺在前面,車輛在路上每天都會遇到各種 corner case、hard case,我們沒有選擇的余地,所有 case 都必須處理 —— 這是稠密的物理世界里連續發生的事,這就是這個行業最痛苦的地方。
我們回頭看過去幾年的變化,很有意思。講個小插曲:我剛準備加入地平線時,跟余凱博士聊過幾次,當時明確跟他說,我不想再做自動駕駛了 —— 一是太痛苦,二是看不到希望。那個時代的自動駕駛,車開起來看似不錯,但以真正人類司機的標準衡量,差距極大:很多 case 處理不了,行為也完全不類人,只是一臺靠應激反應工作的機器。兩三年前是這樣,甚至到 2023、2024 年,整個行業也普遍有這種認知:它能用,但能不能變得像人類一樣聰明、完全類人,大家都不確定 —— 這就是我當時的心態。
![]()
2024 年發生了一個很大的分水嶺事件,我們得提一下。就是 FSD 的 V12,它非常非常關鍵,我知道現在輿論吵得兇,爭論 FSD 是不是最強的,但這個問題不重要。重要的是,FSD 開創了一個全新的內核范式 —— 知道方向不對、知道正確方向,與真正把正確方向落地實現,中間隔著巨大的鴻溝和不確定性,而 FSD V12 的意義,就是填平了這段鴻溝。
為什么說這是一個分水嶺事件?舉一個例子,在原子時代,第一個發現核裂變是可能的,而且是能釋放能量的,是德國科學家,當時這個實驗結果出來以后,全世界所有從事量子物理的科學家們都認為是不可能的,但是迅速的實驗復現證明這個觀點是對的,是有結果的,然后又花了 N 年的時間,造出了第一顆原子彈。什么意思呢?大家會發現深度學習和神經網絡就像當初的核裂變實驗一樣,它告訴你這個范式是可能的,能干什么。但是這個范式什么時候、以什么形式能夠在自動駕駛里面,能把自動駕駛做到多好,在第一人做到之前,沒有人知道 yes or no,也不知道百分比,而 V12 讓大家看到了這個希望。奧本海默最重要的是證明了原子彈是可以造出來的。
![]()
從 CMU 第一個車隊,到斯坦福的車隊,再到 Waymo 的車隊,實現了技術的跨越。CMU 車隊當時是強依賴非視覺傳感器的,那個時代還沒有所謂的機器學習技術,那時候還不是深度學習,大量都是靠人工寫代碼寫出來的,所以這是第一代;斯坦福車隊我記得在第二次比賽就實現了超越,這是因為斯坦福車隊引入了機器學習的技術,到 Google 的時候,得到了進一步發揚光大。這些背后是什么呢?你會看到過去的自動駕駛,在 2023、2024 年之前有兩個問題,第一個問題就是深度學習技術只重構了感知部分,而在感知之后的部分,幾乎還是規則時代的,它是一個革命革到一半的東西,這是第一點。
第二點,它遺留下來兩個問題,第一,無圖和有圖背后是什么?背后是這個技術范式只解決了動態問題,沒有解決靜態問題,所以需要用地圖補一補;第二,它革命革了一半,整個系統里面只有前半截是數據驅動的,后半截是規則的。我們都知道一個方法論重構,重構到一半的時候,它的效果可不是一半,它的效果可能是 20%、30%,你需要把后面的那一半革命完成,才能迎來整個新的時代。這就是整個端到端的意義所在。
但這件事情非常難,為什么難?第一,感知技術發展了非常多年才完全搞定數據驅動,而規控這個東西的整個理論是不成熟的,我覺得我們自己開發下來,到今天也是不成熟的,導致很多團隊都 try 過,一輪需要花十幾億、幾十億這么多資金,然后這時候要不要接著 try 呢?大多數團隊因為精神和錢的問題可能沒有再繼續 try 了,你如果還可以的話就繼續 try,但它是非常不收斂的,任何一個噪聲就會導致整個系統廢掉,所以非常困難。這就是整個范式改變的巨大意義所在。
我們可以看一下這種變化對未來意味著什么?這個很關鍵,因為過去的歷史已經是事實。
第一個,大家最近都很嗨,一段式也搞定了,各種亂七八糟的概念都跑出來了,是不是以后會進入一個大發展時代?坦白說,我要澆點冷水,人類是很奇怪的一種動物,人類在事情未發生時,完全不相信它會發生;但當事情發生后,又會認為它會持續發生,其實這兩種情況都不對。大多數時候你看到它第一次發生,它是一定會的,但是發生完了之后,它就是整個時代或者是這個 cycle 的高點,它很可能是最后一波。大家回去看一下原子時代,我記得當年這件事情搞定以后,大家很激動,全世界都很激動,覺得這個東西會改變一切,但說實話,也就那回事。
為什么我老是提原子時代這件事?我個人感覺,對整個物理世界或者對人類來說,只有兩件事情是重要的,一個是能源,一個是信息的變化或者計算,因為只有這兩個東西是改變世界和制造世界的本質,其他的事情都是在這兩個東西上面遞增出來的一些附屬產物,所以我們剛才說的原子時代就是能源,而人工智能或者 AGI 是信息。
這種重構會不會是一種常態?我們認為大概率不會。為什么呢?我們可以看到 2023、2024 年發生的這次變革,有兩個前提條件:
第一,人工智能大概每二三十年會有一個輪回,大家干了這么多年,發現它還是有天花板的,咱們再來過,二十年之后再見。我們目前隱隱約約會看到這一代的深度學習技術,有一點碰到這個天花板的可能性了,我不能說一定是,但是有這種可能性,因為從大語言模型和其他領域的進展來看有這種可能性。
第二,整個 AD 過去革命革了一半,但這次是真革完了,已經是一段式革完的。如果我們希望再有這種巨大的內核重構,那就不是把深度學習從系統的一半平推到 100%,而是要改變內核的理論。我們都知道整個物理世界的演進,都是先有理論突破,然后到應用突破,就這么不斷循環。但我們現在其實很不幸的是,還沒有看到下一個理論突破的前置信號出現,這個東西出現以后,可能還需要 5 年、10 年、20 年才能變成應用的突破,所以我個人判斷,很大概率未來三年是在現有的系統上做極致的優化,而不是一種理論內核的重構,所以大家別太嗨,又進入苦日子的階段了。
![]()
第二個問題是,FSD、HSD 這樣的系統出現的時候,對整個產業的路線意味著什么?這是我個人的看法。
首先還是回到三年以前我跟余凱博士的聊天過程,我終于又看到希望了,我覺得我們好不容易能用新技術把城市的 L2 做到好用類人了。今天大家看到的 HSD,其實只是一個新范式的第一個版本,我可以負責任地說,在未來的一年會有巨大的提升,因為新范式提升以后會有一個紅利期,有巨大提升,這個系統會非常非常類人。這樣的話,我們終于有機會把吹了這么多年的牛 —— 城區的 L2 放到車上了,我覺得余凱博士昨天有一個比喻非常好,它是新時代的自動擋。特別對,它是一輛車應該有的基本的東西,不是一個情緒價值,車為什么需要人去開?不需要,它可以自己開,人去監管一下,幫它一下就可以了。
我們認為 Urban L2 會迎來一個巨大的發展紅利期,紅利期的意思就是從幾十萬的車,到 20 萬的車,再到 10 萬的車,都非常好用。就像大家不會碰到 10 萬級車輛的自動擋不如 30 萬、50 萬的好用,不會這樣的,這就是計算機工業的好處,它的突破成本極其高,但是復制成本極其低。你今天看到再復雜的計算機,只要給它幾年的時間,它就會跟白菜一樣,它會把 10 萬的車甚至更低成本的車變得一樣好用,這個時代一定會到來。
第二,L2 跟 L4 是完全不一樣的世界,L4 就拿 Waymo 來做典型案例,它為了拿到很好的 MPI,需要做很多很多其他額外的工作,比如搭載超豪華的傳感器,比如用非常好的 HD Map 去解決靜態缺陷問題,需要把 ODD 畫得比較小,讓整個 hard case 可控等,要做很多很多這樣的事情,還要做很多其他辛苦的工作,把系統部署上去。這種方法你要是放到整個平坦的世界,這么玩顯然是不 work 的,所以大家都知道這件事情是有問題的。但是新的范式到來以后,我們能看到方法論終于統一了,我們能看到當前的方法再做最多兩到三年的工作,就有極大的機會把 MPI 干到 5 萬、10 萬的水平,同時還能保持類人,而且還能保持在所有的區域里面是可以自動泛化的。
![]()
我們自己這次開發過程還是挺快的,有一個環節跟過去比省了很多時間,就是各個城市的泛化,我們很高興地發現,新的方法論落地后,我們在絕大多數城市測試后天然沒有問題,只有極少數非常非常奇怪的、在整個系統分布之外的很小場景需要處理,這讓這個過程省了很多時間,這對 L4 是個極大的好消息,我再也不需要在每一個 ODD 里面反復打磨了。我在搞定一個復雜城市的時候,大概率就搞定了整個國家的復雜城市,效率一下就上去了。因為 robotaxi 講得再好,L4 講得再好,本質是需要跟人類司機去比成本的,這是一切商業本質的源頭。所以你在上面做所有高成本復制的時候,不是數量級降低成本的,而是一種線性遞推的方法,這在商業上都是不 work 的。我們看到新方法論改變了這一點,導致的結果就是在未來短短幾年內,用同樣的開發范式,不但在 L2 上面能極大帶來新的體驗,同時能以極低的部署成本和幾乎無限制的部署區域擴張速度,落地一個 L4 系統。而且它會以乘用車和 robotaxi 的雙模式去部署,我一直不同意為什么 robotaxi 就只能是 robotaxi 呢?我也想用 L4 駕駛一輛乘用車,為什么不能?我認為每個人都想用合理價錢買一輛這樣的車。無論是大玩具也好,是第二空間也好,還是個人能擁有的一個最貴的機器也好,它有自己獨特的價值所在。其實我自己是比較社恐的,我是不愿意坐出租車的,還要跟司機講兩句話,感覺好煩,所以 robotaxi 對我來說是最好了。
另一個附帶性的變化是什么呢?我們看到在 2023、2024 年以前,大家都覺得天花板就在那了,上不去了,那么大家就開始干另外一件事情,因為飯還得吃、工資還得發、事情還得做,就開始在這個空間里面做各種碎片功能,往上拼。我們可以把它想象成在一個二維空間里面把這個空間填滿,以什么方式把它填滿?2024 年之前大家的想法是這棵樹已經種下去了,長這么高了,我再種一棵樹,再種一棵樹,各種奇奇怪怪的做法。而 2024 年之后不這樣了,我們就種一棵樹,讓這棵樹越來越高、數據量越來越大,你會很欣喜地發現在你不知道的時候它長出了新的能力。我們自己的車在這之前還從來沒有做過靠邊停車的功能,但是我們測試團隊有一天很有意思,在跑老一個車道的時候,想試一下再過一個邊道會怎么樣,發現這輛車自己變道變過去了。這就是新的方法論和數據驅動的魅力,因為它從人類的稠密數據里面會學到一切能力,無論是好的還是壞的,當然我們需要把壞的處理掉,這就是新的方法論跟過去不一樣的地方,過去的方法論你可以認為是加法,是人一個一個稀疏的能力點往上加。而新的方法論是減法,你需要把人類全集的所有數據里面,把不需要的減掉,這就是兩個方法論本質的不同。
![]()
這至少會導致我們從現在開始會有兩種完全不同的產品思路,一種是過去那種繼續拼各種平行功能,一種是像我們和 FSD 這樣,去把這棵樹種得越來越大,越來越深,我們絕不去做一些零碎的功能,我要讓這些功能慢慢給它時間,在這棵樹上自己長出來。如果今天還沒有到那個時間,我就選擇不做它。這是我們的態度。
下一步我們應該做什么呢?這個其實也是我們自己未來一兩年要做的事情,還是回到剛才那個基本假設,就是我們認為 AI 和 AGI 的基礎理論在未來三到五年可能不會有全新的突破,可能是進入一個演進和優化的階段,這是一個大的前提。有幾件事情還是可以做的。
![]()
第一個事情,在大模型領域,大家隱隱約約會碰到Scaling Law的天花板,但是今天還沒有發生,應該說剛剛開始。我們后面每一代芯片和每一代產品會堅持十倍算力提升、十倍模型容量,在這個模型往上疊。大家一定要記住,計算機工業的本質就是玩命堆算力,千萬不要問一個問題就是“它有沒有用?你需不需要?”,如果各位想問這個問題的時候,你就回家把你的手機、計算機拿出來看看,你需不需要那個處理器,一定是需要的,因為芯片工業本質上是印刷工業,是不要錢的,只要給它時間。那么玩命堆算力,就是計算機工業里面最重要的基因和邏輯,任何時候都不要違背這件事情,只要違背這件事情就被歷史淘汰了,因為它不要錢。所以我們只要簡單且持續的堅持十倍提升。
第二個事情,我們會重投入 L4 這個節點,但不是以割裂的形式做這件事,而是以統一的開發范式、統一的傳感器配置、統一的 ODD 區域去打通 L2 到 L4,我想大家可能已經不會在意這個概念了,你現在開的是 L2 的車,三年后買到的車已經是準 L4系統了,是高概率會發生的。
第三個我最想強調的一點是,無論這個技術和行業千變萬化,這種事情永遠會發生,其實你能應對這件事情的時候,第一步不要應激,每幾個月我們就突然說以前都不對,我們全改,這是不對的。你需要做的事情是把你自己公司的工程能力和組織能力不斷強化,強化再強化,只有一個穩定的能承載這個工程的公司組織,才能應對一切變化,有新技術的時候能快速導入它,新技術導入之后看到一堆爆發的問題,你能有集團軍的作戰能力把它消滅掉,而且持續地去打磨那些難的問題,所以一個好的工程能力和一個好的組織能力,是一個公司至關重要的發展基座,我稱之為工業母機,在應對整個不確定的世界的時候,這是唯一能確定的,并且應該持續投入的事情。
有人問我現在還抑郁嗎?坦白說,還挺抑郁的,為什么呢?前段時間確實被量產壓得不行,時間很緊,而且新范式不像大家看得這么美好,新范式會有新范式的問題,這么短的時間要解決掉。我們的工程團隊確實非常辛苦,也非常給力,這么短的時間內把這么多問題都解決掉了,我覺得雖然我罵了他們很多,平時給他們很大壓力,但是還是很感謝他們,他們是業內很了不起的一幫人。
第二,我們能看到應對這么多變化的時候,還有很多事情需要做。今天大家可能試過 HSD 了,覺得還不錯,但是它已經達到人類司機的水平了嗎?我覺得顯然沒有。我們公司自己內部的論壇里面,大家已經不再討論繞行、選路這件事情了,他們在討論后面有一個水坑,你該怎么辦?討論一些很奇奇怪怪的 case,昨天還有人在論壇里發了一個消息說,前面一個卡車跟你錯車的時候,你是應該鳴笛等它還是應該繞過去?在討論這種問題。我剛開始看到這種問題是有點惱火的,飯還沒吃飽就開始想別的了,但是想想看這是一個好事情,大家認為系統的能力已經過關了,開始以人類的想法重新看待這個系統了,這是我們未來兩到三年應該聚焦的。但這些問題極其難,我們知道有希望看到它被解決,但怎么解決,我今天還沒有非常清晰的答案,但這件事情是我應該去做的。
但為什么我還比較焦慮呢?坦白說因為做這件事情成本非常高,做一輪試驗可能十個億,還不一定成功,這種事情是很恐怖的,但是必須要做。
第二個問題,就是我對現狀滿意嗎?接下來的計劃是什么?
![]()
坦白說很難說滿意還是不滿意,你要說 SOP 的表現是不是達到我的基本預期,我覺得算是,但是我覺得我們自己做自動駕駛的這幫人本質的目的是做一個能替代人類司機的機器,這才是我們所有工作的意義,否則這件事情沒有意義。從這個維度來講,我覺得還有很多很多工作需要去做。
未來的計劃,我們希望在未來兩到三年,讓大家看到 HSD 這套乘用車系統體驗有一個巨大的進步,有一個質的飛躍,這是一定會發生的。第二,我希望在未來幾年我們能把一個 L4 級別的車以同樣的價格在用戶無感的情況下送到你的手上,這是我們期望對行業能做到的,雖然很難,但是我覺得這是我們所有人辛苦了這 20 年做這一行的意義所在。
謝謝大家!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.