![]()
大模型人才涌入,幫助智駕廠商突破原有技術框架上限。
文丨趙宇
去年 12 月,地平線副總裁兼首席架構師蘇箐給出了一個判斷:類似特斯拉 FSD V12 這樣的技術突破對行業的重構,至少未來三年內很難再現。“自動駕駛又要過一段時間苦日子。”
這個略顯悲觀的判斷折射出當前的行業現狀:自動駕駛技術演進正進入一段相對平緩的收斂期。在顛覆性創新變得困難的同時,行業內的緊迫感仍在加劇,廠商紛紛將破局希望寄托于 AI 大模型。
今年初,一家頭部國產智駕供應商的 CEO 開始密集線上約見在硅谷工作的高級別 AI 人才,希望從這些專家的視角獲取更多關于 AI 大模型的前沿信息。據我們了解,約見名單當時就已排到六月。
類似的緊迫感在行業內蔓延。包括新勢力主機廠和第三方供應商在內,多家公司都在加班加點研發新技術方案。這些方案的車端模型參數量將是各自當前已量產模型的數倍,比如小鵬計劃將其車端模型參數量提升至 200 億規模。
與此同時,隨著大模型上車成為行業共識,新的重量級玩家順勢入場。近期,一家頭部互聯網大廠的大模型團隊開始布局自動駕駛,由多模態負責人帶隊。
多種跡象表明,AI 大模型正在重塑自動駕駛行業競爭格局。業內已經意識到,只有在車端部署更大規模的模型,智駕體驗才能實現進一步跨越。而隨著研發范式向大模型全面收斂,那些在多模態領域積累深厚的互聯網大廠,正將其核心能力遷移至智駕場景,一場與傳統智駕供應商的交鋒已在所難免。
傳統智駕小模型遭遇性能瓶頸,AI 大模型成破局關鍵
2024 年至今,智駕行業的技術范式主要經歷了兩次關鍵躍遷:先是 “端到端” 大模型的興起,緊接著是以 VLA(視覺-語言-行動模型)為代表的原生多模態大模型嶄露頭角。這兩次技術躍遷的背后,是整個行業對如何解決自動駕駛復雜長尾問題的深入探索。
關于兩種技術范式的差異,卓馭科技 CEO 沈劭劼告訴我們,端到端方案本質上是用一個模型完成整個駕駛任務,但它受限于模型規模,參數量通常在數千萬到數億之間,因此高度依賴海量且優質的駕駛數據。當數據覆蓋足夠全面時,它的表現確實驚艷;可一旦遭遇訓練數據未曾覆蓋的盲區,模型往往缺乏舉一反三的泛化能力。
相比之下,原生多模態 AI 大模型被視為泛化性更強的終極解法。沈劭劼認為它具備兩個核心特征:一是模型規模足夠大,在數據充足的情況下具備涌現能力;二是能夠處理各種非專家數據,直接通過接收視頻、語音、文字等多種模態信息做預訓練。
關于 AI 大模型是更優解法的原因,小鵬通用智能中心負責人劉先明解釋,無論端到端還是 VLA,智駕的核心任務都是處理信息輸入并輸出駕駛決策。如果把車輛軌跡規劃的空間離散化,所有可能的軌跡點組合就會構成一個極大的搜索空間。傳統智駕方案受限于算力和模型能力,核心思路都是做減法,即強行砍掉部分搜索空間,將其壓縮到可計算的范圍內。
“AI 模型則完全反過來。” 劉先明說,AI 之所以聰明,是因為它的參數量直接決定了搜索空間的廣度。解決復雜駕駛問題的最直接路徑,就是讓模型的搜索空間足夠大。
沈劭劼和劉先明的技術洞察,與元戎啟行創始人兼 CEO 周光的感受不謀而合。他在本月舉辦的 2026 年智能電動汽車發展高層論壇上說:過去幾年,自動駕駛每年都有明顯進步。但隨著場景復雜度提升,傳統小模型方案的提升變得愈發困難。
“同一套系統,早上跑得好,中午可能變差;在上海表現不錯,換一個城市就不行。” 周光將這樣的現象形容為 “蹺蹺板效應”,他回顧 2025 年頭部玩家增長放緩、第二梯隊加速追趕的過程,認為本質原因就在于此。
周光透露,目前行業內量產的智駕小模型,參數量多在 1B(十億)甚至 0.1B 以下,運行算力一般為 100 至 200 TOPS,且以卷積神經網絡(CNN)為主,僅包含少量 Transformer 架構。這導致雖然方案不斷迭代,比如某個版本優化了某些場景,但下一個版本可能又會退步——反復修補、不斷迭代,卻沒有本質提升。
要打破僵局,周光認為,關鍵不再是感知能力或簡單的端到端,而是整體認知能力的進化。在論壇群訪環節,周光告訴我們:真正的難點在于如何讓大模型變得更強,而不在于有了好模型之后的蒸餾過程,因為模型蒸餾技術已經成熟。
“如果只是為了適配小算力平臺,行業內已有一套完整的標準流程:先蒸餾,再量化。只要有一個足夠強的大模型作為基礎,就一定能將其蒸餾到 100 TOPS 甚至 30 TOPS 的芯片上。” 不過周光強調:一旦任務要求超出小模型的容量,方案表現就會急劇下降。
從這個角度來說,當前行業面臨的挑戰,是大模型自身能力的提升遇到了瓶頸。周光透露,即使投入三倍的算力、增加三倍的參數量,模型性能依然沒有如預期般出現明顯質變。因此,與其守著訓練手段依然原始的稠密小模型,不如將核心精力聚焦如何突破大模型的能力上限。畢竟,只有造出更大、更強的模型,智駕體驗的再次飛躍才有可能真正發生。
元戎啟行之所以能堅定選擇 AI 大模型路線,得益于這家公司對技術演進趨勢的及早預判。早在 2023 年 8 月,基于對 AI 技術的了解和信任,元戎啟行就啟動了端到端方案的道路測試,時間點早于國內絕大部分廠商。
關于支撐這種早期布局的底層邏輯,周光在去年 3 月的公開演講中有過系統闡述。他當時提出了自動駕駛的 “三階段論”:在 GPT 出現前,語言系統(比如早期的 Siri 和科大訊飛)屬于弱專家系統;GPT 的出現標志著通才系統的誕生,AI 能夠應對各種考試并達到較高水平;接下來,大語言模型的發展會進入強專家系統階段,其在科學領域的應用將進一步落地。他當時還判斷,自動駕駛也會經歷從弱專家系統到強專家系統的類似演變。
大模型人才入局,助推智駕廠商蛻變為真正的 AI 公司
隨著技術路線向大模型全面收斂,自動駕駛行業的人才結構與競爭邏輯開始重構。過去,行業的核心人才是感知、規控等領域的算法工程師;如今,具備多模態、基座模型研發經驗的 AI 人才成為各家爭搶的關鍵資源。
在此過程中,元戎啟行成為了一個極具代表性的行業切片。今年初,元戎啟行首次設立 “首席科學家” 一職,并由大模型領域頂尖專家阮翀出任。作為從幻方時期就加入國產大模型團隊 DeepSeek 的老成員,阮翀曾是 Janus-Pro 等 DeepSeek 多模態成果的核心貢獻者。
這一人事任命背后,是雙方在技術變革期的高度契合。對于元戎啟行這樣的智駕供應商而言,迫切需要具備大模型領域深厚積累的專業人才,來引領公司在 AI 前沿技術方面的探索。
對于阮翀這樣的大模型專家來說,也需要找到一個能夠充分發揮其技術專長、將前沿 AI 理論轉化為實際應用的平臺,而元戎啟行已證明從技術到產品再到商業化的完整能力:截至目前,元戎啟行累計交付近 30 萬臺搭載城市 NOA(導航輔助駕駛)功能的量產車。過去一年,系統累計行駛里程超過 13 億公里,用戶使用時長超 4480 萬小時,避免前向潛在碰撞事故 14.1 萬次,避免后向潛在碰撞事故 4.7 萬次。
此外,當前正是 AI 大模型在自動駕駛領域爆發的關鍵時點,阮翀元戎啟行,更有希望在這一輪技術變革中發揮更大影響力。據了解,在即將開幕的北京車展上,阮翀將發表公開演講,系統闡述元戎啟行在基座模型方向的最新技術進展與核心成果。
![]()
對行業趨勢的預判和頂尖 AI 人才的加入,加速了元戎啟行底層技術架構的升級。他們已經告別小模型范式的修修補補,選擇用 Scaling (規模化)的方式系統性提升能力。
在本月的論壇上,周光分享了這一技術轉變:元戎啟行選擇從模型 Scaling 和數據 Scaling 兩個方向同步推進,打造了 40B(400 億參數規模)的基座模型。
周光提出,當前輔助駕駛系統實際上只承擔三種角色:Driver(駕駛者,負責將視覺輸入轉化為駕駛動作)、Analyst(分析者,負責理解和分析關鍵場景)以及 Critic(評估者,從安全與合理性角度評估駕駛行為)。
“過去行業里只訓練 Driver,而現在基座模型統一了這三種能力。它不僅會開車,還能理解為什么要這樣開,并評估怎樣能開得更好。” 周光透露,過去半年到一年,元戎啟行花費大量時間重構這套體系。在元戎啟行看來,它不再是傳統的自動駕駛范式,而是完整的大模型范式。所有輔助駕駛的工作都沉淀在基座模型里,每一步的信息熵都留存在模型中。
這種純粹的 AI 大模型范式,還指向一個更宏大的行業愿景——物理 AI。如果說 ChatGPT 開啟了文本 AI 時代,Gemini 展示了多模態融合的潛力,Sora 和 Seedance 展示了視頻生成 AI 的可能性,那么自動駕駛正在成為物理 AI 的先鋒應用。
早在 2024 年 5 月,周光就提出 “智能汽車是打開物理世界通用 AI 的鑰匙”。他的邏輯是:智能汽車是人類首個達到千萬級數據體量的機器人,通過海量數據對物理世界形成了深度共識理解。如果能有效利用,將有機會沉淀形成一個物理世界的基礎模型,未來也會更容易遷移到其他機器人場景。
到 2025 年 3 月,周光在接受采訪時稱,元戎啟行從不將自己當作智駕公司,而是一家 AI 公司。智駕只不過是實現物理 AI 的商業化選擇。
這一戰略定位在今年 3 月的英偉達 2026 年春季 GTC 大會上得到進一步確認。元戎啟行 CTO 曹通易在會上說,他們的 Foundation Model,不僅是面向下一代輔助駕駛系統的大腦,更是面向物理世界的 AI 基座模型。
對于大模型公司、互聯網大廠和輔助駕駛供應商而言,自動駕駛正在成為共同焦點。因為這不僅關乎商業層面的盈利,更是快速驗證和發展物理 AI 核心能力的路徑。周光在本次論壇上也說,“元戎啟行希望通過持續創新,讓輔助駕駛成為千家萬戶日常出行的一部分,成為未來物理 AI 的基礎設施。”
大模型人才與智駕場景的深度融合,已在工程端完成閉環。仍以元戎啟行為例,在研發端,基座模型幫助其重構了數據閉環:傳統流程大量依賴人工,從問題發現、歸因分析到數據挖掘與標注,周期通常需要 5 天以上。引入基座模型后,通過 AI Orchestrator(AI 編排器) 實現全流程自動化,周期縮短至約 12 小時,效率提升近 10 倍,而且每個步驟都能沉淀模型經驗,讓訓練效率更高。
在產品端,基座模型展現出了很強的向下兼容與向上拓展能力。它能夠同時支持多種產品形態:針對 100 TOPS 算力提供經濟型輔助駕駛方案,針對 500 TOPS 算力提供高性能方案,針對上千 TOPS 算力用于 Robotaxi 場景。
立足 2026 年,元戎啟行的首要目標是實現超過 100 萬輛城市 NOA 的量產交付;安全方面,將 MPCI 指標提升至 1000 公里以上;用戶體驗上,將用戶高頻使用率提升至 50% 以上。
在更長遠的未來,元戎啟行計劃挑戰萬公里級的 MPCI(每關鍵接管行駛里程),并最終實現 Robotaxi 的大規模商業化應用,補上物理 AI 的另一塊關鍵版圖。
回望去年底蘇箐的那句 “苦日子”,換個角度看,那或許只是舊范式瓦解前的陣痛。在大模型重塑一切的今天,屬于物理 AI 的黃金時代,正隨著每一公里數據的積累加速駛來。對元戎啟行而言,今年 100 萬輛的交付數字,也只是通往終局的沿途路標,他們的遠期愿景依然是物理 AI——正如周光此前所言,“我們想成為中國第一家實現物理 AI 的公司。”
題圖來源:《F1:狂飆飛車》
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.