網易首頁 > 網易號 > 正文申請入駐

請來 DeepSeek 核心成員阮翀，元戎啟行要打的是另一場仗

2026-04-21 14:25:53　來源: 晚點LatePost

北京舉報

分享至

大模型人才涌入，幫助智駕廠商突破原有技術框架上限。

文丨趙宇

去年 12 月，地平線副總裁兼首席架構師蘇箐給出了一個判斷：類似特斯拉 FSD V12 這樣的技術突破對行業的重構，至少未來三年內很難再現。“自動駕駛又要過一段時間苦日子。”

這個略顯悲觀的判斷折射出當前的行業現狀：自動駕駛技術演進正進入一段相對平緩的收斂期。在顛覆性創新變得困難的同時，行業內的緊迫感仍在加劇，廠商紛紛將破局希望寄托于 AI 大模型。

今年初，一家頭部國產智駕供應商的 CEO 開始密集線上約見在硅谷工作的高級別 AI 人才，希望從這些專家的視角獲取更多關于 AI 大模型的前沿信息。據我們了解，約見名單當時就已排到六月。

類似的緊迫感在行業內蔓延。包括新勢力主機廠和第三方供應商在內，多家公司都在加班加點研發新技術方案。這些方案的車端模型參數量將是各自當前已量產模型的數倍，比如小鵬計劃將其車端模型參數量提升至 200 億規模。

與此同時，隨著大模型上車成為行業共識，新的重量級玩家順勢入場。近期，一家頭部互聯網大廠的大模型團隊開始布局自動駕駛，由多模態負責人帶隊。

多種跡象表明，AI 大模型正在重塑自動駕駛行業競爭格局。業內已經意識到，只有在車端部署更大規模的模型，智駕體驗才能實現進一步跨越。而隨著研發范式向大模型全面收斂，那些在多模態領域積累深厚的互聯網大廠，正將其核心能力遷移至智駕場景，一場與傳統智駕供應商的交鋒已在所難免。

傳統智駕小模型遭遇性能瓶頸，AI 大模型成破局關鍵

2024 年至今，智駕行業的技術范式主要經歷了兩次關鍵躍遷：先是 “端到端” 大模型的興起，緊接著是以 VLA（視覺-語言-行動模型）為代表的原生多模態大模型嶄露頭角。這兩次技術躍遷的背后，是整個行業對如何解決自動駕駛復雜長尾問題的深入探索。

關于兩種技術范式的差異，卓馭科技 CEO 沈劭劼告訴我們，端到端方案本質上是用一個模型完成整個駕駛任務，但它受限于模型規模，參數量通常在數千萬到數億之間，因此高度依賴海量且優質的駕駛數據。當數據覆蓋足夠全面時，它的表現確實驚艷；可一旦遭遇訓練數據未曾覆蓋的盲區，模型往往缺乏舉一反三的泛化能力。

相比之下，原生多模態 AI 大模型被視為泛化性更強的終極解法。沈劭劼認為它具備兩個核心特征：一是模型規模足夠大，在數據充足的情況下具備涌現能力；二是能夠處理各種非專家數據，直接通過接收視頻、語音、文字等多種模態信息做預訓練。

關于 AI 大模型是更優解法的原因，小鵬通用智能中心負責人劉先明解釋，無論端到端還是 VLA，智駕的核心任務都是處理信息輸入并輸出駕駛決策。如果把車輛軌跡規劃的空間離散化，所有可能的軌跡點組合就會構成一個極大的搜索空間。傳統智駕方案受限于算力和模型能力，核心思路都是做減法，即強行砍掉部分搜索空間，將其壓縮到可計算的范圍內。

“AI 模型則完全反過來。” 劉先明說，AI 之所以聰明，是因為它的參數量直接決定了搜索空間的廣度。解決復雜駕駛問題的最直接路徑，就是讓模型的搜索空間足夠大。

沈劭劼和劉先明的技術洞察，與元戎啟行創始人兼 CEO 周光的感受不謀而合。他在本月舉辦的 2026 年智能電動汽車發展高層論壇上說：過去幾年，自動駕駛每年都有明顯進步。但隨著場景復雜度提升，傳統小模型方案的提升變得愈發困難。

“同一套系統，早上跑得好，中午可能變差；在上海表現不錯，換一個城市就不行。” 周光將這樣的現象形容為 “蹺蹺板效應”，他回顧 2025 年頭部玩家增長放緩、第二梯隊加速追趕的過程，認為本質原因就在于此。

周光透露，目前行業內量產的智駕小模型，參數量多在 1B（十億）甚至 0.1B 以下，運行算力一般為 100 至 200 TOPS，且以卷積神經網絡（CNN）為主，僅包含少量 Transformer 架構。這導致雖然方案不斷迭代，比如某個版本優化了某些場景，但下一個版本可能又會退步——反復修補、不斷迭代，卻沒有本質提升。

要打破僵局，周光認為，關鍵不再是感知能力或簡單的端到端，而是整體認知能力的進化。在論壇群訪環節，周光告訴我們：真正的難點在于如何讓大模型變得更強，而不在于有了好模型之后的蒸餾過程，因為模型蒸餾技術已經成熟。

“如果只是為了適配小算力平臺，行業內已有一套完整的標準流程：先蒸餾，再量化。只要有一個足夠強的大模型作為基礎，就一定能將其蒸餾到 100 TOPS 甚至 30 TOPS 的芯片上。” 不過周光強調：一旦任務要求超出小模型的容量，方案表現就會急劇下降。

從這個角度來說，當前行業面臨的挑戰，是大模型自身能力的提升遇到了瓶頸。周光透露，即使投入三倍的算力、增加三倍的參數量，模型性能依然沒有如預期般出現明顯質變。因此，與其守著訓練手段依然原始的稠密小模型，不如將核心精力聚焦如何突破大模型的能力上限。畢竟，只有造出更大、更強的模型，智駕體驗的再次飛躍才有可能真正發生。

元戎啟行之所以能堅定選擇 AI 大模型路線，得益于這家公司對技術演進趨勢的及早預判。早在 2023 年 8 月，基于對 AI 技術的了解和信任，元戎啟行就啟動了端到端方案的道路測試，時間點早于國內絕大部分廠商。

關于支撐這種早期布局的底層邏輯，周光在去年 3 月的公開演講中有過系統闡述。他當時提出了自動駕駛的 “三階段論”：在 GPT 出現前，語言系統（比如早期的 Siri 和科大訊飛）屬于弱專家系統；GPT 的出現標志著通才系統的誕生，AI 能夠應對各種考試并達到較高水平；接下來，大語言模型的發展會進入強專家系統階段，其在科學領域的應用將進一步落地。他當時還判斷，自動駕駛也會經歷從弱專家系統到強專家系統的類似演變。

大模型人才入局，助推智駕廠商蛻變為真正的 AI 公司

隨著技術路線向大模型全面收斂，自動駕駛行業的人才結構與競爭邏輯開始重構。過去，行業的核心人才是感知、規控等領域的算法工程師；如今，具備多模態、基座模型研發經驗的 AI 人才成為各家爭搶的關鍵資源。

在此過程中，元戎啟行成為了一個極具代表性的行業切片。今年初，元戎啟行首次設立 “首席科學家” 一職，并由大模型領域頂尖專家阮翀出任。作為從幻方時期就加入國產大模型團隊 DeepSeek 的老成員，阮翀曾是 Janus-Pro 等 DeepSeek 多模態成果的核心貢獻者。

這一人事任命背后，是雙方在技術變革期的高度契合。對于元戎啟行這樣的智駕供應商而言，迫切需要具備大模型領域深厚積累的專業人才，來引領公司在 AI 前沿技術方面的探索。

對于阮翀這樣的大模型專家來說，也需要找到一個能夠充分發揮其技術專長、將前沿 AI 理論轉化為實際應用的平臺，而元戎啟行已證明從技術到產品再到商業化的完整能力：截至目前，元戎啟行累計交付近 30 萬臺搭載城市 NOA（導航輔助駕駛）功能的量產車。過去一年，系統累計行駛里程超過 13 億公里，用戶使用時長超 4480 萬小時，避免前向潛在碰撞事故 14.1 萬次，避免后向潛在碰撞事故 4.7 萬次。

此外，當前正是 AI 大模型在自動駕駛領域爆發的關鍵時點，阮翀元戎啟行，更有希望在這一輪技術變革中發揮更大影響力。據了解，在即將開幕的北京車展上，阮翀將發表公開演講，系統闡述元戎啟行在基座模型方向的最新技術進展與核心成果。

對行業趨勢的預判和頂尖 AI 人才的加入，加速了元戎啟行底層技術架構的升級。他們已經告別小模型范式的修修補補，選擇用 Scaling （規模化）的方式系統性提升能力。

在本月的論壇上，周光分享了這一技術轉變：元戎啟行選擇從模型 Scaling 和數據 Scaling 兩個方向同步推進，打造了 40B（400 億參數規模）的基座模型。

周光提出，當前輔助駕駛系統實際上只承擔三種角色：Driver（駕駛者，負責將視覺輸入轉化為駕駛動作）、Analyst（分析者，負責理解和分析關鍵場景）以及 Critic（評估者，從安全與合理性角度評估駕駛行為）。

“過去行業里只訓練 Driver，而現在基座模型統一了這三種能力。它不僅會開車，還能理解為什么要這樣開，并評估怎樣能開得更好。” 周光透露，過去半年到一年，元戎啟行花費大量時間重構這套體系。在元戎啟行看來，它不再是傳統的自動駕駛范式，而是完整的大模型范式。所有輔助駕駛的工作都沉淀在基座模型里，每一步的信息熵都留存在模型中。

這種純粹的 AI 大模型范式，還指向一個更宏大的行業愿景——物理 AI。如果說 ChatGPT 開啟了文本 AI 時代，Gemini 展示了多模態融合的潛力，Sora 和 Seedance 展示了視頻生成 AI 的可能性，那么自動駕駛正在成為物理 AI 的先鋒應用。

早在 2024 年 5 月，周光就提出 “智能汽車是打開物理世界通用 AI 的鑰匙”。他的邏輯是：智能汽車是人類首個達到千萬級數據體量的機器人，通過海量數據對物理世界形成了深度共識理解。如果能有效利用，將有機會沉淀形成一個物理世界的基礎模型，未來也會更容易遷移到其他機器人場景。

到 2025 年 3 月，周光在接受采訪時稱，元戎啟行從不將自己當作智駕公司，而是一家 AI 公司。智駕只不過是實現物理 AI 的商業化選擇。

這一戰略定位在今年 3 月的英偉達 2026 年春季 GTC 大會上得到進一步確認。元戎啟行 CTO 曹通易在會上說，他們的 Foundation Model，不僅是面向下一代輔助駕駛系統的大腦，更是面向物理世界的 AI 基座模型。

對于大模型公司、互聯網大廠和輔助駕駛供應商而言，自動駕駛正在成為共同焦點。因為這不僅關乎商業層面的盈利，更是快速驗證和發展物理 AI 核心能力的路徑。周光在本次論壇上也說，“元戎啟行希望通過持續創新，讓輔助駕駛成為千家萬戶日常出行的一部分，成為未來物理 AI 的基礎設施。”

大模型人才與智駕場景的深度融合，已在工程端完成閉環。仍以元戎啟行為例，在研發端，基座模型幫助其重構了數據閉環：傳統流程大量依賴人工，從問題發現、歸因分析到數據挖掘與標注，周期通常需要 5 天以上。引入基座模型后，通過 AI Orchestrator（AI 編排器）實現全流程自動化，周期縮短至約 12 小時，效率提升近 10 倍，而且每個步驟都能沉淀模型經驗，讓訓練效率更高。

在產品端，基座模型展現出了很強的向下兼容與向上拓展能力。它能夠同時支持多種產品形態：針對 100 TOPS 算力提供經濟型輔助駕駛方案，針對 500 TOPS 算力提供高性能方案，針對上千 TOPS 算力用于 Robotaxi 場景。

立足 2026 年，元戎啟行的首要目標是實現超過 100 萬輛城市 NOA 的量產交付；安全方面，將 MPCI 指標提升至 1000 公里以上；用戶體驗上，將用戶高頻使用率提升至 50% 以上。

在更長遠的未來，元戎啟行計劃挑戰萬公里級的 MPCI（每關鍵接管行駛里程），并最終實現 Robotaxi 的大規模商業化應用，補上物理 AI 的另一塊關鍵版圖。

回望去年底蘇箐的那句 “苦日子”，換個角度看，那或許只是舊范式瓦解前的陣痛。在大模型重塑一切的今天，屬于物理 AI 的黃金時代，正隨著每一公里數據的積累加速駛來。對元戎啟行而言，今年 100 萬輛的交付數字，也只是通往終局的沿途路標，他們的遠期愿景依然是物理 AI——正如周光此前所言，“我們想成為中國第一家實現物理 AI 的公司。”

題圖來源：《F1：狂飆飛車》

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.