智駕深水區(qū)，傳統(tǒng)車企靠AI破局？

2026-04-22 10:40:06　來源: 蓋世汽車

上海舉報(bào)

分享至

2026年的中國汽車市場，一個標(biāo)志性信號正在浮現(xiàn)：智能駕駛不再是一項(xiàng)可選項(xiàng)，而正在成為一輛車的"靈魂"。

這個判斷并非來自營銷話術(shù)，而是來自數(shù)據(jù)。NOA用戶活躍度正以超預(yù)期的速度攀升，各家車企的智駕系統(tǒng)也在從功能層面向體驗(yàn)層、甚至情感層面滲透。

但硬幣的另一面是，"靈魂"的鍛造遠(yuǎn)比想象中艱難。

此前，在2026智能電動汽車發(fā)展高層論壇期間，長城汽車智能化產(chǎn)品副總經(jīng)理佘士東坦言：智能座艙的大模型化"剛跑過發(fā)令槍"，這要遠(yuǎn)遠(yuǎn)慢于互聯(lián)網(wǎng)行業(yè)日新月異的迭代速度。

一個更為殘酷的事實(shí)是：當(dāng)各家車企還在為大模型上車的入場券爭得頭破血流時(shí)，行業(yè)已經(jīng)意識到，這場競爭的真正分水嶺，根本不在算力、不在算法、不在參數(shù)規(guī)模，而在于車企能否擁有自己獨(dú)立的智能化體系能力。

同質(zhì)化困境已來

一個令行業(yè)尷尬的事實(shí)已經(jīng)浮出水面：座艙交互已經(jīng)高度同質(zhì)化。

不同車企看到的幾乎是同一幅畫面——3D車模、壁紙桌面、導(dǎo)航與智駕分層的界面、位置固定的Dock欄、琳瑯滿目的APP生態(tài)。

"我們采集了市面上200多款不同的交互界面喂大模型，大模型給出的結(jié)論是'相似度95%以上'。"佘士東透露，整個行業(yè)已經(jīng)進(jìn)入了一個"非常痛苦的局面"——車廠做新東西的時(shí)候，發(fā)現(xiàn)"無米下鍋"。

圖片來源：長城汽車

這不是長城一家的問題。

從華為鴻蒙座艙到比亞迪DiLink，從小鵬Xmart到理想LiOS，各家座艙OS的底層邏輯趨同，功能矩陣高度重合。區(qū)別僅在于UI設(shè)計(jì)風(fēng)格、語音助手的品牌人設(shè)、以及APP生態(tài)的堆料程度。

當(dāng)競爭退化為"誰的屏幕更大""誰的APP更多"的時(shí)候，這條賽道的紅利已經(jīng)見底。

但與此同時(shí)，一個新的變量正在出現(xiàn)——大模型正在從"后置工具"演變?yōu)?系統(tǒng)內(nèi)核"。

佘士東將這一演進(jìn)分為三個階段：最早的2022至2023年，大模型以"生成內(nèi)容"的形式淺層介入，如聊天問答、生成壁紙和路徑規(guī)劃，他稱之為"后置式大模型"階段。

此后，具備上下文理解和記憶能力的"語音智能體"開始出現(xiàn)。

到2025年下半年，特斯拉在北美搭載Grok、國內(nèi)各家爭搶大模型首發(fā)權(quán)，車載大模型正在向"對話式原生入口"演進(jìn)。

這是一個關(guān)鍵轉(zhuǎn)折。當(dāng)大模型不再是座艙里的一層附加功能，而是成為座艙的底層架構(gòu)時(shí)，競爭邏輯將徹底改變。拼的不再是"你有多少APP"，而是"你有多理解用戶"。

然而，這條路徑上布滿了傳統(tǒng)車企此前從未面對過的難題。

佘士東在采訪中列舉了三大核心困難：

第一，端側(cè)算力不足，目前主流車載芯片算力在五六十TOPS，只能部署零點(diǎn)幾B的小模型，與豆包、千問等大模型的認(rèn)知能力存在代際差距。

第二，車內(nèi)空間建模缺乏成熟方案，行業(yè)甚至互聯(lián)網(wǎng)領(lǐng)域都尚未解決"座艙空間關(guān)系建模"的問題。

第三，車企對自身積累的汽車行業(yè)knowhow（如空調(diào)溫度在不同場景下的最佳策略）的使用水平，"遠(yuǎn)遠(yuǎn)落后于互聯(lián)網(wǎng)行業(yè)"。

簡而言之，傳統(tǒng)車企手里握著最豐富的汽車數(shù)據(jù)，卻最不擅長把這些數(shù)據(jù)喂給AI。這構(gòu)成了整個智駕行業(yè)當(dāng)前最核心的矛盾。

大模型上車中的三重博弈

如果將2026年的智駕競爭拆解為三條戰(zhàn)場，會發(fā)現(xiàn)每一條戰(zhàn)場的規(guī)則都在被AI改寫。

第一條戰(zhàn)線，是端到端與VLA模型的算法之爭。

從BEV+Transformer的多段式方案，到一段式端到端，再到VLA（視覺-語言-動作）模型，技術(shù)路線在兩年內(nèi)經(jīng)歷了三次迭代。

理想汽車在年初發(fā)布了VLA司機(jī)大模型并宣布向"具身智能企業(yè)"轉(zhuǎn)型，智己LS8成為全球首個搭載千問大模型的車型。算法演進(jìn)的速度，讓行業(yè)來不及消化上一代技術(shù)，下一代就已經(jīng)入場。

圖片來源：momenta

但佘士東提出了一個冷靜的判斷："核心的算法其實(shí)并不是整個智駕工程里面最難的那部分……整個過程真正智駕里面最難的那一部分"是全鏈路的打通與協(xié)同。

他以長城為例，自研智駕已推進(jìn)七八年，工程鏈路與數(shù)據(jù)訓(xùn)練鏈路的復(fù)用率已接近80%至90%，"從行業(yè)里面來看，可能也就是值1億到2億"——指的是核心算法的代碼價(jià)值，而真正拉開差距的是數(shù)據(jù)標(biāo)注、模型訓(xùn)練、評價(jià)體系等系統(tǒng)工程能力。

這一判斷的潛臺詞是：算法的差距正在被快速抹平，但"工程化能力"的差距才是真正的護(hù)城河。那些能把智駕系統(tǒng)從幾十TOPS的車部署到七百TOPS的車、并且保持用戶體驗(yàn)一致性的車企，才是真正的贏家。

第二條戰(zhàn)線，是端側(cè)算力的軍備競賽。

2026年，高端智能汽車的端側(cè)算力已經(jīng)從上一代的200TOPS級躍升至700TOPS以上。長城歸元平臺搭載英偉達(dá)Thor芯片，智駕域算力超過700TOPS，座艙域算力超過300TOPS，雙域合計(jì)約1000TOPS。

佘士東將這兩個算力域比喻為"左腦"（智駕）和"右腦"（座艙），分別搭載VLA大模型和空間VLA模型，共同構(gòu)成整車智能體的大腦。

但算力競賽的盡頭不是堆芯片，而是模型部署效率。如何在有限的功耗和散熱約束下，在端側(cè)部署足夠聰明的模型，同時(shí)保證毫秒級的響應(yīng)速度。這既是技術(shù)挑戰(zhàn)，也是成本挑戰(zhàn)。

比亞迪將激光雷達(dá)打進(jìn)10萬元級車型的做法證明了"降本"的可能性，但如何在降本的同時(shí)不犧牲智能化體驗(yàn)，仍然是一個待解難題。

第三條戰(zhàn)線，是生態(tài)選擇權(quán)的爭奪。

2026年，幾乎所有頭部大模型廠商都已入局車載場景——百度文心、阿里千問、字節(jié)豆包、華為盤古，甚至特斯拉Grok。

圖片來源：四維圖新

對于車企而言，選擇與哪一家合作，不僅僅是技術(shù)選型，更是生態(tài)綁定和用戶入口的爭奪。

佘士東在采訪中明確表示，長城不會完全依賴任何單一供應(yīng)商。"它不是一個完全替代的關(guān)系，而是逐漸滲透，并且把局部的算法也可以跟行業(yè)做共創(chuàng)"。

他透露，長城在旗艦級產(chǎn)品上會采用深入自研，在"普惠智能"（100T至200T算力區(qū)間）上會逐漸替換為自研方案，而在"頭部"和"胸部"產(chǎn)品上仍然保持開放，接受行業(yè)里優(yōu)秀的解決方案。

這一策略的邏輯在于：智駕系統(tǒng)不是一次性交付的產(chǎn)品，而是需要持續(xù)進(jìn)化的服務(wù)。如果核心鏈路掌握在供應(yīng)商手里，車企就失去了迭代節(jié)奏的控制權(quán)——而這恰恰是佘士東認(rèn)為的傳統(tǒng)車企轉(zhuǎn)型最大的陷阱。

重新定義"懂你的車"

在技術(shù)競爭之外，一個更深層的變革正在發(fā)生：人與車的關(guān)系，正在被AI重構(gòu)。

佘士東提出了一個概念："人-智-體"座艙智能體交互新范式。

傳統(tǒng)的交互關(guān)系是"人-機(jī)"二元結(jié)構(gòu)，用戶直接操作功能按鍵或語音指令；而在新的范式下，智能體（"智"）作為中間層介入，用戶不再直接面對"體"（車控和生態(tài)），而是與智能體進(jìn)行自然對話，由智能體來調(diào)用車輛功能。

這一轉(zhuǎn)變聽起來抽象，但體驗(yàn)上是顛覆性的。

圖片來源：特斯拉

佘士東舉了一個例子：當(dāng)車上坐了三個人時(shí)，用戶想打開座椅加熱，傳統(tǒng)的方式是說出精準(zhǔn)指令——"打開二排右側(cè)座椅加熱"。

在"人-智-體"模式下，用戶只需說"幫我打開座椅加熱"，智能體就能自動識別說話者是誰、坐在哪個位置、是否需要先關(guān)車窗、出風(fēng)口是否對準(zhǔn)用戶、用戶的身高體型如何——然后以最優(yōu)策略執(zhí)行。

這不是語音識別能力的提升，而是交互邏輯的徹底重構(gòu)。從"人適應(yīng)機(jī)器"到"機(jī)器適應(yīng)人"，一字之差背后是整個座艙工程范式的轉(zhuǎn)變。

長城汽車近千萬用戶的車聯(lián)網(wǎng)數(shù)據(jù)顯示，人車交互頻率約為每小時(shí)4至5次，是一個非常稀疏的使用過程。

這意味著，智能座艙的價(jià)值不在于提供更多可操作的功能，而在于在用戶真正需要的時(shí)刻，以最自然的方式提供服務(wù)。

佘士東將長城智能體的演進(jìn)分為四個階段——"相識、相知、相愛、相伴"，對應(yīng)從識別用戶、理解習(xí)慣、主動服務(wù)到全時(shí)陪伴的漸進(jìn)式進(jìn)化。

但這一愿景的實(shí)現(xiàn)面臨現(xiàn)實(shí)約束。

佘士東坦言，目前整個AI化的座艙"剛跑過發(fā)令槍"，遠(yuǎn)沒有到可以提供"美好生活方式"推薦的程度。他用馬拉松做比喻："可能我們還需要很長的一段時(shí)間來完成全程的過程"。

一個值得注意的趨勢是，長城并非孤例。

智己汽車發(fā)布的IM Ultra Agent智能體、百度地圖的AI座艙智能體、理想的VLA司機(jī)大模型，都在朝著"整車智能體"的方向演進(jìn)。各家路線雖有差異，但方向高度一致：用AI統(tǒng)一座艙和智駕，用一個智能體連接用戶和整輛車。

這意味著，行業(yè)的競爭重心正在從"功能堆料"轉(zhuǎn)向"體驗(yàn)深度"——誰能讓用戶感受到"這輛車真的懂我"，誰就贏得了下一階段的門票。

另一個深層次的變化發(fā)生在"性格"層面。

當(dāng)佘士東被問及此前關(guān)于"特斯拉FSD像觀光模式""坦克400太溫柔用戶反而不滿意"的著名觀點(diǎn)，并追問"智駕的性格是不是比能力上限更重要"。

佘士東回應(yīng)稱，在智能體時(shí)代，不同場景下的差異化體驗(yàn)會被智能體"吸收掉"——智能體會根據(jù)用戶場景自動在舒適、效率、安全等維度之間找到最優(yōu)解，用戶只需要表達(dá)"我怎么更舒適、更輕松"，而不需要關(guān)心底層系統(tǒng)如何實(shí)現(xiàn)。

這種"性格"的差異化，恰恰是傳統(tǒng)車企最有機(jī)會形成壁壘的地方。

每家車企的用戶群體不同、品牌基因不同、場景數(shù)據(jù)不同，當(dāng)這些差異被灌入AI模型后，理論上每家車企都能訓(xùn)練出獨(dú)一無二的智能體。

華為的智駕偏重安全冗余和全場景覆蓋，小鵬的智駕側(cè)重通勤效率，理想的智駕傾向于家庭友好，而長城的智駕則天然帶有越野基因。這些差異不是靠算法參數(shù)調(diào)出來的，而是靠數(shù)百萬公里的真實(shí)場景數(shù)據(jù)"喂"出來的。

從這個意義上說，大模型上車的真正價(jià)值，不是讓所有車變得一樣聰明，而是讓每輛車變得獨(dú)一無二。

回望長城汽車的智能化轉(zhuǎn)型歷程，佘士東將其劃分為三個階段：

第一階段（2021-2023）解決平臺化，統(tǒng)一240多個軟件版本，實(shí)現(xiàn)OTA迭代能力；第二階段（2023-2025）深入用戶共創(chuàng)，組織1000多次用戶溝通和60多次48小時(shí)跟訪，實(shí)現(xiàn)90%以上的OTA用戶滿意度；第三階段（2025至今）進(jìn)入AI智能體化，用"人-智-體"范式重構(gòu)用戶體驗(yàn)。

這三個階段的演進(jìn)，本質(zhì)上是一個傳統(tǒng)車企從"賣硬件"到"賣軟件"再到"賣體驗(yàn)"的完整蛻變路徑。而這條路，幾乎適用于所有正在經(jīng)歷智能化轉(zhuǎn)型的傳統(tǒng)車企。

佘士東在采訪中說了一句意味深長的話："不能把與用戶的連接轉(zhuǎn)手交給供應(yīng)商。"這或許是對整個行業(yè)最犀利的提醒。

在AI重塑汽車產(chǎn)業(yè)的過程中，技術(shù)永遠(yuǎn)不是最大的障礙，真正的陷阱在于——你是否愿意、是否有能力直接面對用戶。因?yàn)楫?dāng)智能體成為用戶與汽車之間的唯一中介時(shí)，誰擁有這個中介，誰就擁有了一切。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.