2026年的中國汽車市場,一個標(biāo)志性信號正在浮現(xiàn):智能駕駛不再是一項(xiàng)可選項(xiàng),而正在成為一輛車的"靈魂"。
這個判斷并非來自營銷話術(shù),而是來自數(shù)據(jù)。NOA用戶活躍度正以超預(yù)期的速度攀升,各家車企的智駕系統(tǒng)也在從功能層面向體驗(yàn)層、甚至情感層面滲透。
但硬幣的另一面是,"靈魂"的鍛造遠(yuǎn)比想象中艱難。
此前,在2026智能電動汽車發(fā)展高層論壇期間,長城汽車智能化產(chǎn)品副總經(jīng)理佘士東坦言:智能座艙的大模型化"剛跑過發(fā)令槍",這要遠(yuǎn)遠(yuǎn)慢于互聯(lián)網(wǎng)行業(yè)日新月異的迭代速度。
一個更為殘酷的事實(shí)是:當(dāng)各家車企還在為大模型上車的入場券爭得頭破血流時(shí),行業(yè)已經(jīng)意識到,這場競爭的真正分水嶺,根本不在算力、不在算法、不在參數(shù)規(guī)模,而在于車企能否擁有自己獨(dú)立的智能化體系能力。
同質(zhì)化困境已來
一個令行業(yè)尷尬的事實(shí)已經(jīng)浮出水面:座艙交互已經(jīng)高度同質(zhì)化。
不同車企看到的幾乎是同一幅畫面——3D車模、壁紙桌面、導(dǎo)航與智駕分層的界面、位置固定的Dock欄、琳瑯滿目的APP生態(tài)。
"我們采集了市面上200多款不同的交互界面喂大模型,大模型給出的結(jié)論是'相似度95%以上'。"佘士東透露,整個行業(yè)已經(jīng)進(jìn)入了一個"非常痛苦的局面"——車廠做新東西的時(shí)候,發(fā)現(xiàn)"無米下鍋"。
![]()
圖片來源:長城汽車
這不是長城一家的問題。
從華為鴻蒙座艙到比亞迪DiLink,從小鵬Xmart到理想LiOS,各家座艙OS的底層邏輯趨同,功能矩陣高度重合。區(qū)別僅在于UI設(shè)計(jì)風(fēng)格、語音助手的品牌人設(shè)、以及APP生態(tài)的堆料程度。
當(dāng)競爭退化為"誰的屏幕更大""誰的APP更多"的時(shí)候,這條賽道的紅利已經(jīng)見底。
但與此同時(shí),一個新的變量正在出現(xiàn)——大模型正在從"后置工具"演變?yōu)?系統(tǒng)內(nèi)核"。
佘士東將這一演進(jìn)分為三個階段:最早的2022至2023年,大模型以"生成內(nèi)容"的形式淺層介入,如聊天問答、生成壁紙和路徑規(guī)劃,他稱之為"后置式大模型"階段。
此后,具備上下文理解和記憶能力的"語音智能體"開始出現(xiàn)。
到2025年下半年,特斯拉在北美搭載Grok、國內(nèi)各家爭搶大模型首發(fā)權(quán),車載大模型正在向"對話式原生入口"演進(jìn)。
這是一個關(guān)鍵轉(zhuǎn)折。當(dāng)大模型不再是座艙里的一層附加功能,而是成為座艙的底層架構(gòu)時(shí),競爭邏輯將徹底改變。拼的不再是"你有多少APP",而是"你有多理解用戶"。
然而,這條路徑上布滿了傳統(tǒng)車企此前從未面對過的難題。
佘士東在采訪中列舉了三大核心困難:
第一,端側(cè)算力不足,目前主流車載芯片算力在五六十TOPS,只能部署零點(diǎn)幾B的小模型,與豆包、千問等大模型的認(rèn)知能力存在代際差距。
第二,車內(nèi)空間建模缺乏成熟方案,行業(yè)甚至互聯(lián)網(wǎng)領(lǐng)域都尚未解決"座艙空間關(guān)系建模"的問題。
第三,車企對自身積累的汽車行業(yè)knowhow(如空調(diào)溫度在不同場景下的最佳策略)的使用水平,"遠(yuǎn)遠(yuǎn)落后于互聯(lián)網(wǎng)行業(yè)"。
簡而言之,傳統(tǒng)車企手里握著最豐富的汽車數(shù)據(jù),卻最不擅長把這些數(shù)據(jù)喂給AI。這構(gòu)成了整個智駕行業(yè)當(dāng)前最核心的矛盾。
大模型上車中的三重博弈
如果將2026年的智駕競爭拆解為三條戰(zhàn)場,會發(fā)現(xiàn)每一條戰(zhàn)場的規(guī)則都在被AI改寫。
第一條戰(zhàn)線,是端到端與VLA模型的算法之爭。
從BEV+Transformer的多段式方案,到一段式端到端,再到VLA(視覺-語言-動作)模型,技術(shù)路線在兩年內(nèi)經(jīng)歷了三次迭代。
理想汽車在年初發(fā)布了VLA司機(jī)大模型并宣布向"具身智能企業(yè)"轉(zhuǎn)型,智己LS8成為全球首個搭載千問大模型的車型。算法演進(jìn)的速度,讓行業(yè)來不及消化上一代技術(shù),下一代就已經(jīng)入場。
![]()
圖片來源:momenta
但佘士東提出了一個冷靜的判斷:"核心的算法其實(shí)并不是整個智駕工程里面最難的那部分……整個過程真正智駕里面最難的那一部分"是全鏈路的打通與協(xié)同。
他以長城為例,自研智駕已推進(jìn)七八年,工程鏈路與數(shù)據(jù)訓(xùn)練鏈路的復(fù)用率已接近80%至90%,"從行業(yè)里面來看,可能也就是值1億到2億"——指的是核心算法的代碼價(jià)值,而真正拉開差距的是數(shù)據(jù)標(biāo)注、模型訓(xùn)練、評價(jià)體系等系統(tǒng)工程能力。
這一判斷的潛臺詞是:算法的差距正在被快速抹平,但"工程化能力"的差距才是真正的護(hù)城河。那些能把智駕系統(tǒng)從幾十TOPS的車部署到七百TOPS的車、并且保持用戶體驗(yàn)一致性的車企,才是真正的贏家。
第二條戰(zhàn)線,是端側(cè)算力的軍備競賽。
2026年,高端智能汽車的端側(cè)算力已經(jīng)從上一代的200TOPS級躍升至700TOPS以上。長城歸元平臺搭載英偉達(dá)Thor芯片,智駕域算力超過700TOPS,座艙域算力超過300TOPS,雙域合計(jì)約1000TOPS。
佘士東將這兩個算力域比喻為"左腦"(智駕)和"右腦"(座艙),分別搭載VLA大模型和空間VLA模型,共同構(gòu)成整車智能體的大腦。
但算力競賽的盡頭不是堆芯片,而是模型部署效率。如何在有限的功耗和散熱約束下,在端側(cè)部署足夠聰明的模型,同時(shí)保證毫秒級的響應(yīng)速度。這既是技術(shù)挑戰(zhàn),也是成本挑戰(zhàn)。
比亞迪將激光雷達(dá)打進(jìn)10萬元級車型的做法證明了"降本"的可能性,但如何在降本的同時(shí)不犧牲智能化體驗(yàn),仍然是一個待解難題。
第三條戰(zhàn)線,是生態(tài)選擇權(quán)的爭奪。
2026年,幾乎所有頭部大模型廠商都已入局車載場景——百度文心、阿里千問、字節(jié)豆包、華為盤古,甚至特斯拉Grok。
![]()
圖片來源:四維圖新
對于車企而言,選擇與哪一家合作,不僅僅是技術(shù)選型,更是生態(tài)綁定和用戶入口的爭奪。
佘士東在采訪中明確表示,長城不會完全依賴任何單一供應(yīng)商。"它不是一個完全替代的關(guān)系,而是逐漸滲透,并且把局部的算法也可以跟行業(yè)做共創(chuàng)"。
他透露,長城在旗艦級產(chǎn)品上會采用深入自研,在"普惠智能"(100T至200T算力區(qū)間)上會逐漸替換為自研方案,而在"頭部"和"胸部"產(chǎn)品上仍然保持開放,接受行業(yè)里優(yōu)秀的解決方案。
這一策略的邏輯在于:智駕系統(tǒng)不是一次性交付的產(chǎn)品,而是需要持續(xù)進(jìn)化的服務(wù)。如果核心鏈路掌握在供應(yīng)商手里,車企就失去了迭代節(jié)奏的控制權(quán)——而這恰恰是佘士東認(rèn)為的傳統(tǒng)車企轉(zhuǎn)型最大的陷阱。
重新定義"懂你的車"
在技術(shù)競爭之外,一個更深層的變革正在發(fā)生:人與車的關(guān)系,正在被AI重構(gòu)。
佘士東提出了一個概念:"人-智-體"座艙智能體交互新范式。
傳統(tǒng)的交互關(guān)系是"人-機(jī)"二元結(jié)構(gòu),用戶直接操作功能按鍵或語音指令;而在新的范式下,智能體("智")作為中間層介入,用戶不再直接面對"體"(車控和生態(tài)),而是與智能體進(jìn)行自然對話,由智能體來調(diào)用車輛功能。
這一轉(zhuǎn)變聽起來抽象,但體驗(yàn)上是顛覆性的。
![]()
圖片來源:特斯拉
佘士東舉了一個例子:當(dāng)車上坐了三個人時(shí),用戶想打開座椅加熱,傳統(tǒng)的方式是說出精準(zhǔn)指令——"打開二排右側(cè)座椅加熱"。
在"人-智-體"模式下,用戶只需說"幫我打開座椅加熱",智能體就能自動識別說話者是誰、坐在哪個位置、是否需要先關(guān)車窗、出風(fēng)口是否對準(zhǔn)用戶、用戶的身高體型如何——然后以最優(yōu)策略執(zhí)行。
這不是語音識別能力的提升,而是交互邏輯的徹底重構(gòu)。從"人適應(yīng)機(jī)器"到"機(jī)器適應(yīng)人",一字之差背后是整個座艙工程范式的轉(zhuǎn)變。
長城汽車近千萬用戶的車聯(lián)網(wǎng)數(shù)據(jù)顯示,人車交互頻率約為每小時(shí)4至5次,是一個非常稀疏的使用過程。
這意味著,智能座艙的價(jià)值不在于提供更多可操作的功能,而在于在用戶真正需要的時(shí)刻,以最自然的方式提供服務(wù)。
佘士東將長城智能體的演進(jìn)分為四個階段——"相識、相知、相愛、相伴",對應(yīng)從識別用戶、理解習(xí)慣、主動服務(wù)到全時(shí)陪伴的漸進(jìn)式進(jìn)化。
但這一愿景的實(shí)現(xiàn)面臨現(xiàn)實(shí)約束。
佘士東坦言,目前整個AI化的座艙"剛跑過發(fā)令槍",遠(yuǎn)沒有到可以提供"美好生活方式"推薦的程度。他用馬拉松做比喻:"可能我們還需要很長的一段時(shí)間來完成全程的過程"。
一個值得注意的趨勢是,長城并非孤例。
智己汽車發(fā)布的IM Ultra Agent智能體、百度地圖的AI座艙智能體、理想的VLA司機(jī)大模型,都在朝著"整車智能體"的方向演進(jìn)。各家路線雖有差異,但方向高度一致:用AI統(tǒng)一座艙和智駕,用一個智能體連接用戶和整輛車。
這意味著,行業(yè)的競爭重心正在從"功能堆料"轉(zhuǎn)向"體驗(yàn)深度"——誰能讓用戶感受到"這輛車真的懂我",誰就贏得了下一階段的門票。
另一個深層次的變化發(fā)生在"性格"層面。
當(dāng)佘士東被問及此前關(guān)于"特斯拉FSD像觀光模式""坦克400太溫柔用戶反而不滿意"的著名觀點(diǎn),并追問"智駕的性格是不是比能力上限更重要"。
佘士東回應(yīng)稱,在智能體時(shí)代,不同場景下的差異化體驗(yàn)會被智能體"吸收掉"——智能體會根據(jù)用戶場景自動在舒適、效率、安全等維度之間找到最優(yōu)解,用戶只需要表達(dá)"我怎么更舒適、更輕松",而不需要關(guān)心底層系統(tǒng)如何實(shí)現(xiàn)。
這種"性格"的差異化,恰恰是傳統(tǒng)車企最有機(jī)會形成壁壘的地方。
每家車企的用戶群體不同、品牌基因不同、場景數(shù)據(jù)不同,當(dāng)這些差異被灌入AI模型后,理論上每家車企都能訓(xùn)練出獨(dú)一無二的智能體。
華為的智駕偏重安全冗余和全場景覆蓋,小鵬的智駕側(cè)重通勤效率,理想的智駕傾向于家庭友好,而長城的智駕則天然帶有越野基因。這些差異不是靠算法參數(shù)調(diào)出來的,而是靠數(shù)百萬公里的真實(shí)場景數(shù)據(jù)"喂"出來的。
從這個意義上說,大模型上車的真正價(jià)值,不是讓所有車變得一樣聰明,而是讓每輛車變得獨(dú)一無二。
回望長城汽車的智能化轉(zhuǎn)型歷程,佘士東將其劃分為三個階段:
第一階段(2021-2023)解決平臺化,統(tǒng)一240多個軟件版本,實(shí)現(xiàn)OTA迭代能力;第二階段(2023-2025)深入用戶共創(chuàng),組織1000多次用戶溝通和60多次48小時(shí)跟訪,實(shí)現(xiàn)90%以上的OTA用戶滿意度;第三階段(2025至今)進(jìn)入AI智能體化,用"人-智-體"范式重構(gòu)用戶體驗(yàn)。
這三個階段的演進(jìn),本質(zhì)上是一個傳統(tǒng)車企從"賣硬件"到"賣軟件"再到"賣體驗(yàn)"的完整蛻變路徑。而這條路,幾乎適用于所有正在經(jīng)歷智能化轉(zhuǎn)型的傳統(tǒng)車企。
佘士東在采訪中說了一句意味深長的話:"不能把與用戶的連接轉(zhuǎn)手交給供應(yīng)商。"這或許是對整個行業(yè)最犀利的提醒。
在AI重塑汽車產(chǎn)業(yè)的過程中,技術(shù)永遠(yuǎn)不是最大的障礙,真正的陷阱在于——你是否愿意、是否有能力直接面對用戶。因?yàn)楫?dāng)智能體成為用戶與汽車之間的唯一中介時(shí),誰擁有這個中介,誰就擁有了一切。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.