![]()
互聯網公司有機會從功能供應商往更核心的方向再進一步。
文丨司雯雯
過去十多年,互聯網公司不愿錯過每一輪進入汽車萬億規模產業的機會,從幫著賣車、賣保險到保養,從地圖、音樂、內容、社交、車聯網、自動駕駛等功能或技術嘗試上車。
但汽車行業分工精細、鏈條長,車企和供應商掌握著主動權,新技術在它們之間流轉,互聯網公司大多只能提供某一項功能,很難進入中心。絕大多數坐進車里和車機說話的人,不知道背后是誰在回答。屏幕上是各家車企自己的助理名字,語音是各家定制的聲線。
在奔馳純電 GLC 里,讓車機找附近有充電樁的川菜館,回答的是豆包大模型;坐進別克至境 E7、奧迪 E7X ,幾個人同時說話、去不同目的地、提出一連串復雜任務,理解和解決需求的也是豆包大模型——它的日均 Token 調用量已經漲至 120 萬億,100% 覆蓋了中國主流車企。
直到 AI 迭代速度和汽車競爭烈度都不斷以超出人們預期的程度進行,情況開始變化。科技公司發展中聚集起足夠的算力、資金和工程團隊,把 AI 推向跨行業的基礎設施,Token 消耗量成為考量一家公司、一名研究員 AI 原生程度的指標,模型和應用的迭代節奏遠快于汽車工業。
對車企來說,把基礎研發交給頭部模型公司、自己做產品定義、體驗和品牌,更符合當下的競爭節奏——僅 4 月北京車展前后,就有超過 181 款新車首發,比上一屆北京車展多了 55%。
火山引擎想抓住這個窗口。他們持續擴展豆包大模型的邊界,汽車是下一個被他們看重的入口。今年北京車展,火山引擎專門設了展臺,展示了奔馳、別克、上汽大眾、上汽奧迪等 7 個品牌的合作車型。火山引擎副總裁楊立偉說,汽車行業對其非常重要,“不追求現階段有多少利潤”。
在汽車產業里,互聯網公司有機會從功能供應商往更核心的方向再進一步。
從閑聊到助手,核心是解決問題
汽車公司有時高估用戶對新技術的耐心,低估把新技術變成用戶體驗的難度。2024 年初,超過 10 家車企在座艙密集接入 DeepSeek 等大模型技術,想讓用戶和車機像手機一樣對話。
一些車企很快就明白路線不對。車內場景下,閑聊對用戶的實際價值相對有限。即便每次發布會都被拿來宣傳的聊天功能,語音助手也很難做好,多數停留在一問一答或獨白,無法識別說話對象,也無法跟蹤上下文。用戶想讓語音助手做些什么,多數功能指令需要用戶用相對準確甚至固定句式才能被準確執行,偶爾還會出現想關車內燈卻誤關閉車大燈的情況。
而一臺好用的車機不在于多么風趣、博學,而是解決問題。尤其今天中國做的電動車車內實體按鍵越來越少。楊立偉以今天手機端的交互效率做參照系,認為手機端能做到 85 分到 90 分,座艙車機交互長期停在四五十分。
這與過去車機的語音架構有關。傳統架構里,用戶和大模型的交互由對話驅動,架構設計的獎勵函數是被動響應需求、及時給出回應,而不是提供功能,有時得到的回復只是 “聽不懂” 或 “做不到”。
相比手機或其他終端,汽車座艙接入大模型的另一個特殊性在于信息密度更高、種類更多、強調本地狀態。手機端的大模型多是單人使用;車內最多時可能有 6 名乘客。多人對話場景下大模型介入的時機隨機且多變。除了語音、文字信息,還有座艙內的溫度、聲音等視覺和端側信息,以及座艙外的光線、道路、交通情況等復雜信息。用戶說 “有點吵”,既可能指音樂聲音大,也可能因為車窗沒關好,過去的語音對話大模型沒有端側的多維信息,很難根據模糊的語句辨別,更難解決。
如果想通過大模型對話解決問題,用戶需要做決策也做分解,把任務拆細,語音助手再通過 NLU(自然語言理解)模塊把指令轉成結構化信號,分發給導航、車控、媒體等領域,任務一多,要么漏、要么錯、要么用戶一遍遍重復。
“能提供情緒價值很好,但首先要把事辦好,把基礎、高頻的功能做到足夠絲滑。” 楊立偉說,他們把車機定位為助手而不是 “Chatbot”。
他們的做法是建立一個 Agentic AI 架構的大腦,由 3 個核心模塊互相協作運行,分別對應流式對話推理、學習沉淀、目標任務驅動三種能力。
- 對話推理引擎目的是像人一樣的交流。免喚醒,但能判斷接入時機,不會隨便插話,聯系上下文、結合車內環境、理解用戶模糊的隱含意圖,除了聽得懂,還能像人一樣的自然流式的對話、像人一樣理解你的需求;
- 學習沉淀引擎目的是像人一樣的學習和成長。“記得住” 用戶的喜好,包括對溫度、風向、座椅調節和音樂風格等習慣,根據知識、反饋,自我進化,并且會反思上一個任務執行情況,沉淀成 skill;
- 在前兩者基礎上,目標驅動引擎的最終落點是 “辦好事”,讓用戶不必一步步發出 “開空調、調溫度、播放音樂、回家” 等指令,由車機根據任務拆解步驟、調用車載工具、技能和生態,像人的思維一樣辦事,協調好各項車控功能,調整到舒適的狀態。
![]()
火山引擎將對話推理引擎、目標驅動引擎、學習成長引擎三大引擎融入統一的 “汽車大腦”。
據楊立偉介紹,豆包大模型目前和 50 個汽車品牌、145 種車型合作,搭載在超過 700 萬輛車,平均每天使用量超過 3000 萬次,其中應用場景最多的是車控(53%)、導航(29%)、媒體(10%)—— 火山引擎認為這反應了用戶的真實需求,“起碼要先把車控、導航、多媒體做好。”
基于這套 Agentic AI 架構,火山引擎可以提供兩種形式的合作方案:
“AI 座艙套件” 方案,基于已經量產落地的豆包大模型智能座艙方案,做了 Agentic 化的架構升級,以能力形式輸出,既有大模型、有 Agent ,也有各類交互、工具和運營管理平臺,車企可根據需求靈活選配。
他們對新方案豆包座艙助手——用統一的 “大腦” 聯動整車能力,以完整產品形式交付,與豆包 APP 互聯互通—— 期待更多,投入大量資源與幾家深度合作的車企共同打磨。
而對于 AI 能力強化之后的安全邊界,火山引擎也有自己的思考。在與榮威的合作里,雙方把車控權限分為黑、灰、彩三層。彩區是空調、座椅、屏幕、車內燈光等可由 AI 直接調控的功能;灰區涉及行駛狀態判斷(比如行駛中能否調座椅),AI 給出建議但執行受規則限制;黑區是剎車、轉向等核心駕駛功能,是 AI 禁區。
“根據我們的規劃,到年底時,豆包座艙助手會像人一樣思考、基于目標持續地辦事。” 楊立偉舉例,如果一位用戶行駛中擔心后排的孩子,他也許會說 “幫我看看孩子睡著沒?” 傳統的大模型會根據這一條要求做回應,或者調節燈光和空調。
但據他介紹,火山引擎的座艙助手會持續思考,如果小孩睡了,調整座艙到更舒適的狀態;如果小孩醒了,會主動陪伴,講故事、播放他喜歡的小豬佩奇或模仿媽媽的口吻安撫,以不影響車主駕駛的形式匯報狀態……“這看起來只是一個簡單任務——不是測試時常用的開車去某地、順便選餐廳、再播放一首音樂,但只幫忙看 ‘孩子睡沒睡’ 并不完全解決問題。人類助手會做什么?那么我們希望座艙助手也能做到。”
一個大腦,深度聯動整車
過去三個多月,OpenClaw 讓大眾直觀看到 AI 除了能聊天,還能動手做事,自主調用工具、完成多步任務。它和 ChatBot 最大的不同是,后者由對話驅動,而 OpenClaw 這類 Agent 由目標驅動,這要求 OpenClaw 至少需要理解、思考和調度能力——那么,如果汽車內也有一個自主性的 Agent 呢?
![]()
觀眾在火山引擎展臺體驗火山引擎合作車型的座艙。
隨著底層模型、框架、工具生態的逐漸成熟,一些 API 已經有了標準和規范,技術上給車機配一個能主動服務的 Agent 不是太難,比如一些車機助手能記住用戶想要避開的路段,在下一次規劃路線時避開——這意味著它有時空因果記憶和對用戶的長期記憶;另一類車機系統可以在聽到 “有點冷” 時主動調高空調、關閉車窗、打開座椅加熱——這體現了意圖識別和使用工具的能力。
技能各家都有,做好不易。如果問題復雜、任務鏈長,累積的誤差越多,越容易陷入死循環。這正是考驗大模型廠商和汽車公司能力的核心。尤其在 2024 年 5 月 GPT-4o 發布會后,行業開始認同有情感、像真人的語音交互在車上實現的可能性和前景。
2026 年,座艙 AI 的競爭從 “大模型上車” 轉向 “智能體上車”,有人開始稱 2026 年為 “智能體上車元年”。
有自研能力或孵化 AI 公司的車企快速推進,理想、小鵬已完成從技術架構到組織架構的整合,吉利和階躍星辰、千里科技合作,將座艙、輔助駕駛等在生態層面打通,組建為 “超級智能體”,在極氪 8X 上首發。另一些車企選擇和頭部 AI 公司合作,除了火山引擎和榮威合作的 “家越”,阿里通義千問和上汽智己宣布,將把座艙、智駕、底盤和阿里生態服務連成一個整車級智能體。
他們之中有的選擇在座艙內分場景部署多個 Agent,比如通勤點單、長途出游等;有的則推動智能座艙和大模型的結合從 “接一個 LLM 進車機” 演化為讓車 “長” 出一個能感知、推理、調度的 “大腦” —— 這正是火山引擎正在做的 —— Agents 在同一個基礎模型上調度,對外作為一個大腦響應用戶的指令。
這正成為汽車智能化競爭的新焦點。體現之一是艙駕融合,過去車企講艙駕融合更多指的是用一塊芯片提供座艙和輔助駕駛兩套系統的算力,但從特斯拉將 Grok 大模型引入座艙,整合座艙功能和 FSD 開始,理想、小鵬、吉利等陸續推動底層模型和數據不同程度打通,目的是讓 AI 溝通座艙和駕駛,從單個功能整合為整車體驗。
火山引擎對艙駕配合的處理是分工明確:座艙大模型作為助手,把用戶的泛化指令轉譯成智駕系統能懂的輸入,最終能不能執行、怎么執行由智駕系統自己判斷。
挑戰在于汽車是超級硬件——有上千種原子化功能,一張座椅的角度、加熱、通風、按摩等功能就涉及近百個工具,且駕駛類相關功能安全性、穩定性要求極高。
火山引擎智能座艙產品負責人張航回憶,2023 年時,他們也做車內 Chatbot,但體驗不夠好,認為未來的 AI 上車趨勢一定是做助手,但與同行討論時,大多數判斷這件事做不成。
他們和豆包大模型基模團隊溝通后,結論是有挑戰但有可能。第一步是做 Function Call(函數調用),讓大模型理解且能夠調用每個車控,比如開關和調節空調。一開始,大模型只能控制 100 多個車控接口,慢慢擴展到 1000 多個,就像擁有了手和腳——能否用工具解決問題,這是大模型和 Agent 的重要區別之一。
第二步讓大模型能感知環境狀態,通過實時變化的傳感器,輸入車速、溫度、電量、駕駛員狀態等信息,比如車窗關閉和開了一條縫時空調的調節方式不同。這讓大模型有了更多的決策依據。
“只能是硬啃。” 張航說,做完第二步時已經過去一年。這一年多足夠一家新成立的大模型廠商漲到數十億美元估值。但汽車產品結構復雜、精密,需要一定周期積累技術和工程化經驗。
同樣是調節空調,豪華、商務車型車主與運動車型車主的需求可能不同,年長用戶和年輕用戶的偏好也不同。當用戶說 “有點熱” 時,如何才能調整到最舒適的狀態——這需要車企的 KnowHow。每家車企對空調檔位、出風位置、掃風情況的設置不同,車企需要根據產品定義和經驗告訴火山引擎每款車型的空調具體情況和想達到的狀態。
通過 3 年積累,火山引擎的大模型有了可調用的工具、能感知環境狀態、積累了用戶偏好和場景知識,就像有了手腳、感官和神經,變成能主動識別、規劃、處理任務的 Agent——給汽車裝上 “大腦” 的時機到了。
不過行業里也有車企走多模型協同的路線,由意圖分類先做粗篩,再分發到專門模型處理具體任務。對于大模型如何上車,有的車企希望自研;有的車企認為自研成本高且必要性不大,傾向直接采購完整方案;還有的車企在兩條路線之間組合,自研與外采并行。
楊立偉說,他們正和合作車企推進豆包座艙助手方案,2026 年年底就會發布,“體驗效果能有 80、90 分”。
先做標桿,再做標準化
Agent 的進化速度,和 FOMO 情緒籠罩下人們對 Agent 的熱情推動車企更開放。2026 年,輔助駕駛的技術路線收斂,同類配置的駕駛體驗逐漸趨同,座艙內的使用體驗成為智能化競爭的 “下半場”;大模型在手機端的迅速發展,也讓消費者將 “AI 上車” 作為評價一臺車是否 “先進”“智能” 的重要維度;與外部已有用戶認知的互聯網科技公司合作,還能得到品牌加成。
楊立偉說,對豆包座艙助手方案上車的第一批合作伙伴,火山引擎投入了上百人,“重投入加快落地、短期內不優先考慮要有多少利潤,而是看服務水平”,因為 “成功與否不看現在成了幾單,而是看用戶體驗能不能做好,能不能做出爆品”,展示豆包大模型和火山引擎上車的最好效果。
座艙和大模型的結合,讓火山引擎看到了進入汽車更深一層的可能。楊立偉說,豆包座艙方案尋找最初的合作伙伴時,品牌因素只排第四,更重要的是對座艙 + AI 足夠相信、開放程度夠高、愿意投入、節奏要快。他說火山引擎總裁譚待與他討論汽車業務時,更多關注的是用戶價值、使用體驗、使用頻次。
字節集團的資源也會提供支持。豆包大模型在 2026 年 4 月的日均 Token(詞元)使用量已經超過 120 萬億,是最活躍的模型之一。車機端會和手機端的豆包會互聯互通,能力同步提高,手機端的交互經驗、KnowHow 也會幫助優化車端 Agent。此外,字節集團的今日頭條、抖音、番茄小說等內容生態也區別于其他大模型廠商。
他們對于汽車業務的長期設想是隨著經驗增加和技術發展,座艙助手的底層能力和架構更加成熟,把產品和應用模塊化,避免重復投入、節約人力。在產品標準化后,和一級供應商等生態伙伴合作,擴大服務范圍。
標準化與生態合作的背后的商業邏輯是,火山引擎提供基礎能力,讓客戶在它之上做出差異化產品;客戶做得越好,供應商的調用規模越大,雙方的利益方向一致。這是 AWS、Shopify 等互聯網基礎設施長期成功的重要因素:將自己的商業利益與客戶的成功綁定在一起。
![]()
Shopify 能力和合作關系示意圖。來源:Ben Thompson、晚點、ChatGPT
火山更進一步的地方在于自己做工具鏈、集成集團體系內的各種能力。挑戰則是車企作為大型制造業公司,與 AWS 的初創客戶、Shopify 的中小商家在議價位置上完全不同。車企多數時候希望以更低的成本、更快的速度獲得差異化、個性化的服務;而且車端大模型的遷移成本目前還不高,車企接入一家供應商的模型,主要工程量集中在提示詞、車控接口映射、測試校準,遷移到另一家時可以部分復用。
這個領域的從業者大多相信車正從交互終端演化為物理 Agent。座艙是這條演化的起點,終點是車能感知環境、理解意圖、規劃任務、執行動作的一體化能力。基于這個假設,火山引擎選的是一條需要長期投入的路。模型與工具鏈持續迭代,與車企的合作持續加深,標桿項目持續落地。
中國電動車時代的供應鏈公司有過類似劇本 —— 每次技術變革新增或改進零部件時,新供應商常以更新的技術、更開放的合作模式、更好的服務意識抓住有潛力的客戶,隨他們成長 —— 過去 10 年里,地平線、孔輝、拓普等供應鏈新軍沿這條路徑起步。一位頭部輔助駕駛供應商總結,作為創業公司,一開始只能自己撲上去、做出樣板,才有上牌桌的資格。
“就像馬拉松比賽剛跑了 1 公里,我們會把周期放得比較長。” 楊立偉說。
題圖來源:通用汽車 1964 Runabout 概念車
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.