![]()
清晨 6:45。你的日歷里標(biāo)注著 9:00 在會展中心的會議。
你還沒起身,Agent 在后臺已經(jīng)完成了幾輪判斷。
今天氣溫升高了幾度,有點熱;當(dāng)天場館周邊有大型活動,常走路線預(yù)計會很堵;車輛電量還剩 62%,足夠往返。
于是系統(tǒng)自動將出發(fā)提醒從原本的鬧鐘時間提前至 7:20,同時將車內(nèi)溫度預(yù)設(shè)為 22 度,打開你慣常收聽的晨間播客。
等你下樓、走出電梯、拉開車門,車已經(jīng)像剛剛被人收拾好一樣,溫度合適,路線妥當(dāng),內(nèi)容也備好了。
你沒有按按鈕,也沒有說一句話,可它已經(jīng)知道該做什么。這大概就是今天人們對 AI Agent 最具體、也最迷人的想象。
![]()
▲《鋼鐵俠》中的賈維斯就是這種幻想的終極表達
它不再只是網(wǎng)頁上的一個對話框,不再只是你輸入一句、它回一句的機器人。
它開始離開屏幕,走進物理世界,替你處理那些原本需要手、眼、耳同時介入的小事。
聰明的 Agent 撞上了「墻」
過去一個多月,這種科幻般的想象突然變得觸手可及。即便平時不太關(guān)注 AI 的人,大概也刷到過那個頻頻出圈的「龍蝦 OpenClaw」。
與過去那些只會聊天的 AI 不同, OpenClaw 這類工具看起來更符合大眾腦海中「真正的 Agent」的形象,它能接管鍵盤和鼠標(biāo),在終端后臺運行,直接調(diào)用系統(tǒng) API 干活。
有人讓它寫代碼,有人讓它定時整理郵件、規(guī)劃待辦事項,還有人干脆把查航班、選座、值機這一整套雜活全扔給它。它就像一個永不下班的超級實習(xí)生,動作快、能力強,理論上什么活兒都能接。
![]()
但熱潮來得快,退得也快。 算力配置昂貴、調(diào)用成本高,加上脆弱的安全默認(rèn)設(shè)置,想要將其轉(zhuǎn)化為穩(wěn)定的生產(chǎn)力,中間還隔著重重門檻。
因此,輿論在很短時間里完成了一次反轉(zhuǎn),先是「第一批靠龍蝦賺錢的人出現(xiàn)了」,接著就變成「第一批龍蝦受害者出現(xiàn)了」,再后來,甚至有人開始花錢請人上門卸載。
手機端的 Agent 們也是類似的情況,能自動比價、下單、甚至發(fā)微信的豆包手機,剛一露頭,就被各大平臺聯(lián)手設(shè)限。
![]()
屏幕里的 Agent 明明已經(jīng)很聰明,卻總在最后一步碰壁。這堵「墻」,有時是系統(tǒng)權(quán)限,有時是封閉生態(tài),有時則是巨頭們的商業(yè)利益。
這一困境恰好反襯出另一個硬件終端的巨大潛力——汽車,反而成了 Agent 最有可能率先落地的場景。
這件事頗具歷史的諷刺意味。
新能源汽車剛興起時,業(yè)界幾乎一致認(rèn)為,智能汽車會是繼智能手機之后的下一個超級硬件入口。
那幾年,車企的宣傳口吻與手機廠商如出一轍:自研 OS、封閉生態(tài)、應(yīng)用商店、開發(fā)者平臺、爭奪用戶停留時長。
大家都把車做成「帶輪子的大手機」。奔馳、寶馬、大眾都在講自己的車載系統(tǒng),吉利和沃爾沃成立億咖通,比亞迪也早早就開放了自己的車載 SDK。
那時的大家都有一種很熟悉的樂觀,好像只要把手機那套再復(fù)制一遍,中控屏就會成為新的黃金地段,廣告、分成、增值服務(wù)都會順著這些流進來。
![]()
▲ 各種各樣的車載應(yīng)用
但車終究不是手機。
車企們后來發(fā)現(xiàn),除了導(dǎo)航和在線音樂,大多數(shù)車載 App 的活躍數(shù)據(jù)都慘不忍睹。沒人真想在車?yán)锎蛴螒颍谲嚈C上購物總覺得別扭,短視頻一上線就被安全監(jiān)管盯上,連看起來極具想象空間的「車載 KTV」,實際使用率也遠(yuǎn)不如宣傳的那般熱鬧。
畢竟,人開車上路是為了出行,而不是為了操作一塊屏幕。
手機是一個能獨占注意力的設(shè)備。你低頭看屏幕、滑動手指,整個人都可以沉浸其中。但汽車不行,尤其是在駕駛過程中,駕駛員的眼睛必須注視路面,雙手必須控制方向盤。
在時速 120 公里的高速上,視線只要離開路面 2 秒,車輛就已經(jīng)向前飛馳了 67 米。在這 67 米的盲區(qū)里,足以發(fā)生任何意外。
車主們也很快意識到了這一點,為了打開座椅通風(fēng),居然要在屏幕里翻找二級菜單。這種看似「先進」的設(shè)計,真到了路上只會讓人暴躁。
正因如此,智能座艙的發(fā)展軌跡并沒有沿著「繁榮 App 生態(tài)」這條路繼續(xù)走下去,而是幾乎直接跳躍到了另一場革命:由大模型驅(qū)動的交互變革。那些曾被寄予厚望的車載 App,還沒來得及開花結(jié)果就被邊緣化了。
![]()
▲ 車企們逐漸恢復(fù)了物理按鍵
手機做不到的,汽車天生就會
舞臺的新主角換成了 Agent。它不再強調(diào)「我能給你提供多少個入口」,而是主打「我能替你把事辦完」。
2019 年,小鵬 P7 曾把「全場景語音控制」作為一個極其亮眼的賣點。當(dāng)時的評測經(jīng)常演示這樣一個場景:車主說一句「我有點冷」,空調(diào)溫度就會自動調(diào)高 2 度。這在當(dāng)時無疑是巨大的進步,比手動戳屏幕方便得多,也更有未來感。
但在工程邏輯上,它背后依然依賴著一張預(yù)設(shè)好的「語句—指令」映射表。系統(tǒng)聽到「我有點冷」,就在代碼表里匹配到對應(yīng)選項,執(zhí)行「空調(diào)升溫 2 度」。這更像是一本厚厚的詞典,翻頁速度很快,但毫無思考能力。你說對了觸發(fā)詞,它就響應(yīng);你稍微換個說法,它就開始「我還不會哦」。
![]()
▲ 你好小 P
不過很快,我們將迎來具備主動感知能力的 Agent,它將開始能夠理解意圖,具備主動感知能力,并能跨系統(tǒng)編排復(fù)雜的動作。
它不會傻等著你發(fā)號施令,而是像一個資深的管家,平時就在一旁默默觀察、聆聽和記錄。比如你說「今天心情不太好」,舊系統(tǒng)往往會禮貌地失靈,或者只是給你一點心靈雞湯。
因為這句話不對應(yīng)哪一個明確按鍵。可 Agent 可能會聯(lián)想到情緒、環(huán)境、偏好之間的關(guān)系,自己把音量調(diào)低,把氛圍燈收暗一點,切一首沒那么躁的歌。它不一定每次都猜得完全準(zhǔn),但它已經(jīng)不再只是在執(zhí)行口令了。
騰訊之前展示過一種場景感知型 Agent,可以結(jié)合時間、地點、用戶習(xí)慣主動給建議,也能接入點餐、停車?yán)U費這類服務(wù)。
![]()
還有一些座艙 Agent 的預(yù)研方向,已經(jīng)能識別后排乘客是否睡著,然后自動降低后排音量,微調(diào)溫度,甚至改變出風(fēng)方式。
想象一下,一家人周末出門,車開在高架上,后排的小孩睡著了,傳統(tǒng)語音系統(tǒng)需要你說一句「把后排空調(diào)調(diào)小一點」。
真正的 Agent 卻可能自己判斷出,這時候要做的不是一個動作,而是一串連貫動作:把后排音響關(guān)小,調(diào)一下空調(diào)風(fēng)向,稍微降低車窗透光率,讓后排光線別那么亮;底盤切到更柔和的模式,把細(xì)碎顛簸過濾掉;如果智駕開著,再順手把跟車策略調(diào)保守一點,讓加減速更平滑。前排的大人甚至沒有意識到自己下達過什么命令,車廂已經(jīng)默默把環(huán)境改好了。
這就不再是一個功能在工作,而是整輛車作為一個整體,完成了一次從感知到響應(yīng)的閉環(huán)。
![]()
這種真正讓汽車和其他終端拉開差距的,是跨域協(xié)同的能力。
過去汽車的電子電氣架構(gòu),像一座分租出去的大宅子。座艙域管娛樂、空調(diào)、座椅;底盤域管懸掛、制動、轉(zhuǎn)向;智駕域管 ADAS 和自動駕駛。每一層都有自己的邊界,彼此之間不像一間房那樣自然貫通。
舊式語音系統(tǒng),通常只能在某一個域里做單點操作,說白了就是隔著門傳話。而 Agent 不一樣。它收到的往往是模糊意圖,卻能跨過幾扇門,把幾個系統(tǒng)一起調(diào)度起來。
也正因如此,汽車可能是今天所有終端里,最適合 Agent 落地的那個容器。原因就在于它足夠統(tǒng)一,足夠封閉,也足夠可控。
![]()
一個典型的反面例子是智能家居。
搞過裝修的朋友都知道,家里的電器,空調(diào)是一個牌子,燈是一個牌子,窗簾電機又是另一個牌子,音箱和門鎖也各玩各的協(xié)議。
看上去你買的是一套「智能生活」,實際到手常常是一堆彼此不怎么來往的設(shè)備。
Matter 協(xié)議 2022 年就出來了,試圖給這個行業(yè)造一門通用語言,但各家廠商在底層依然固守著私有接口和數(shù)據(jù)壁壘。
所以現(xiàn)在智能家居最順的體驗,往往還是「全家桶」。
![]()
手機端面臨的困境也大同小異。你想讓手機助手點杯咖啡,再去微信提醒朋友,最后切到高德導(dǎo)航,聽起來就 3 步,背后卻牽涉到幾家超級 App 之間漫長而脆弱的利益博弈。任何一方覺得吃虧,鏈路就會中斷。
相比之下,汽車的情況簡單得多。至少在車內(nèi)這個封閉世界里,規(guī)則主要由車企自己說了算。底盤、空調(diào)、音響、座椅和燈光,天生就生長在同一張網(wǎng)絡(luò)里。
當(dāng)然,汽車座艙也并非烏托邦。它的使用場景更加集中,核心永遠(yuǎn)圍繞出行、駕駛和在途體驗,這使得 Agent 在車內(nèi)比在手機上更容易構(gòu)建出穩(wěn)定的上下文邏輯。
但相應(yīng)的,它的試錯成本也高昂得多。智能家居誤判最多半夜亮燈;車上的 Agent 一旦觸及安全控制權(quán)發(fā)生誤判,后果不堪設(shè)想。
![]()
從「坐在車?yán)锏哪恪梗健竿暾哪恪?/p>
近年來,中國新能源汽車市場的競爭日趨白熱化,硬件層面的差距越縮越小。如今真正能拉開代差的,反而是智能化體驗。
加上中國用戶對新技術(shù)的接受度極高,這幾股力量匯聚,形成了一個罕見的加速器。這也是為什么近兩年來,最激進、最具規(guī)模的 Agent 上車實踐大多發(fā)生在中國。
然而,當(dāng)車內(nèi) Agent 進化到一定階段后,很快又會面臨新的瓶頸,它僅僅認(rèn)識「坐在車?yán)锏哪恪故沁h(yuǎn)遠(yuǎn)不夠的。
它知道你喜歡聽什么歌、習(xí)慣多少度的空調(diào),這很有用,但還太淺。它還得知道你昨晚幾點入睡,明天幾點開會,最近常去哪里,何時最不想被打擾。
它需要把你當(dāng)作一個生活在連續(xù)時間軸上的「完整的人」來理解。
這正是華為、小米這類擁有全場景生態(tài)體系的玩家最大的優(yōu)勢所在。他們的野心不止于「車?yán)锏?Agent」,而是要構(gòu)建一個跨越不同終端的「個人 Agent」。
上周,小米推出了移動端 AI Agent 測試產(chǎn)品 Xiaomi miclaw,基于自研 MiMo 大模型構(gòu)建,核心目標(biāo)是驗證大模型在「人車家全生態(tài)」中的任務(wù)執(zhí)行能力。
![]()
Miclaw 以系統(tǒng)應(yīng)用身份運行,可深度調(diào)用超過50項手機底層能力,涵蓋短信、日歷、相機乃至米家智能家居設(shè)備實現(xiàn)從「對話」到「執(zhí)行」的跨越。
更值得關(guān)注的是它采用「自進化」設(shè)計,支持文件級記憶、子智能體創(chuàng)建和 MCP 服務(wù)接入,能自主設(shè)計記憶系統(tǒng)、創(chuàng)建專業(yè)分工的子智能體,用得越多,就越懂用戶的偏好與習(xí)慣。
雖然 Miclaw 還沒有完成人車家全生態(tài)的接入,但趨勢已經(jīng)相當(dāng)明顯,你在不同設(shè)備上留下的行為數(shù)據(jù),將被拼接成一條完整的生活軌跡。
![]()
▲小米 Claw 的部分功能
這時,文章開頭描繪的那個清晨場景就不再是科幻電影,而是越來越多人的日常。
Agent 掌握了你的日程、習(xí)慣和生理狀態(tài),于是悄無聲息地提前了喚醒時間,重新規(guī)劃了路線,并為你布置好了舒適的座艙環(huán)境。
技術(shù)發(fā)展的最終形態(tài),經(jīng)常會出現(xiàn)一種有趣的「反轉(zhuǎn)」,最成熟的技術(shù),往往既不科幻,也不性感。
蒸汽機剛發(fā)明時,所有人都盯著那股噴涌的巨大白汽;而當(dāng)電力真正普及后,人們反而很少低頭去留意墻里的線路。
![]()
Agent 亦是如此。它真正動人的力量,不在于把人訓(xùn)練成更加熟練的機器操作員,不在于逼迫你熟記更多的喚醒詞和口令;而在于它能不動聲色地將你從繁瑣的操作中徹底解放出來。
未來的汽車依然是那輛汽車,方向盤、座椅、車窗和輪胎都還在。但它已經(jīng)開始理解你的生活節(jié)奏,記住你的個人偏好,默默替你打理好那些原本需要你親自動手、動腦去安排的每一件小事。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.