OpenClaw“小龍蝦”的發(fā)展速度快得離譜,上半個月大家還在討論如何在電腦上“裝小龍蝦”,下半個月“小龍蝦”就已經往車上裝了。
日前,智己汽車發(fā)布了基于阿里千問大模型打造的IM Ultra Agent,將線控底盤、IM AD智駕大模型、智艙大模型連通起來,用戶只需要說出要求就能完成對車輛控制、行程規(guī)劃、生活服務等多項復雜操作。
以前的智能汽車,是往車里塞一個能回應你的語音助手;現(xiàn)在的智能汽車,本身就是一個能跑能感知的智能體。
![]()
(圖源:智己官圖)
概念上是這么說,但問題是“智能體”這三個字,到底是汽車智能化發(fā)展的其中一個虛構概念,還是又畫了個餅?
“一問一答”過時了!主動思考才是下一代智能
OpenClaw、Agent這些概念突然爆火,但在過去的兩三年時間里,汽車的智能化發(fā)展更多處于緩慢推進的狀態(tài)。雖然偶爾蹦出個新奇有趣的概念,能給用戶帶來新鮮感,比如加入更多的屏幕、用戶能讓汽車執(zhí)行一連串的指令等等,但這些新功能本質上還是人車一問一答的交互。
這種語音控制交互的邏輯非常簡單,就是用戶觸發(fā)了操作詞庫里的關鍵詞,汽車就按照詞庫預設代碼進行操作,指令庫越豐富,車看起來就越智能。
![]()
(圖源:蔚來官網)
但這種所謂的智能,只不過是把汽車當作“扯線木偶”,扯一下動一下,用戶講一段話,汽車跟著操作一番,完全不具備自主思考能力。
用戶的需求只會越來越豐富,一問一答的交互已經不能代表真正的汽車智能體,更應該讓底盤、座艙、智駕、動力系統(tǒng)等關鍵域發(fā)揮協(xié)同效應。
Agent的作用就是如此,通過深度思考,將一問一答式交互轉變?yōu)椤爸鲃邮嚼斫庖鈭D行為”,升級為掌控整車的主動思考智能體。
可能有朋友會問,我們需要能夠主動思考的汽車智能體嗎?我們可以代入一個場景,就能明顯看出有無Agent的差別:
就拿最常見的家庭出行場景來說,當車內正播放著音樂和導航聲音,后排的家人和小孩已經熟睡了,智己的IM Ultra Agent能通過車內攝像頭觀察到后排乘客入睡,會主動提醒駕駛員,詢問是否將整車切換至舒適模式。
得到確認后,Agent會自動把音樂、導航聲音轉移到主駕頭枕音響單獨播放;同時將動力與懸架調至舒適模式,空調也按不同分區(qū)獨立調節(jié)溫度。
整套流程下來,駕駛員只需在方向盤上按一下OK確認,后排熟睡的乘客幾乎不會有任何察覺。
相反,如果是按照被動式響應指令來操作,駕駛者就需要用語音指令發(fā)出“幫我把駕駛模式調至舒適”“把后排空調調至25度”“把音量降至3檔”等操作。相信用戶在說完這一堆語音指令后,不管系統(tǒng)能否支持執(zhí)行一連串的指令,車內熟睡的家人也差不多被吵醒,這并不能很好地體現(xiàn)智能化的實力。
![]()
(圖源:蔚來官網)
現(xiàn)在的汽車智能體已經基本解決出行的智能化需求,但汽車智能體的想象絕不僅限于車內,一旦它做到跨場景協(xié)同,“人車家”多維度打通也就順理成章了。
比如在一個傾盆大雨的下班時間,用戶可能只需向手機發(fā)出“來樓下接我下班回家”的指令,Agent就能根據(jù)汽車周圍的實時環(huán)境、交通擁堵情況、天氣預報等信息進行主動思考。
汽車接著的操作應該是:打開汽車的智駕系統(tǒng),將車從停車場駛到用戶的辦公樓下等待;過程中根據(jù)車外溫度,自動將車內空調溫度調至合適區(qū)間;通過車外的FaceID系統(tǒng)識別用戶人臉,確認人臉I(yè)D后自動開啟車門;用戶上車后根據(jù)導航信息,自動選擇不擁堵的回家路線。
與此同時,Agent向家里的空調、熱水器、燈光等智能家居設備發(fā)指令,提前把家準備好。等用戶到家下車后,它再按預設車位信息,調用智駕系統(tǒng)自動泊車。整套操作下來,用戶幾乎可以做到0接管。
這些操作看似天馬行空,但并非電車通胡亂猜測,而是基于現(xiàn)有的汽車硬件水平作出的設想。它們距離真正落地,其實只差L3級有條件自動駕駛,以及一個能主動思考的Agent。
待Agent不斷被訓練優(yōu)化,再加上更多硬件上車,汽車的智能化程度,恐怕會比我們現(xiàn)在想的還要遠得多。
智己、小米、華為入局,智能體之戰(zhàn)即將開始
智己在發(fā)布IM Ultra Agent時打出了“首個汽車智能體”的旗號,但其實吉利、華為乾崑、小米等品牌也在不斷琢磨智能體,只是各自的進度和路徑不太一樣。
在電車通看來,真正強大的汽車智能體,不能只盯著車本身,也不能止步于“人車家”的簡單協(xié)同,更關鍵的還是對整個生態(tài)系統(tǒng)的全面布局。
如果我們把視野放寬至整個生態(tài)系統(tǒng),汽車在系統(tǒng)中扮演的是“手腳”的角色,Agent是那個發(fā)號施令的“大腦”。
想明白這層關系,就知道誰先喊出“首個智能體”其實沒那么重要,關鍵是誰能率先把生態(tài)版圖鋪開。
從這個角度看,智己IM Ultra Agent確實有它的背景優(yōu)勢。
它背靠阿里千問大模型,可以應用的場景非常廣泛,比如接入支付寶,能讓車輛進出停車場、通過高速時實現(xiàn)自動支付;接入淘寶、菜鳥系統(tǒng),能讓快遞、外賣送進車里;接入盒馬系統(tǒng),能讓汽車自主完成買菜購物,基本解決了瑣碎的生活消費問題。
![]()
(圖源:智己官圖)
而在工作出行上,IM Ultra Agent也可以完成出行訂票、釘釘協(xié)同辦公、倉儲物流管理、云計算等任務處理,加上對車輛智駕、座艙等多維度控制,IM Ultra Agent已經把助理、司機、管家這些角色揉在一起,有點未來汽車智能體的樣子了。
但是,這些體驗到底行不行,關鍵還得看首搭IM Ultra Agent的智己LS8。
縱觀國內車市,除了智己IM Ultra Agent,還有不少品牌推出了自家的Agent,比如小米MiclawAgent、華為小藝智能體。
小米擁有非常出色的生態(tài)系統(tǒng),在汽車產業(yè)上也有非常強大的布局,小米汽車在入局之初就確定了“人車家”的理念,但要把這三者真正串起來,中間缺一個能鏈接它們的智能體。
為此,小米在3月推出了MiclawAgent,雖然目前其發(fā)展仍停留在軟件層面,但按小米的節(jié)奏,打通硬件壁壘、把它帶上車,應該只是時間問題。
![]()
(圖源:小米技術微博截圖)
華為這邊,小藝智能體已經開始向鴻蒙智行用戶推送,雖然它還不具備控制整車的權限,但隨著用戶不斷“投喂”數(shù)據(jù),小藝智能體會擁有更強的自主意識,未來通過OTA升級,能幫用戶做的事情也會越來越多,很有可能成為華為乾崑發(fā)展汽車智能體的重要棋子。
某些車企還在設法通過屏幕數(shù)量多、屏幕尺寸大來證明自己的智能化優(yōu)勢,說實話,這套玩法已經過時了。接下來的較量,是誰家的Agent更會思考,誰家的生態(tài)圈覆蓋更廣,能幫用戶把事情辦好、辦多、辦利索,才是贏得市場認可的關鍵。
Agent上車的兩大顧慮,一次性說透
之前在PC端玩過“小龍蝦”的用戶,聽說要把Agent搬上車,可能會想安全怎么保障?調用這么多功能得給多少底層權限?還有那么多Token燒下來,用車成本會不會暴漲?
有這層顧慮很正常,但其實不太一樣,Agent在汽車場景和PC端通用場景中,有著本質上的運算邏輯差別。
先說說安全和隱私。“小龍蝦”在PC端,主要依靠云端大模型的運算能力來實現(xiàn)指令操作,我們的文件、操作記錄會暴露在數(shù)據(jù)傳輸鏈路中,由此引發(fā)安全和隱私的擔憂。
汽車的智能體是以“車端為主,云端為輔”的邏輯運行,智能座艙、高階智駕、線控底盤這些核心數(shù)據(jù),全在車端芯片上處理,根本不用上傳云端,在物理上實現(xiàn)了“數(shù)據(jù)不出車”。
![]()
(圖源:智己官圖)
再說一下Token消耗的問題。既然汽車智能體能靠車端完成數(shù)據(jù)的處理,沒有大規(guī)模的云端計算需求,那就不存在海量Token消耗的情況,使用成本自然也就上不去。
舉個例子,總不能用戶說“去充電樁充電”,Agent還調用云端大模型琢磨一下用戶要充“水電”“火電”還是“核電”吧?就算真有需要調云端的時候,那點Token費用也微乎其微。
聊完安全和成本,再回頭看文章開頭那個問題:汽車智能體到底是不是虛構概念?
電車通認為不是。它更像是給汽車智能化指了個方向,讓消費者看到智能汽車未來長什么樣。Agent上車,本質上是降低用戶的操作門檻,是幫人更好用車的助手。
不過有一點得說清楚:汽車智能體必須配上完整的生態(tài)體系,才能發(fā)揮最大效用。如果只圍著車本身轉,那充其量就是養(yǎng)在魚缸里的“小龍蝦”,看著新鮮,游不出去。
(封面圖源:智己官圖)
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.