文/周雄飛
情緒價值,目前已成為車圈追逐的熱詞。
這不僅因為通過在場景或者產品中提供情緒價值,可以激發消費者下定購車的欲望,而且還能讓自身的智能汽車產品具備“活人感”,從而體現產品和技術等領域的優勢,可謂是一箭雙雕。
相比于智能駕駛,在很多人看來智能座艙更適于讓情緒價值這個概念具象化。就像地平線CEO余凱說的那樣:“智能輔助駕駛提供功能價值,智能座艙提供情緒價值。”
那么,這樣的智能座艙會是什么樣的?對于這個問題,騰訊智慧出行副總裁、騰訊智慧出行負責人鐘學丹認為需要提供一些基礎功能之外也希望在使用的過程中,讓用戶更愉悅,有更好的人性化的體驗。
為此,他們推出了一個名為“隨行chat”的產品,簡言之是一個形式類似于陪伴聊天的智能體,具備簡單的情緒感知和長期記憶的能力,支持車企定義陪伴聊天的角色需求,消費者也可以選擇自己喜歡的角色。
飛說智行在前段時間舉辦的騰訊全球數字生態大會上,體驗了隨行chat,其中有很多個角色供選擇,可以選偏嚴肅的角色為我解讀新聞,也可以與偏娛樂的角色一起吃瓜,甚至還可以讓這個智能體來陪伴小朋友等等,滿足不同場景需求。
包括隨行chat全能陪伴智能體,騰訊發布的新一代智能座艙解決方案TAI 6.0還包括本地生活智能體、出行探索智能體、出行連接智能體和AI地圖導航智能體。
基于端云協同能力,消費者在車上就可以體驗買咖啡、點餐、訂旅游門票,手車互聯制定旅游線路以及全方位智能陪伴等功能,從而做到鐘學丹口中的“就像擁有了‘有趣貼心的助理’和‘聰明的領航員’一樣。”
就像很多科技大廠“不造車,幫助車企造好車”一樣,騰訊他們在幫車企打造好產品的同時,也想要幫助車企們用好AI的能力來降本提效。
通過建立汽車行業大模型,騰訊他們已經在研發、制造和銷服等造車全流程,給予車企們助力。以營銷服務環節為例,飛說智行就在騰訊全球數字生態大會智慧出行展臺上,看到了AI工具鏈幫助一線銷售服務購車用戶的實際場景,涵蓋前期溝通、解答用戶問題、跟蹤購車服務流程等全場景。
在這次大會上,騰訊也展示了他們在具身智能領域的探索進展。
今年6月,騰訊的Robotics X實驗室和福田實驗室聯合發布了具身智能工具鏈——Tairos平臺,它以模塊化的方式提供大模型、開發工具和數據服務的具身智能軟件平臺,通過即插即用的方式,面向具身智能行業開放。
換句話說,騰訊也要幫助具身智能行業“造好機器人”。按照騰訊介紹,截至目前,Tairos已經與越疆科技、樂聚機器人、帕西尼感知科技、擎朗智能、眾擎機器人科技、宇樹科技等多家具身智能企業探索合作。
![]()
在飛說智行看來,騰訊布局具身智能領域,也是順水推舟的事情,因為他們在智能輔助駕駛和自動駕駛領域有著多年的積累和迭代。
“騰訊現在基于過去十多年在自動駕駛對應的算力也好、數據閉環能力,包括仿真積累的一些技術和經驗,在和科技公司、OEM一起在做對應的具身智能領域的探索和轉型。”騰訊智慧出行副總裁李博這樣對飛說智行表示。
在今年騰訊全球數字生態大會舉辦前夕,包括飛說智行在內的小規模媒體受邀與騰訊智慧出行副總裁、騰訊智慧出行負責人鐘學丹,騰訊智慧出行副總裁李博進行了深度的對話交流,以下是對話內容,略有刪減和修改:
1、座艙、智駕和運營管理,車企該如何用好AI?
Q:騰訊的座艙Agent是基于端云協同能力,那么對于用戶的一個需求,如何判定是需要車端處理的簡單問題,還是需要協同云端處理的復雜問題,這背后有明確的規則或者標準嗎?
鐘學丹:現在用端側來講不可能是去滿足所有的場景服務,需要云端輔助一些能力,今天在參數量2B的模型下,對大部分的服務都是可以很好地理解和完成的,同時我們在端側也會有一個模塊,去負責處理一些復雜意圖和復雜的場景,需要云端模型作為支持。
比如說我們需要一些實時云端、聯網搜索的時候,就會調動到兩端的能力來去完成,不是說用一個簡單規則來區分,在端側做哪一些,而是在端側云端相互協同起來。
Q:相比于之前的TAI, 升級后的TAI 6.0更加具備多模態感知的能力,這意味著會收集更多車內乘客的一些信息,再加上咱們有端云協同的機制,在數據安全TAI6.0做到了哪些升級或者說一些創新?
鐘學丹:首先我們高度重視用戶的隱私和數據安全,也有很多數據手段來保證用戶的隱私以及數據安全,我覺得這是我們對用戶的基本保障和基礎體驗的底線。
多模態感知,更多的是對外部世界的一些感知數據,包括對場景的感知,對位置的感知以及車身的一些信號的感知,對于這些信息,并不會被收集,也不會被提取,它本質上是一個提示詞的輸入而已,幫助座艙Agent解決用戶的問題。
![]()
Q:現在汽車行業都聚焦“情緒價值”這個詞,對于車企布局的這個方向,騰訊是如何幫助車企,來打造他們各家有特點的情緒價值的功能?
鐘學丹:今天大家對消費者在體驗上的關注度越來越高,除了提供一些基礎功能之外也希望在使用的過程中,讓用戶更愉悅,有更好的人性化的體驗。可能每家都會有不同的表達和理解,所以我們認為主要是要讓用戶感到好用,以及針對這里的一些產品體驗,如何體現我們自身的一些價值。
比如說我們推出的隨行chat的產品,它就是基于角色扮演模型的一個支持打電話、車上陪聊擬人化的一個產品,能夠支持用戶對不同技能,解決用戶在車上不同話題的聊天,同時能夠體察一些情緒,長期記憶的保持,去個性化做到一種“活人感”的陪伴體驗。
車企也可以自己定義它自己需要的陪聊角色,可以更靈活按照車企的需求定義它的角色需求。在這個方面,這種角色并不是簡單的聊天,就像我們剛才講的一個體貼助理的角色,幫消費者解決實際的駕車過程中間遇到的各種問題。
Q:現在大家布局座艙都講Agent上車,這其中就包括騰訊,那么Agent上車給智能座艙帶來的最核心的價值是什么?以及騰訊AI Agent跟其他家的Agent有怎樣的不同?
鐘學丹:Agent概念隨著大模型運用得越來越深入,應該各個領域都在展開。對于座艙來說,Agent本身也在改變座艙體驗,畢竟在駕駛的過程中,還是會有很多是要專注在駕駛的場景上,傳統的手機App應用形態在座艙內的體驗上還是有很多的不足。
相對來說,Agent新的形態對座艙的體驗會有一個比較大的改變,就像我們說智駕是多了一個聰明的司機,那么Agent的意義就在于說多了一個有趣以及聰明的助理。
當用戶可以與車進行更充分的互動,這種互動的淺層次表現為輕松的對話和良好的應答,也可以與用戶交流,感覺毫無障礙。更深層次可以幫助用戶提供各種知識和幫助用戶解決一些切實的需求,這是最大的不一樣的地方。
在座艙Agent上,一方面會借助一些在端側的能力,使Agent的驅動能及時響應和效率方面更好;另一方面,Agent會變成一些具體的服務應用以及內容的關聯,不管是結合騰訊的生態資源、內容資源等組合,可以很好地打破原有用戶的服務邊界,打造一些跨應用以及滿足復雜需求,這可能是騰訊座艙Agent的一些特色。
Q:端云協同這塊,對于智駕行業都已經談到了一些像VLA、世界模型等等,這些技術路線對于云端大模型會有一個什么新的要求嗎?
李博:騰訊的端云協同,一方面是端側,可能是一個2B的,可能是2.5B,可能是一個7B的以及以后可能是一個14B的;云端上來講,可能是一個更大的,需要趨近于類似于滿血DeepSeek幾百B的大模型,它們是一個協同的關系。
其中,云端模型其實剛才說了可以幾百B的大模型,接近對應的無限算力和超大模型的算力,可以訓練復雜對應的計算信息,這樣和車端相協同就具備及時響應的端側的模型,又有很復雜場景的需要復雜計算能力的云端的能力。
那端云結合,無論是在座艙還是我們在講的VLA基于智駕場景的復雜場景下,都能夠形成比較好的一個對應的協同的場景。
Q:今年4月騰訊推出座艙端側大模型,幾個月下來車企(客戶)對于這個模型的反饋怎么樣?接下來這個模型會朝著更大的參數規模演化,還是說完善其他方面的能力?
鐘學丹:推出端側大模型后,有很多主機廠對此非常感興趣,之前在端側相對來說能跑的模型還是會比較少一些,所以大家依賴云端模型的能力,對于算力以及端側的響應和數據安全都還有比較大的挑戰,對于車企來講,應該還是一個非常有需求的場景。
![]()
另一方面,我們也在持續地更新我們的端側模型,這次我們更新到1.8B帶推理能力的一個端側模型,也會在更小的參數以及更強的能力上去增強這種能力。
我們看到端側不只是語言模型,未來它也會驅動像VLM多模態的一些視覺模型,幫助我們理解一些感知的數據跟座艙的服務之間,以及車內數據之間的一些關系和能力。
同時,也包括像未來語音測試也可以在端側做端到端的語言能力,這些可能都是我們在端側模型上持續去加強和提升模型方面的一個能力。
除了模型以外也會涉及到數據的能力的增強,如何把一些跟出行場景和服務相關的數據,也去對模型進行優化和訓練,使得模型在一開始就比較適應在汽車和出行場景的這樣一些需求,這是我們在做的一些事情。
Q:現在都講說智能座艙Agent上車,未來它會有一些什么新的趨勢,或者會向什么樣的新的功能特點轉變?
鐘學丹:大家今天看到的還是一些早期的階段,我相信未來還會有很多新的變化,核心的本質最終都是要回歸服務于人的,這些交互和完成,首先是一種跨應用、跨服務的場景,它打破了我們傳統的服務和邊界,更多的去關注用戶希望去解決的一些更具體的問題,我覺得這是一方面。
另一方面,Agent確實需要更多的懂場景,懂用戶,不僅是本地快速的響應基礎需求,還需要在云端調用更豐富的知識,生態和服務,實現跨應用、跨場景的無縫的結合,我們也可以想象一下,在感知用戶情緒后的一些變化之后,我們可以主動在車的氛圍燈以及音樂、LBS和生活能力的一些提前形成的規劃等等,我覺得這些都是大家會想到的一些會相對美好的應用場景。
但這些應用場景真正落地會依賴于很多方面,包括我們車身的能力以及傳感器的能力,以及如何把這些能力通過新的服務和協議的方式無縫連接起來,我覺得這里可能要做的事情還會有很多。
Q:現在世界模型還有VLA的發展看起來大家對地圖的依賴會更小一些,那在騰訊看來,現在智駕普遍需要什么樣的地圖,現在新技術的發展對于地圖產生了什么樣的影響,或者大家對地圖有什么新的要求?
李博:無論是端到端、VLA,從技術手段上來說沒有一定說誰勝誰劣,對于有圖和無圖也是一樣的,很多時候我們會發現很多時候是在炒概念,是無圖會顯得更有優勢,有圖的怎么樣,說到底通過對應的訓練數據也好,算法也好,怎么樣讓對應的自動駕駛的能力達到最優,用戶體驗達到最優這才是關鍵。
地圖其實是作為能力對應的一個補充,數據的一個補充,我們要看的是在這個過程之中怎么讓這里面產生的成本更低,訓練出來更好的對應的模型,用更少的數據采集或者是怎么樣,成本更低的數據采集也好,能形成對應的算法,其實反而不用糾結到底有圖好,無圖好或者是怎么樣的。
比如車的端側算力沒有這么強,是不是需要在云端還有一個圖層的概念,去跟自動駕駛算法相輔相成,能夠解決一些Bad case的一些問題,能夠提升自動駕駛的安全性的一些問題等等,這些都是圖對于自動駕駛領域的一個幫助性的點。
2、開放生態,是做好具身智能的基礎?
Q:相比于自動駕駛,具身智能難度會有更多維度,比如一個挑戰就是缺少更多的一些高質量或者多場景的數據,進行算法訓練,無論說是真機或者是仿真訓練,對于騰訊來說如何解決行業的問題,或者說是像幫助車企造好車一樣,怎么樣幫助機器人企業去造好機器人?
李博:具身智能要比自動駕駛難得多,無論是對于數據的要求還是對于算力的要求,還有對應的算法的能力,都是一個幾何性的提升。
騰訊現在也是基于過去十多年我們在自動駕駛對應的算力也好,數據閉環能力,包括仿真積累的一些技術和經驗,再和科技公司、OEM一起在做對應的探索和轉型。
包括大規模數據管理和更加規模大的并行計算,場景重構,包括我們說缺數據,我還要去做更多的仿真數據,實際上對于具身智能場景來講,很多場景是遠遠不夠的,所以我們要造更多的類真實數據來使對應的算法有對應的數據可訓練。
今年6月份騰訊也發布了對應的Tairos開放平臺,這是我們在下一段面向具身智能公司做的開放平臺,它也有對應自動駕駛團隊對于具身智能的一些要求融入其中,比如說多模態的交互,室內外一體化的導航的能力,還有4D的空間的重建仿真的能力。
這些其實都融合到了Tairos平臺,現在也是對合作伙伴進行開源開放,同時我們也是聯絡了行業內的多家的生態公司去完善具身智能的整個體系,還有一些跟行業的合作伙伴在具體的具身智能的場景在做基礎能力的一些打磨,讓更廣泛的場景進行高效的落地。
Q:目前具身智能行業中有很多玩家也在做開源的工具鏈,那么在這樣的一個行業的競爭態勢下,騰訊有哪些優勢或者是一些獨特的生態位呢?
李博:騰訊首先可以基于自動駕駛領域積累的端云一體化的閉環工具鏈的能力,包括去覆蓋對應的從數據采集,數據合成,數據標注,數據挖掘,模型訓練到仿真的全流程的這些能力,這是能夠作為具身智能開發的一個基礎。
就比如我們的4DGS、時序建模這些技術本身就是我們的一些技術優勢點,同時我們來講也完成了對物理世界完全的重建編輯生成,通過視覺點云激光雷達等區域,去重構網格融合的多層次的數據融合能力。
可以構建包括動態交通、天氣變化、光線條件等多種變量的可編輯的虛擬環境原來對應的能力,這不僅是支持L2到L4自動駕駛端到端的訓練,本質上也是我們For具身智能潛質化積累的能力。
我們對于數據的高質量要求,騰訊其實是原先在做地圖的時候,我們也積累了大量的地圖的數據,本質上也是真實世界對應的映射,我們的數據平臺也把這些數據進行了統一的接入、標注,那它也可以解決我們很多現實世界在具身智能的一些問題。
以及,騰訊跟合作伙伴的合作也是打造了一個比較好的基礎,比如說我們跟文遠知行已經在做從數據采集到模型部署,再到全棧的AI數據閉環的對應能力,我們在這里面也都在做對應的一些解決。
![]()
我們做的多樣化的數據采集的服務也滿足了很多不同場景算法的需求,可以說是為具身智能提供了比較準確和豐富的適配性的數據,其實這樣的話也打通了我們原來所說的具身智能數據上云對應的通路,我覺得這也是其中騰訊做這塊的優勢點。
Q:現在關于具身智能的數據好像海外的人形具身行業更多的是依靠遙操來收集數據,國內是逐漸傾向于仿真,騰訊認為現在哪種數據采集方案更加可行?
李博:我們依然認為具身智能處于一個初級階段,數據是遠遠不夠的,哪怕說靈巧手的操控已經比自動駕駛的復雜度要高很多,你左手有五個手指,你右手有五個手指,我們來算算對應的維度,這個復雜度已經是超高了,他們為什么會去遙感的控制,本質上是在收集數據,他沒有對應的數據。
其實對于國內來講,大家也都在做對應的數據收集,如果我們到達一個更復雜場景,那可能是說單一場景或者工廠制造的場景,便利做得越多,便利的可能性覆蓋度越高。
但實際上畢竟它的維度是遠遠超于自動駕駛場景,更多的來講在這里面采集數據的成本是陡然向上的,我們更期待這里面通過仿真合成一些數據,然后不斷的自我學習,來減少我們采集數據的成本,這才是未來真正造具身智能大的覆蓋場景的時候,能夠現實落地的一個點,否則采集成本太大。
一定是走到仿真數據的,否則的話,大家成本誰也花不起,最后出來機器人的成本也沒有辦法使用到我們日常場景,因為要把價格打下來。
Q:目前做具身智能供應鏈的一些公司,他們會選擇和市場化已經很成熟的伙伴合作,比如說割草機、掃地機等等,大家會覺得這個變現能力更快一些,騰訊也會走商業和前沿并行的方案,還是說更著重于做更加前瞻性或者前沿的人形機器人?
李博:騰訊是不做具體的硬件的,你會發現其實我們一定是和科技公司也好,原來的自動駕駛公司像具身智能轉行的自動駕駛公司也好,還是車廠做具身智能也好,我們其實是跟這些公司合作的,騰訊知道自己擅長的點是什么。
騰訊原來在自動駕駛積累的工具,以及一些數據的能力,仿真的能力,我們是提供這些能力的,包括工具鏈等等,跟這些企業其實是一個合作關系,至于他們應用在什么場景,騰訊都是愿意去支持的,我們并不會做自己的硬件機器人。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.