![]()
文:王智遠 | ID:Z201440
有朋友跟我聊:
千問又上新功能了,這次是打車。感覺它隔三差五就接一個生活服務skill,點外賣、訂酒店機票和景點門票、買電影票,現在又加上了打車。
確實都是真能用上的東西,隨口說一句,事兒就給你辦好了。但你有沒有發現一個現象?
行業里對這些動作的反應,大多還停留在「功能上新」的層面。每次千問發一個新能力,大家討論的都是「這個功能好不好用、體驗怎么樣」。
可很少有人往后退一步想想:這么密集地接入這些服務,到底是在構建什么呢?
千問已經給出了答案,總結起來就兩個字:辦事。不過這次接入打車,可能讓「辦事」這件事,又往前邁了一大步,因為它跟之前那些服務,性質完全不一樣。
我先跟你說一個詞:托付(Entrustment)。
你琢磨琢磨,點外賣要是選錯了,大不了換一家,損失也不大。買電影票選錯場次,頂多退票重買,費不了啥功夫;這些場景的容錯空間都很大,就算 AI 判斷有一點點偏差,后果也完全扛得住。
可打車不一樣。
車型不對,可能得在路邊多等十五分鐘;時間卡不準,搞不好就誤了一場重要的會議。這些是實實在在的損失,一旦發生了,沒法倒帶重來。
以前我們跟 AI 的關系,說白了是「我問你答」;我問一個問題,你給我一個參考,采不采納、怎么選,全看我自己。AI 相當于一個顧問,不用承擔任何后果。
打車這個場景,關系就變了。
當我說「幫我打車去公司」時,把這件事托付給了它,托付和提問能一樣嗎?提問時,決策權在你自己手里;可托付時,是把決策權完完全全交出去了。
千問敢接下這份托付,意味著它必須做到另一件事:為結果負責(Accountability)。這四個字說起來輕飄飄的,放到打車場景里,分量就完全不一樣了。
你跟千問說:幫我打車去湘湖風景區,開穩點,30 塊以內,車里沒味。
注意,就這么一句話,AI 得同時處理四個條件:
目的地、車輛類型、價格上限、車內環境。四個條件全滿足了,你才會覺得好用;可只要漏了一個,比如來了輛燃油車,或者車里有味道,體驗直接就歸零了。
沒有人會因為你是 AI,就降低對你的期待;接了這個活,就得按真人助理的標準來交付。做到了,應該的;做不到,那就是失敗。
也正因為這樣,千問邁出這一步,是需要很大勇氣的。
而且你再想想,打車這件事還有個特別的地方:它天生自帶驗證標準。比如:跟千問說:我要去奧體中心看演唱會,6 個人,今晚 8 點出發。
這句話里有一半是沒說出口的。
6 個人,普通車坐不下,AI 得自己想到要安排大車;去看演唱會,意味著那個時段那片區域大概率會堵車,出發時間可能得提前。
你甚至沒提回程的事,但一個靠譜助理,會順嘴問你一句,不管 AI 怎么處理,最后好不好,你一打完車就知道了。
千問把自己放進這種場景里,相當于主動坐到了考場上,每一個用戶都是考官。
跑分可以挑賽道,排行榜也能靠策略優化,一個人打完車之后心里那句「靠不靠譜」的判斷,是沒法優化的。這種量化的體驗是最誠實的背書。
講真的,千問不是唯一在琢磨這件事的公司。
2025 年 11 月,OpenAI 把 Uber 接入了 ChatGPT。用戶可以在對話里看到車型、價格區間、預計到達時間,但到了最后一步,還是得跳轉到 Uber APP 里,自己完成叫車和支付。
說白了,AI 做的事更像幫你查好了所有信息,然后,跟你說:自己去下單吧。
到2026 年 2 月底,谷歌的 Gemini 也發布了類似的功能,不過目前還在測試階段,只支持 Pixel 10 和三星 Galaxy S26 這兩款手機。
它比 ChatGPT 稍微進了一步,但你仔細想想,這兩家做的事,本質上都差不多:AI 只是幫人操作另一個 APP 而已。
千問和高德的做法不太一樣。
兩者同屬阿里生態,AI 和打車服務之間不需要「跳轉」,中間環節直接融合了。有人覺得,這不就是產品設計上的小差異嘛;但背后的邏輯完全不一樣。
跳轉,說明 AI 只負責整理信息,最終決策還是得用戶自己來;閉環,才是真正無縫銜接的絲滑感;目前全球在做這件事的幾家公司里,千問是第一個走到「閉環」這一步的。
其實從更底層的角度看,「一句話打車」背后還藏著一個交互方式的大轉變:從 GUI(圖形用戶界面)到 LUI(語言用戶界面)。
這個轉變看起來只是少點了幾個按鈕,但門檻極高。
GUI 的邏輯是什么呢?
你告訴系統要什么,但得按照它的規則來表達;點哪個按鈕、選哪個選項、在哪個頁面確認,每一步都有固定流程。說到底,我們在學它的語言。
LUI 反過來了。我們用自己的方式說話,系統來理解你;自然語言本身就充滿了模糊性、方言化、省略和潛臺詞等等。AI 不光要聽懂字面意思,還要理解背后的意圖。
好比同樣一句「要快一點」, 趕飛機的「快」和不想多等的「快」,緊迫程度完全不同。
所以,千問做這件事的難度,是要讓 AI 真正聽懂人話,然后把人話變成一個靠譜的決策。這中間的技術跨度,比我們想象的要大得多。
說到這,我想起自己碰到的一件事。
上次去武漢出差,晚上九點,我在路邊等朋友。一個老太太走過來,手機舉到我眼前,說:小伙子,你能不能幫我看看,這個定位對不對?
她帶著老花鏡的手在抖。
是老年人拿手機時那種小心翼翼的、控制不住的小幅度顫抖;屏幕上,打車軟件的界面被她調成了最大字號,可即便這樣,她還在「確認上車點」那個按鈕上猶豫了很久。
我幫她操作時,她一直在旁邊說:這里,沒錯吧?不要定位到對面了。
這種事挺常見。你要去醫院門口蹲一兩天就會發現,沒有家人陪同、從外地來看病的人,他們自己叫車時,光搞定定位就夠折騰半天了。
要有一天,這些人能直接跟手機說一句「幫我打車去火車站」,然后車就來了 ,還很準確,那意義就完全不一樣了,這是技術在變得對更多人有用。
所以你看,一句話打車最終的價值,是讓之前不會用、用不了這些工具的人,也能輕松用上。
我一直在想一個詞來形容這件事:結果在場(Outcome Presence)。
以前 AI 只活在對話框里,你跟它聊完,關掉窗口,生活照舊;打車把邊界打破了;車真的來了,人真的坐上去了,真的到了要去的地方。對那個老太太來說,這個結果就是她能順利回家。
也正因為這件事這么重要,做起來才格外難。說實話,功能剛上線,一定會有這樣那樣的問題,比如:場景處理、需求理解,這些都需要時間去打磨。
換個角度想,哪個產品剛上線的時候是完美的呢?
我記得微信第一版連語音功能都沒有,淘寶剛上線時頁面粗糙得不像樣。重要的是方向找對了,然后在真實的使用中一點一點去完善。
工作這些年,講真的,我不止一次在路邊幫人叫過車。年輕同事還好,可碰到老人時,那個畫面總會留很久。每次幫完忙走開之后,腦海中都會冒出同一個念頭:哎,要是有一天,他們不用這么費勁就好了。
這種事每天都在發生。在醫院門口,在火車站廣場,在每一個路邊……
AI 行業走到今天,敢把自己放到真實場景里接受檢驗的,確實不多;技術走到最后,衡量它的標準可能很簡單:那些最需要幫助的人,用上了沒有。
聰明的 AI 很多,愿意走到路邊去的,太少了。
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.