![]()
文 | 闌夕
在全民「養(yǎng)豬」龍蝦的熱潮尾聲,千問宣布實裝了「AI打車」的skill,對比起來,有種未來主義向現(xiàn)實主義回歸的基本常識。
從排隊安裝到付費卸載,短短十來天的時間,OpenClaw在中文互聯(lián)網(wǎng)就走過了從入門到入土的全生命周期,著實抽象。
除了鋪天蓋地的FOMO之外,缺少使用場景其實是被廣泛忽略的最大問題,在費盡心力的完成配置完之后,對著命令框,大多數(shù)人可能依然處于腦子一片空白的狀態(tài),不知道讓它做什么好。
最后只好安排龍蝦給自己做個新聞簡報之類,姑且不論這個活兒其實主流AI助手都能辦到,燒掉幾十萬Tokens就為了證明自己用上了龍蝦,代價未免也太高了。
這就是我反復說過的,如果你不是已經(jīng)把AI助手的能力榨取到了極限,極限到它已經(jīng)無法滿足你的需求——要知道,連頂級數(shù)學家陶哲軒也都還在使用網(wǎng)頁版的ChatGPT——否則其實就用不上那些工程化的新品。
何況AI助手本身也在工程化,打個不恰當?shù)谋确剑谌鐾扰懿街埃葘W會好好走路,可能才是AI連接普通用戶的最好路徑。
怎么說呢,看多了拔苗助長的行業(yè)躁動,千問繼續(xù)擴大辦事能力半徑的做法,反而更加顯得眉清目秀起來了??
打車當然是辦事的,但它和點奶茶、買東西不太一樣的是,帶有更大的非標性,和更低的容錯率。
AI幫買奶茶,如果點錯了或者買少了,對于用戶來說固然糟心,但也不是完全不能接受,但AI幫忙打車,把目的地選錯了,甚至耽誤了航班,必然引起「天塌了」級別的暴怒。
而且,打車的變量不止是起點和目的地,千問能做的事情,還有「不要臭車」「30塊以內(nèi)」「定時預約」這些個性化需求的滿足,確保言出法隨的體驗。
我自己就模擬出了一整套通勤流程,由于平時就是高德地圖的高頻用戶,有了家和公司的預設地址,可以說不存在任何遷移成本,甚至半路想起來要買東西的臨場需求,千問都能一一實現(xiàn)。
![]()
下班也是一樣,對用戶意圖的識別和匹配相當精準,包括付款在內(nèi)的整個流程都不需要跳轉其他APP。
![]()
工程學的難度及其原理在于,流程可以做加法,結果卻是做乘法,每個步驟的成功率是95%,看起來很高,十個步驟連在一起,成功率就連60%都不到了。
這也是為什么我對千問死磕辦事的評價一直很高,因為它是真的在以一己之力推動AI在真實世界贏得用戶信任這件事情。
當AI變得越來越油——在指出它犯了錯誤之后,「你說得對」成了它屢教不改的開場白——這反而強化了AI在通用場景里只適合完成開放性任務的刻板印象,但凡對準確度有所要求,AI的可信度就急劇下降。
所以才有「人工智能不如能工智人」的段子??
而千問正式上線以來的每一步,都是在把AI從近乎無限的免責區(qū)拉出來,拒絕延續(xù)「它還是個孩子」的寵溺。
重要的是,千問想做成的事情,向下有多扎實,往上就有多壯麗。
ChatGPT也能調(diào)用Uber,但是只有用了之后,才知道距離「一句話打車」的理想體驗有多遙遠:
必須指名Uber的應用,必須完整寫出明確指令——少一個字都不行——必須跳轉到Uber的App里完成下單,整個過程充滿了「脫褲子放屁」的多余感。
這當然不是模型不中用,ChatGPT再怎么強大,它也無法去管理Uber的運行數(shù)據(jù),兩款產(chǎn)品通過有限的接口互通,博弈下來的成果就是,AI依然只能在它的「一畝三分地」里行動,只要涉及到第三方應用的,就還是要把流量和履約都挪過去。
也確實是難為AI了,模型的智商再高,也處理不了這些復雜的人情世故啊??
而千問能夠擺平同樣的問題,原因還是在于阿里的自有生態(tài)足以支持服務供給,而且不光是客觀上「有」,更得是主觀上「能」。
無論是用千問點奶茶也好、打車也好,響應的都是阿里自家生態(tài)產(chǎn)品,此時發(fā)揮出來的體制優(yōu)勢,或者說「集中力量辦大事」的戰(zhàn)略高度,讓阿里不必重復OpenAI的窘迫。
從千問已經(jīng)能夠支持的混合任務來看,阿里是真的把入口做了「AI優(yōu)先」的重新設計,可以一句話打車,不代表只能一句話打車,事實上,用稍微復雜的表達,讓千問先訂電影票、然后以規(guī)劃時間為前提去幫打車、最后在電影結束后預約一輛回家的車,都是可以實現(xiàn)的。
而在這個過程中,檢驗的不只有模型自身的能力,還有千問對于工具的使用,它能像人一樣,去地圖里查看路線,去計算合理的日程,去預判網(wǎng)約車的接送時間。
還是那句話,但凡錯一項,給用戶體驗的損傷,都是毀滅級的。
這才是隨著千問的一次次升級,創(chuàng)造出來的開創(chuàng)性價值,它在做的事情,同行要么避而遠之,要么舉步維艱,對阿里來說也不可能立刻帶來特別突出的經(jīng)濟效益,但千問偏要把這塊硬骨頭給啃了,不為別的,就是任性。
這會讓人想到1923年「紐約時報」追問登山家喬治·馬洛里為什么堅持要冒著生命危險去爬珠穆朗瑪峰時,后者甩出來的那句言簡意賅的回答:
「因為山在那里。」
是啊,山就在那里,作為一個職業(yè)的登山者,是不可能騙自己沒看到的。
如果阿里真的相信AI是當代正在發(fā)生的工業(yè)革命這個敘事,真的相信千問模型是開源之光、是能和頂級模型打得有來有回的資質(zhì),那么承擔為整個AI行業(yè)向前探路的使命,也就是一種必然,而不是選擇。
從買一杯奶茶,到打一輛車,千問在逐漸打出產(chǎn)品心智的同時,還在落實著AI之于主流用戶的安全性。
這里的安全性,在于放心委托AI替自己辦事,第一次可以是嘗鮮,第十次、第一百次就是習以為常的生活方式了。
所有的技術進步,遲早都要邁過這一步,現(xiàn)在的年輕人可能不知道,當計算器和電子秤最初被應用到菜市場等場景后,很長一段時間里,消費者不會輕信機器上顯示的數(shù)字,一定要自己心算過一遍才踏實。
也許,當下看過去有多滑稽,未來看當下就有多著急。
就像「阿瑪拉定律」所說的:「我們總是高估一項科技所帶來的短期效益,卻又低估它的長期影響。」
AI是一個過度炒作的行業(yè)嗎?很難否認。
誠實的說,正是因為許諾的太多,實現(xiàn)的太少,以致于前沿與大眾之間的割裂感過于嚴重。
但也有千問這樣,一步一個腳印的,把吹過的牛逼挨個實現(xiàn)的產(chǎn)品,并在長期的尺度上,對齊AI的智力和行動力,這就夠了。
凡是過往,皆為序章。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.