![]()
文丨彭杰克
編輯丨諶巖
短短幾天 ,在各方質疑、爭論、限制下,豆包手機助手一退再退。
繼下線手機助手操作微信的功能后,12月5日上午,針對刷分、刷激勵,金融類App,部分游戲這三大使用場景,豆包手機助手放棄了操作權限。公告中,豆包方面的措辭顯得有些無奈——“這是為了讓技術走得更穩、更遠的必要鋪墊,希望能得到大家的理解。”但就在昨天,阿里系App也集體“拉黑”了豆包手機助手,出于風控原因,淘寶、閑魚、大麥等App無法登陸,估計其他大廠的措施也都在路上了。
這樣的遭遇,放在整個移動互聯網行業的大環境下,再正常不過。
當年,移動互聯網讓人類第一次把時間塞進一塊小小的屏幕里,社交網絡、信息流、推薦算法……整套注意力經濟在過去十多年長成參天大樹。它要求用戶點擊、滑動、停留,讓每一秒都被平臺捕獲、計算、轉化,最終變成各家大廠的商業價值。如今,字節拿出AI手機助手,本來只是一次試水,卻被認為想掀桌子,改寫已有的規則,重塑早就劃分完畢的地盤格局,這是各家都無法容忍的。
于是,隱私保護和風控成了最合適的緣由,讓人無法反駁,字節也只能退讓。但是,這樣的嘗試不應該被否定,總有人要有膽量去撼動固化的利益格局,這是科技進步和范式轉移的開端,生態從注意力為中心轉向以需求和意圖為中心,也是大勢所趨。
這種可預見的變化會自然沖擊原有的信息孤島和商業邏輯,讓手機不再是承載應用、廣告的容器,而是成為一個隨時替用戶行動的代理、Agent。入口、路徑、停留都會重新分配。只不過這個過程會異常艱難,字節至少有敢為人先的勇氣,也有快人一步的野心,這次嘗試即便不成功,帶來的思考和影響也會是巨大的。
理想和現實存在差距
豆包手機助手的發布在字節跳動今年的計劃內。據晚點Latepost報道,這是一項從去年上半年就開始籌備的任務,字節負責大模型功能、部分操作系統相關的工作,硬件的設計、生產等主要由中興作為ODM(Original design manufacturer,原始設計制造商)負責。
12月的第一天,豆包手機助手發布技術預覽版,工程樣機nubia M153同步少量發售,官網售價3499元,很快售罄,二手平臺普遍加價超千元。
從官方演示視頻來看,這款AI手機確實吊足了胃口:它可以根據一篇小紅書種草筆記,識別出相應產品,幫用戶跨平臺比價并選擇最低價鏈接下單;能夠一一完成瀏覽并整理旅游攻略、在地圖App上標記用戶收藏的餐廳、根據出行計劃預定旅游目的地展覽等多項復雜任務;如果你足夠相信AI,授權它記憶屏幕內容,它將越來越了解你,在你需要的時候提醒你朋友推薦過什么餐廳,自動幫你下單孩子會喜歡的生日禮物……
![]()
●豆包手機助手正為用戶跨平臺比價購物。圖源:豆包手機助手官網演示視頻截屏
這一切把動手操作降到最低,將手機從被動工具變成主動幫手。然而,發布次日,搶到樣機的用戶陸續發布反饋,豆包提醒的“大模型技術不可控”并沒有成為焦點,反而是App之間的“墻”影響了使用體驗。
先是有多位nubia M153用戶反映,其微信異常退出甚至無法登錄,并被提示“微信登錄環境存在異常”。對此,騰訊相關人士回應上海證券報稱:“我們沒有什么特別的動作,這個不是二選一,不知道是不是中了安全風控措施。”
然后是銀行、支付類App使用受限,如有用戶用豆包手機助手網購,流程進行到人工輸入付款密碼時,被支付寶判定支付環境存在安全風險、中途截停了任務。還有用戶讓豆包手機助手代打了一把王者榮耀,游戲結束后,該用戶被判定使用外掛、被系統禁賽10分鐘。
豆包手機助手的技術原理是通過視覺識別用戶手機屏幕上的按鈕、文字等內容,把信息交給AI去推理,再輸出指令模擬人手去點擊屏幕。這個技術并不新鮮,原理有點類似于早年的“按鍵精靈”或“自動搶紅包”,只不過識別的內容和返回的操作都更復雜。
主要問題是,這樣的操作需要獲得很高的權限,才能識別出用戶屏幕上的內容。因此,許多App以保護用戶隱私和防止誤操作等為由,主動封禁。甚至有聲音指控豆包手機助手未經授權獲取操作系統高危權限、侵犯用戶隱私等。
但實際上,字節不可能給自己埋下這樣的隱患。面對質疑,他們做了兩件事情:一是將微信、金融、游戲等個人隱私更敏感,安全要求更高的App主動下線功能,AI無法識別操作;二是建立了透明、合規且完善的權限管理體系,保證用戶事前充分知情,事中隨時介入,事后數據清理的權利。
比如,豆包手機助手在幫用戶完成任務時,需要調用手機系統級權限,這需要用戶主動授權,這不是豆包率先這樣做,目前市場上的AI助手很多都會調用,才能提供自動操作手機的服務;像自動駕駛一樣,豆包調用權限操作手機時屏幕上也會明確提示,用戶隨時可以中斷;而在執行一些敏感任務時,比如敏感權限授權彈窗、支付環節、身份驗證等,都會暫停操作,讓用戶二次確認后自己完成;整個過程中,豆包手機助手不會在云端存儲任何屏幕內容,后續也不會用相關數據進行模型訓練,必須把數據上傳到云端處理時,傳輸和處理過程均采取嚴格的保護措施保障?戶數據安全,數據使?完后會?即刪除。
隱私安全是普通用戶最關心的事情,也是國家法律嚴格規定的紅線。事實上,移動互聯網時代的算法推薦,不管是刷短視頻、逛購物網站、閱讀文章,還是各大App的開屏廣告、信息流廣告,都會使用用戶的行為數據,也會用到很多的高敏感權限,很多人甚至覺得手機在“監聽”自己,說了什么話、打了什么字、逛了什么網站都被追蹤了。但絕大多數時候,這些都是獲得用戶授權的,正規公司的產品會受到手機廠商和相關部門嚴格的監管。
只不過“AI一邊替你操作手機,一邊瘋狂獲取你的隱私信息”的場景太過具象,激發出人們對隱私泄露的恐懼,有極好的傳播效果。因此,這也成了各大潛在對手,包括手機廠商、應用廠商抵制豆包手機助手最好的理由。
與手機、應用廠商的雙重矛盾
可以說,字節這次發AI手機助手,把市場上的人們得罪了個遍。
早在豆包手機助手發布之前,過去一整年,幾乎所有的手機廠商都在加班加點地研發自家的AI助手,一些大模型公司也想當AI Agent方案供應商,讓自家的Agent入駐用戶手機。但是,沒有哪家像字節這樣令所有人緊張。
如果是華米OV來做,威脅有限,因為彼此都無法把自家助手裝到友商手機里;如果是大模型公司做,更是毫無話語權,人家憑什么要用你的Agent;如果是應用大廠來做,比如那些坐擁國民App的大廠,騰訊、阿里、字節,雖然手機廠商不敢不認真對待,但微信不可能讓豆包操作,支付寶也不可能讓元寶操作,美團也不可能讓千問操作,手機助手功能將十分有限。
但字節偏偏要試一試,還找來了中興。很明顯,雖然說是合作,但字節是主導,更像是中興給字節代工。這樣一來,字節又有硬件,又有技術和用戶規模都在前列的豆包,先發優勢巨大,這讓手機大廠和應用大廠同時坐不住了。
對于手機廠商來說,雖然大模型技術不一定強,但和大模型創企合作是各取所需,關系可控。而在應用大廠看來,AI手機還處于“PPT階段”,體驗差,效率低,構不成太大威脅。但如果是字節聯合中興來做,就不一樣了,手機大廠會擔心中興會不會成為手機界的賽力斯,在字節的加持下一飛沖天,應用大廠則會擔心字節把技術和模式跑通后,騎到自己頭上,變成用戶流量總龍頭。
因此,字節的入局在戰略邏輯上本身就面臨雙重挑戰:挑戰既有手機廠商對“AI手機+系統級入口”的封閉控制,也挑戰主流應用廠商對“流量、用戶使用時長、廣告變現”的路徑依賴。
手機廠商中,榮耀的危機感顯而易見。
先是榮耀首席影像工程師羅巍直言:“我不看好。因為字(節)沒有硬件研發能力,或者硬件能力并不比中興領先。那么就是兩個矮子在一起,也不會生個高子。我預計如果堅持的話,三世而亡。否則一代死。”
然后是榮耀終端股份有限公司產品線總裁方飛,其稱豆包手機助手的演示視頻讓人眼熟,“基于UI Agent實現對通用場景的支持并自動執行,這與榮耀AI從特定任務向通用化執行的發展道路是一致的。”
如果說字節與手機廠商的競爭,還是新趨勢下的你追我趕,那么其與主流應用廠商間的沖突,則觸及了移動互聯網生態中最敏感、最根源的矛盾,是對AI時代下,誰控制入口、誰定義操作、誰分配流量、誰決定變現規則的爭奪。
![]()
●2024年5月1日,上海虹橋高鐵站,迎來旅游、探親大客流,人頭攢動。等待的旅客在刷手機。圖源:視覺中國
當背靠全球最大獨角獸的豆包手機助手,獲取系統級高敏感權限,試圖跨應用自動化,在用戶的一句指令下完成瀏覽、提取、對比、交易等任務時,它實質上繞過了傳統 App 的界面與交互結構,讓用戶不必打開App,不必瀏覽、點擊、停留,這對依賴注意力經濟的應用廠商而言是最直接的沖擊。
這意味著,開屏廣告不再被用戶看到,提升用戶使用時長的小巧思可以被跳過,乃至平臺與平臺間的主視覺設計、差異化定位都將被消解。大眾最常用的App,從流量控制、用戶行為到推薦邏輯、商業模式,都可能被AIOS撼動。更不用說字節和其他大廠業務競爭廣泛,電商、短視頻、本地生活、社交、AI、游戲等全方位布局,騰訊、阿里、京東、美團、拼多多、攜程、快手、百度,沒有一家會放心豆包操作自家的App。
如果說華米OV們來做AI手機,應用廠商們還只是出于對范式轉移的擔憂而采取限制或保持沉默,但如果是字節來做,大廠們就會集體抵制了。這是一種本能的應激反應。
撞墻和拆墻的路
字節是激進的。突然搞出一個AI手機助手,無疑是在和手機大廠和應用大廠同時宣戰。但字節也是勇敢的,在利益固化嚴重,甚至字節自己就是舊范式的最大受益者之一時,主動走出舒適區,探索新的可能性,這種創新精神是值得鼓勵的。
整個行業過去十幾年始終圍繞“注意力—流量—廣告”的邏輯構建生態,用戶的操作越復雜、停留越久,平臺越受益。AI手機的出現從邏輯底層提出了新的方向:如果未來的終端更像個人助理,而不是內容入口,那么用戶停留時間、頁面點擊、跳轉深度,這些曾經主宰互聯網的指標都將被重塑。
實際上,豆包手機助手和過往那些手機廠商的AI助手類似,依舊停留在非常早期的階段。無論是字節,還是榮耀、智譜,都在采用一種過渡性的GUI(Graphical User Interface)方案,通過“讀屏+模擬操作”來調用App。和更理想的意圖框架相比,它的最大優勢是能繞過App后臺授權、從前臺直接操作,但難點在于適應界面變化,如果App突然更新設計、按鈕位置變了,AI又得重新學習。這些產品都有著成功率低、響應不穩定、耗時長等共性問題,可能用起來還沒有人親自操作更高效,但萬事開頭難,走出這一步,后面才有機會變得更好。
但第一步就注定會撞到高墻——權限、利益、安全、生態秩序。這些問題無論誰先做,都會發生,字節做,更是會撞得頭破血流。
![]()
●圖源:視覺中國
這也是為什么必須有人先來觸碰這些壁壘。壁壘越厚,創新者越痛,但如果沒有這一撞,用戶永遠不知道手機能不能變得更聰明,也無法判斷真正的“手機智能化”到底應不應該由消費者來決定,而不是由平臺利益來決定。
字節選擇在此刻站出來,冒著隱私保護、輿論傾向、體驗糟糕等風險,把大模型置于真實的手機使用場景里,是一次非常有意義的嘗試。
從第一代工程樣機三萬臺的備貨量來看,這本身就是一次工程測試,而不是全面商業化的發布。字節或許并不想與其他手機廠商拼體量,而是用最小規模、最可控的方式驗證一件事:當用戶能夠選擇更高效的決策方式時,原有的互聯網生態是否還能保持曾經的穩定?從用戶的熱情、樣機加價,再到主流應用紛紛觸發風控,這臺小小的工程樣機其實已經給出了答案。
目前,豆包手機助手還遠遠稱不上成熟,它的能力受限于GUI的先天缺陷,也會繼續面對權限、系統兼容、風險控制等層層挑戰。但在這個初期階段,它至少證明了一件事:AI手機不是概念機,而是能夠通過真實用戶場景帶來效率提升的東西。
從這個角度看,字節撞上的每一道墻,其實都屬于行業必須面對、必須拆解的墻。繼續往前走,需要更強的模型、更穩的系統、更嚴密的隱私邊界,也需要建立新的商業分配機制。
最重要的,是需要有對敢為人先的包容。
參考資料
【 版權聲明】所有內容著作權歸屬鏡相工作室,未經書面許可,不得轉載、摘編或以其他形式使用,另有聲明除外。
鏡相工作室正在尋找 商業領域的優秀作者加入,請查看:
繼續閱讀:
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.