網易首頁 > 網易號 > 正文申請入駐

豆包手機助手動了誰的蛋糕？

2025-12-07 14:00:37　來源: 鏡相工作室

北京舉報

分享至

文丨彭杰克

編輯丨諶巖

短短幾天，在各方質疑、爭論、限制下，豆包手機助手一退再退。

繼下線手機助手操作微信的功能后，12月5日上午，針對刷分、刷激勵，金融類App，部分游戲這三大使用場景，豆包手機助手放棄了操作權限。公告中，豆包方面的措辭顯得有些無奈——“這是為了讓技術走得更穩、更遠的必要鋪墊，希望能得到大家的理解。”但就在昨天，阿里系App也集體“拉黑”了豆包手機助手，出于風控原因，淘寶、閑魚、大麥等App無法登陸，估計其他大廠的措施也都在路上了。

這樣的遭遇，放在整個移動互聯網行業的大環境下，再正常不過。

當年，移動互聯網讓人類第一次把時間塞進一塊小小的屏幕里，社交網絡、信息流、推薦算法……整套注意力經濟在過去十多年長成參天大樹。它要求用戶點擊、滑動、停留，讓每一秒都被平臺捕獲、計算、轉化，最終變成各家大廠的商業價值。如今，字節拿出AI手機助手，本來只是一次試水，卻被認為想掀桌子，改寫已有的規則，重塑早就劃分完畢的地盤格局，這是各家都無法容忍的。

于是，隱私保護和風控成了最合適的緣由，讓人無法反駁，字節也只能退讓。但是，這樣的嘗試不應該被否定，總有人要有膽量去撼動固化的利益格局，這是科技進步和范式轉移的開端，生態從注意力為中心轉向以需求和意圖為中心，也是大勢所趨。

這種可預見的變化會自然沖擊原有的信息孤島和商業邏輯，讓手機不再是承載應用、廣告的容器，而是成為一個隨時替用戶行動的代理、Agent。入口、路徑、停留都會重新分配。只不過這個過程會異常艱難，字節至少有敢為人先的勇氣，也有快人一步的野心，這次嘗試即便不成功，帶來的思考和影響也會是巨大的。

理想和現實存在差距

豆包手機助手的發布在字節跳動今年的計劃內。據晚點Latepost報道，這是一項從去年上半年就開始籌備的任務，字節負責大模型功能、部分操作系統相關的工作，硬件的設計、生產等主要由中興作為ODM（Original design manufacturer，原始設計制造商）負責。

12月的第一天，豆包手機助手發布技術預覽版，工程樣機nubia M153同步少量發售，官網售價3499元，很快售罄，二手平臺普遍加價超千元。

從官方演示視頻來看，這款AI手機確實吊足了胃口：它可以根據一篇小紅書種草筆記，識別出相應產品，幫用戶跨平臺比價并選擇最低價鏈接下單；能夠一一完成瀏覽并整理旅游攻略、在地圖App上標記用戶收藏的餐廳、根據出行計劃預定旅游目的地展覽等多項復雜任務；如果你足夠相信AI，授權它記憶屏幕內容，它將越來越了解你，在你需要的時候提醒你朋友推薦過什么餐廳，自動幫你下單孩子會喜歡的生日禮物……

●豆包手機助手正為用戶跨平臺比價購物。圖源：豆包手機助手官網演示視頻截屏

這一切把動手操作降到最低，將手機從被動工具變成主動幫手。然而，發布次日，搶到樣機的用戶陸續發布反饋，豆包提醒的“大模型技術不可控”并沒有成為焦點，反而是App之間的“墻”影響了使用體驗。

先是有多位nubia M153用戶反映，其微信異常退出甚至無法登錄，并被提示“微信登錄環境存在異常”。對此，騰訊相關人士回應上海證券報稱：“我們沒有什么特別的動作，這個不是二選一，不知道是不是中了安全風控措施。”

然后是銀行、支付類App使用受限，如有用戶用豆包手機助手網購，流程進行到人工輸入付款密碼時，被支付寶判定支付環境存在安全風險、中途截停了任務。還有用戶讓豆包手機助手代打了一把王者榮耀，游戲結束后，該用戶被判定使用外掛、被系統禁賽10分鐘。

豆包手機助手的技術原理是通過視覺識別用戶手機屏幕上的按鈕、文字等內容，把信息交給AI去推理，再輸出指令模擬人手去點擊屏幕。這個技術并不新鮮，原理有點類似于早年的“按鍵精靈”或“自動搶紅包”，只不過識別的內容和返回的操作都更復雜。

主要問題是，這樣的操作需要獲得很高的權限，才能識別出用戶屏幕上的內容。因此，許多App以保護用戶隱私和防止誤操作等為由，主動封禁。甚至有聲音指控豆包手機助手未經授權獲取操作系統高危權限、侵犯用戶隱私等。

但實際上，字節不可能給自己埋下這樣的隱患。面對質疑，他們做了兩件事情：一是將微信、金融、游戲等個人隱私更敏感，安全要求更高的App主動下線功能，AI無法識別操作；二是建立了透明、合規且完善的權限管理體系，保證用戶事前充分知情，事中隨時介入，事后數據清理的權利。

比如，豆包手機助手在幫用戶完成任務時，需要調用手機系統級權限，這需要用戶主動授權，這不是豆包率先這樣做，目前市場上的AI助手很多都會調用，才能提供自動操作手機的服務；像自動駕駛一樣，豆包調用權限操作手機時屏幕上也會明確提示，用戶隨時可以中斷；而在執行一些敏感任務時，比如敏感權限授權彈窗、支付環節、身份驗證等，都會暫停操作，讓用戶二次確認后自己完成；整個過程中，豆包手機助手不會在云端存儲任何屏幕內容，后續也不會用相關數據進行模型訓練，必須把數據上傳到云端處理時，傳輸和處理過程均采取嚴格的保護措施保障?戶數據安全，數據使?完后會?即刪除。

隱私安全是普通用戶最關心的事情，也是國家法律嚴格規定的紅線。事實上，移動互聯網時代的算法推薦，不管是刷短視頻、逛購物網站、閱讀文章，還是各大App的開屏廣告、信息流廣告，都會使用用戶的行為數據，也會用到很多的高敏感權限，很多人甚至覺得手機在“監聽”自己，說了什么話、打了什么字、逛了什么網站都被追蹤了。但絕大多數時候，這些都是獲得用戶授權的，正規公司的產品會受到手機廠商和相關部門嚴格的監管。

只不過“AI一邊替你操作手機，一邊瘋狂獲取你的隱私信息”的場景太過具象，激發出人們對隱私泄露的恐懼，有極好的傳播效果。因此，這也成了各大潛在對手，包括手機廠商、應用廠商抵制豆包手機助手最好的理由。

與手機、應用廠商的雙重矛盾

可以說，字節這次發AI手機助手，把市場上的人們得罪了個遍。

早在豆包手機助手發布之前，過去一整年，幾乎所有的手機廠商都在加班加點地研發自家的AI助手，一些大模型公司也想當AI Agent方案供應商，讓自家的Agent入駐用戶手機。但是，沒有哪家像字節這樣令所有人緊張。

如果是華米OV來做，威脅有限，因為彼此都無法把自家助手裝到友商手機里；如果是大模型公司做，更是毫無話語權，人家憑什么要用你的Agent；如果是應用大廠來做，比如那些坐擁國民App的大廠，騰訊、阿里、字節，雖然手機廠商不敢不認真對待，但微信不可能讓豆包操作，支付寶也不可能讓元寶操作，美團也不可能讓千問操作，手機助手功能將十分有限。

但字節偏偏要試一試，還找來了中興。很明顯，雖然說是合作，但字節是主導，更像是中興給字節代工。這樣一來，字節又有硬件，又有技術和用戶規模都在前列的豆包，先發優勢巨大，這讓手機大廠和應用大廠同時坐不住了。

對于手機廠商來說，雖然大模型技術不一定強，但和大模型創企合作是各取所需，關系可控。而在應用大廠看來，AI手機還處于“PPT階段”，體驗差，效率低，構不成太大威脅。但如果是字節聯合中興來做，就不一樣了，手機大廠會擔心中興會不會成為手機界的賽力斯，在字節的加持下一飛沖天，應用大廠則會擔心字節把技術和模式跑通后，騎到自己頭上，變成用戶流量總龍頭。

因此，字節的入局在戰略邏輯上本身就面臨雙重挑戰：挑戰既有手機廠商對“AI手機+系統級入口”的封閉控制，也挑戰主流應用廠商對“流量、用戶使用時長、廣告變現”的路徑依賴。

手機廠商中，榮耀的危機感顯而易見。

先是榮耀首席影像工程師羅巍直言：“我不看好。因為字（節）沒有硬件研發能力，或者硬件能力并不比中興領先。那么就是兩個矮子在一起，也不會生個高子。我預計如果堅持的話，三世而亡。否則一代死。”

然后是榮耀終端股份有限公司產品線總裁方飛，其稱豆包手機助手的演示視頻讓人眼熟，“基于UI Agent實現對通用場景的支持并自動執行，這與榮耀AI從特定任務向通用化執行的發展道路是一致的。”

如果說字節與手機廠商的競爭，還是新趨勢下的你追我趕，那么其與主流應用廠商間的沖突，則觸及了移動互聯網生態中最敏感、最根源的矛盾，是對AI時代下，誰控制入口、誰定義操作、誰分配流量、誰決定變現規則的爭奪。

●2024年5月1日，上海虹橋高鐵站，迎來旅游、探親大客流，人頭攢動。等待的旅客在刷手機。圖源：視覺中國

當背靠全球最大獨角獸的豆包手機助手，獲取系統級高敏感權限，試圖跨應用自動化，在用戶的一句指令下完成瀏覽、提取、對比、交易等任務時，它實質上繞過了傳統 App 的界面與交互結構，讓用戶不必打開App，不必瀏覽、點擊、停留，這對依賴注意力經濟的應用廠商而言是最直接的沖擊。

這意味著，開屏廣告不再被用戶看到，提升用戶使用時長的小巧思可以被跳過，乃至平臺與平臺間的主視覺設計、差異化定位都將被消解。大眾最常用的App，從流量控制、用戶行為到推薦邏輯、商業模式，都可能被AIOS撼動。更不用說字節和其他大廠業務競爭廣泛，電商、短視頻、本地生活、社交、AI、游戲等全方位布局，騰訊、阿里、京東、美團、拼多多、攜程、快手、百度，沒有一家會放心豆包操作自家的App。

如果說華米OV們來做AI手機，應用廠商們還只是出于對范式轉移的擔憂而采取限制或保持沉默，但如果是字節來做，大廠們就會集體抵制了。這是一種本能的應激反應。

撞墻和拆墻的路

字節是激進的。突然搞出一個AI手機助手，無疑是在和手機大廠和應用大廠同時宣戰。但字節也是勇敢的，在利益固化嚴重，甚至字節自己就是舊范式的最大受益者之一時，主動走出舒適區，探索新的可能性，這種創新精神是值得鼓勵的。

整個行業過去十幾年始終圍繞“注意力—流量—廣告”的邏輯構建生態，用戶的操作越復雜、停留越久，平臺越受益。AI手機的出現從邏輯底層提出了新的方向：如果未來的終端更像個人助理，而不是內容入口，那么用戶停留時間、頁面點擊、跳轉深度，這些曾經主宰互聯網的指標都將被重塑。

實際上，豆包手機助手和過往那些手機廠商的AI助手類似，依舊停留在非常早期的階段。無論是字節，還是榮耀、智譜，都在采用一種過渡性的GUI（Graphical User Interface）方案，通過“讀屏+模擬操作”來調用App。和更理想的意圖框架相比，它的最大優勢是能繞過App后臺授權、從前臺直接操作，但難點在于適應界面變化，如果App突然更新設計、按鈕位置變了，AI又得重新學習。這些產品都有著成功率低、響應不穩定、耗時長等共性問題，可能用起來還沒有人親自操作更高效，但萬事開頭難，走出這一步，后面才有機會變得更好。

但第一步就注定會撞到高墻——權限、利益、安全、生態秩序。這些問題無論誰先做，都會發生，字節做，更是會撞得頭破血流。

●圖源：視覺中國

這也是為什么必須有人先來觸碰這些壁壘。壁壘越厚，創新者越痛，但如果沒有這一撞，用戶永遠不知道手機能不能變得更聰明，也無法判斷真正的“手機智能化”到底應不應該由消費者來決定，而不是由平臺利益來決定。

字節選擇在此刻站出來，冒著隱私保護、輿論傾向、體驗糟糕等風險，把大模型置于真實的手機使用場景里，是一次非常有意義的嘗試。

從第一代工程樣機三萬臺的備貨量來看，這本身就是一次工程測試，而不是全面商業化的發布。字節或許并不想與其他手機廠商拼體量，而是用最小規模、最可控的方式驗證一件事：當用戶能夠選擇更高效的決策方式時，原有的互聯網生態是否還能保持曾經的穩定？從用戶的熱情、樣機加價，再到主流應用紛紛觸發風控，這臺小小的工程樣機其實已經給出了答案。

目前，豆包手機助手還遠遠稱不上成熟，它的能力受限于GUI的先天缺陷，也會繼續面對權限、系統兼容、風險控制等層層挑戰。但在這個初期階段，它至少證明了一件事：AI手機不是概念機，而是能夠通過真實用戶場景帶來效率提升的東西。

從這個角度看，字節撞上的每一道墻，其實都屬于行業必須面對、必須拆解的墻。繼續往前走，需要更強的模型、更穩的系統、更嚴密的隱私邊界，也需要建立新的商業分配機制。

最重要的，是需要有對敢為人先的包容。

參考資料

鏡相工作室正在尋找商業領域的優秀作者加入，請查看：

繼續閱讀：

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.