![]()
電商比價、瀏覽微信,字節為何敢于打破行業默契?
文|《中國企業家》記者 閆俊文
編輯|何伊凡見習編輯|李原
頭圖來源|視覺中國
字節的硬件野心,從未加以掩飾。但當它踏入了手機和超級App們的領地,甚至希望重新分配移動互聯網的控制權時,很快撞上了阻力墻。
12月1日,豆包發布手機助手,在中興nubia M153系列手機上,獲得了操作系統層面的高權限。用戶通過喚醒“豆包”,可以完成跨應用比價、購物、撰寫報告等任務;也可以打開微信,自動回復消息,玩小程序游戲等。
該產品一經發布,便在市場上掀起風浪。
消息發布當日,中興通訊即漲停。nubia M153型號官方售價3499元,目前在閑魚上已漲價500元至3000元不等。就連預約購機的F碼(優先碼),也炒到了100元至300元不等。一位閑魚賣家表示,來問的都是手機廠商的研發、測試人員,手機目前功能有限,不推薦普通消費者購買。
雖然字節反復強調,只是做手機助手,不會研發手機。但網絡比價、瀏覽聊天記錄的操作,無疑觸動了超級App們的“逆鱗”。其中,微信最先出手了。
12月2日晚間,《中國企業家》發現,在字節官方組建的“豆包手機助手交流群”內,部分nubia M153用戶發出截圖,顯示微信提示“登陸環境異常”。甚至有用戶反饋,微信賬號被封,需要申訴解禁。
12月3日晚間,前述用戶群發出通知:“豆包手機助手Pro模式已經下線操作微信的能力;在Nubia M153上被禁止登陸的微信賬號會陸續解封,請大家等待一段時間并嘗試重新登陸。”
《中國企業家》就此向騰訊方面求證,騰訊表示,沒有什么特別動作。
但微信“拉黑”對手的越界,并非首次。華為小藝、小米小愛等手機助手都曾宣稱可以打開微信,幫助用戶回復消息。但用戶反饋,這些功能后來都陸續下架。
2024年10月,智譜AI發布手機助手AutoGLM,智譜AI CEO張鵬現場展示了用AI在微信群內發了1萬元的紅包。但到2025年8月,智譜將AutoGLM升級為Agent產品,其中包含了抖音、美團、滴滴打車等30款高頻應用——微信已不在其列。一位知情人士表示,之所以取消了微信發紅包的功能,主要是跟微信沒談下來。
今年4月,微信安全中心曾發布公告稱:近期,我們發現有第三方工具以“AI管理用戶微信聊天記錄”等名義,繞過微信安全技術措施,違法違規獲取或利用微信終端用戶數據。對此,微信安全中心提醒,不要安裝或使用任何訪問本地聊天記錄的第三方工具。
12月3日晚間,有用戶反映:在使用豆包手機比價時,已經發現了從淘寶端彈出的驗證碼。阿里相關人士表示:有可能是觸發了正常的行業風控措施。
豆包手機:讓人興奮,也令人恐懼
在豆包手機的官方視頻演示中,它表現出了不少令人興奮的、AI手機該有的樣子。
用戶使用手機時,可以通過語音、側邊鍵或豆包Ola Friend耳機直接喚醒豆包。豆包也打通了手機底層系統應用,用戶可直接在相冊內通過語音,對圖片下達修圖指令,例如刪除人物、P掉雜物等。
在手機Pro模式下,當用戶說“幫我給女兒推薦幾個禮物放進購物車”時,若手機記憶中已存儲了女兒的年齡、興趣等信息,助手可以直接查詢可能符合女兒偏好的方案。
但如果用來高頻使用,豆包手機只是一部很不成熟的工程機。
有用戶發現,豆包可以完成屏幕閱讀識別、點擊、滑動操作。但因為手機由AI驅動,每個頁面都需要重新識別,因此延時很高,反應很慢。
更有爭議的是,豆包還“實時監聽”著用戶的對話內容,“會把點擊按鈕前說的話也識別進去”,屏幕識別也讓手機內容沒有任何隱私可言。
業內專家對《中國企業家》表示,豆包手機助手之所以能“自動化”操作App,大致分為兩步:一是識別并理解當前屏幕的內容,如聊天記錄等;二是將當前內容上傳云端分析后,回傳指令進行自動點擊操作。
對內容如何識別?豆包要對屏幕的所有內容進行錄制,然后上傳到云端分析識別。自動操作怎么實現?是因為豆包使用了系統級的“INJECT_EVENTS”權限,模擬真人用戶操作——這也與外掛和木馬的技術原理異曲同工。
雖然12月3日,豆包手機助手官方發文,回應了此種質疑。它指出,豆包手機助手需要用戶主動授權,才可以調用“INJECT_EVENTS”權限。但這種通過獲取系統權限,模擬手指點擊屏幕,用視覺技術“看懂”界面的方法,與通過官方API接口合作,有著本質區別。
“這意味著,你屏幕上的所有內容如聊天記錄、轉賬記錄、付款碼等高敏感信息均可能被上傳到云端,包括自己或聊天對象等第三方的隱私信息。另外,如果手機助手被劫持,因為它有很高的權限,也可能導致其他安全隱患,如控制賬號發送惡意信息、盜取資金等。”
![]()
豆包手機交流群 來源:記者截圖
對此,豆包手機助手回應稱,助手確實需要讀取屏幕,但數據不會在服務器端留下存儲,且所有的相關內容不會進入模型訓練,確保用戶隱私安全。
中興是有限的選擇
豆包手機一經推出,便引起了對手的強烈抵制,字節對此應該并不意外。
在豆包手機的宣發中,字節一直低調地將nubia M153稱為工程樣機,并特別強調:沒有開發手機的計劃。但據第一財經報道,“豆包手機基本算是字節自己研發的,但是迫于壓力說的合作,其實中興只是代工。”
雖然字節表示,正在和多家手機廠商推進手機助手的合作落地計劃,但留給字節的選擇或許不多。
今年,華為、小米都不約而同地從操作系統、智能體框架等維度重構軟硬件生態,打造AI原生的能力、代碼以及協議,他們自然不會向模型廠讓渡入口。
另據“極客公園”報道,字節跳動與努比亞的工程機首銷備貨量為3萬臺,并為此訂購了對應數量的手機關鍵元器件。而國產品牌主流旗艦,首銷期備貨通常在200~300萬臺。
行業人士向《中國企業家》透露,這個量級僅夠針對開發者、體驗者的試水,字節或許意在收集用戶數據,優化模型,為接下來的硬件開發提供更多思路。
目前,豆包手機助手免費體驗僅有一年時間。根據官方披露,為防止部分用戶濫用,導致算力資源不足,手機會設置token限額,具體額度后續公布。
而AI手機運行中的token消耗,當下還做不到可以被忽略不計。以智譜AutoGLM為例,其技術負責人劉瀟曾告訴《中國企業家》,在AutoGLM上完成任務,算上模型與虛擬機,單任務的成本為0.2美元。
尤其是在未來手機端將可能面臨多任務Agent執行下,token消耗或更為可觀。根據字節官方披露,豆包大模型使用量從2024年5月1200億tokens,到今年9月超30萬億tokens,增速已達253倍。
字節四面出擊
實際上,今年從手機廠商到模型廠,都在積極探索邊界,想象下一代硬件的形態——只是字節的腳步,邁得格外激進。
一位AI開發者告訴《中國企業家》:豆包開發手機助手最大的困難,不在操作系統層面,更在于生態。超級App不會允許GUI(圖形用戶界面)的肆意調用,豆包用“傳統系統+語音助手”作為視覺方案,顛覆性體驗也不夠強。
![]()
來源:視覺中國
“GUI Agent的‘模擬點擊’本質而言,還是上個時代的技術思維”,上述開發者認為,這只是一種過渡方案。
今年8月,谷歌發布了首款AI原生手機Pixel 10,其搭載了谷歌原生的Tensor G5芯片,可以在本地直接運行小型大模型Gemini Nano——這也被視為谷歌全面展開軟硬件全棧布局的標志性事件。
谷歌在Pixel 10中預裝了超過30個原生應用,它們深度整合了Gemini Nano。但與其他Android手機相比,Pixel 10沒有預裝第三方大眾軟件。因此對于大眾來說,Pixel 10還只是谷歌的試驗田。
在國內,小米的“小愛”和華為的“小藝”,也都未敢朝著繞過App,直接打亂對手商業閉環的方向去探索。
相比之下,字節打破了行業默契,或許因為在App已逐步走向原子化之際,未來的殺手級硬件形態是否還是手機,已經成為未知數。而面對未知的新市場,字節通常會選擇用更急迫的方式進擊。
今年11月,山姆·奧特曼宣布:OpenAI正致力于打造一款以AI為核心的設備,他稱其將如同iPhone一樣具有革命性。
谷歌在自研硬件的同時,也在和Claude一起,嘗試開發新的AI系統,拋棄GUI的范式。谷歌宣布,計劃在2026年推出統一的桌面平臺 “Aluminium OS”,該桌面將基于Android,以谷歌AI為核心,整合Chrome OS和Android。
顯而易見,字節也在效仿谷歌,探索大模型與硬件的深度融合,在耳機、AI眼鏡、汽車、具身智能等硬件領域“飽和式”布局。
《中國企業家》獲悉,11月底剛剛推出的豆包輸入法也同步上線了nubia M153手機,試圖全力補足入口閉環。
一位輸入法產品行業人士曾告訴《中國企業家》,輸入法是用戶需求產生的第一入口。如何實現人與AI的雙循環驅動是個大命題,比如讓入口更淺、操作更穩。
作為試水產品,豆包手機短期內或許不會改變任何行業生態。但字節以顛覆之勢,先一步亮出底牌,意味著新一輪AI入口大戰已經全面打響。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.