![]()
出品|網易科技《態度》欄目
作者|櫟行
編輯|丁廣勝
手機行業正迎來一場前所未有的“底層革命”。
轟動一時的豆包AI手機,落地“登陸”并不順利。幾天之內,騰訊系微信、《王者榮耀》,淘寶閑魚大麥等阿里系應用,乃至建行農行等主流平臺幾乎同步筑起高墻——登錄異常、強制下線、操作攔截與安全警告接連發生,使這款旨在“用AI串聯一切”的手機在短時間內處處碰壁。
然而戰火未熄,新變數已至:正當豆包陷入重圍之際,智譜突然宣布開源具備“Phone Use”能力的AutoGLM模型,支持微信、淘寶等超過50個高頻應用場景,為任何廠商提供了打造“類豆包”能力的開源路徑。
這一前一后,形成了鮮明對比:一邊是字節跳動的深度集成、底層嵌入的“豆包模式”;另一邊則是智譜開創的開源路徑。這標志著戰局從“單點突圍”轉向“生態對壘”。
在騰訊、阿里等平臺以“安全”為名實施技術限制的背后,實則是新舊入口話語權的激烈博弈——這不僅是技術的迭代升級,更是一場關乎生態主導權、用戶體驗定義權以及未來商業模式的核心競賽。行業格局或將因此重塑。
AI手機的兩種未來路徑
AI手機的發展正呈現兩條鮮明技術路徑。
一方是以豆包手機為代表的“系統級整合”路線。
豆包手機助手通過獲得系統級權限,直接嵌入操作系統底層,獲得了監控系統運行狀態、讀取應用界面信息、模擬用戶點擊操作的權限 ,從而能跨應用執行復雜任務。這需要手機廠商深度合作,將AI能力深度植入操作系統底層。
![]()
(圖為用戶測評豆包手機,語音要求手機買一瓶醬油。圖源:iFANr)
這種閉源路徑優勢在于執行效率高、體驗流暢,但深度集成需要手機廠商的全力配合,且不可避免地引發了關于權限過高的爭議。
另一方是智譜開創的“開源視覺路線”。
該方案不尋求系統級權限,而是通過計算機視覺技術,模擬人類與手機交互的基本方式:先通過屏幕截圖“看”懂界面,再通過大模型分析“思考”該做什么,最后模擬手指操作完成指令。
AutoGLM的創新之處在于將Agent行為分為“規劃者”和“執行者”兩層結構,分別負責決策和執行,這有效解決了“大模型看得懂但點不準”的行業難題。這種技術路徑的優勢在于兼容性強,不依賴應用廠商授權,但技術復雜度更高,體驗的流暢度和穩定性面臨更大挑戰。
![]()
(圖為智譜AutoGLM接入手機界面)
本質上,豆包是試圖改造手機本身,讓AI成為操作系統的核心組成部分;而智譜則是為用戶提供了一個在云端運作的AI助手,通過遠程控制方式操作應用 。這兩種技術都旨在讓AI像人一樣操作手機應用,完成跨應用復雜任務,但它們的實現路徑和商業模式卻截然不同。
從大眾最為關心的隱私保護層面,兩種方案呈現出根本性的不同取向。
豆包AI手機由于需要系統級權限,理論上能夠訪問手機上的所有數據。盡管開發團隊強調采用了虛擬屏操作、權限隔離和本地處理等安全措施,并承諾敏感數據不會保存且不會進入模型訓練,但這一設計仍然難以完全消除用戶的隱私擔憂。有評論指出,“代碼是干凈的,但掌握代碼的人呢?”
AutoGLM則通過云端“云手機”方案從架構上嘗試規避這一風險。所有操作都在云端虛擬手機的沙箱環境中完成,模型無法接觸到用戶真實手機上的隱私數據。這種設計雖然降低了隱私風險,但也帶來了新的問題,如網絡依賴性、操作延遲等體驗層面的挑戰。
豆包和AutoGLM的不同選擇,反映了兩家公司在大模型時代的戰略定位差異。
豆包背后是字節跳動的“硬件夢”和超級入口野心。雖然字節明確表示無自研手機計劃,而是與多家手機廠商洽談合作 ,但其通過軟件定義硬件的方式改造現有入口系統,目標是在AI時代守住超級入口 。這種差異化定位也反映在市場表現上。豆包手機憑借其創新性引發了高度關注,首批3萬臺備貨被一搶而空,閑魚價格被炒至萬元上下。
![]()
智譜則定位為AI能力提供者,不與手機廠商直接競爭。除了開源AutoGLM,智譜已與榮耀、三星等頭部手機廠商合作,將Agent體驗帶入其旗艦手機 。而智譜通過開源策略,希望成為AI手機生態的“關鍵拼圖”,而非主導者 。
AI手機到智駕時刻了嗎?
隨著AI手機概念的持續升溫,業界開始出現一個引人深思的比喻:AI Agent正推動手機產業迎來“智駕時刻”,如同自動駕駛技術對汽車行業的改造。
從技術成熟度來看,當前的AI手機確實處于類似“輔助駕駛”的早期階段。無論是豆包還是AutoGLM,都已能夠完成點外賣、訂機票等長達數十步的復雜操作,這證明了大模型在理解圖形界面和執行復雜任務方面的基本可行性。
然而,就像早期的自動駕駛系統一樣,現階段的AI手機助手仍然需要面對各種邊界情況,其可靠性、泛化能力與真正成熟可用的產品還有明顯差距。此前,財聯社在實測中發現,遇到設計特殊的APP界面時,可能出現操作適配不順暢的情況。
更為復雜的挑戰來自于生態層面的博弈。應用廠商與AI助手之間的沖突,本質上是關于“流量控制權”的重新分配。
周鴻祎此前坦言,這種能繞過App直接完成任務、讓服務直達用戶的AI助手,會直接沖垮互聯網大廠的護城河。很快,用戶反饋微信、淘寶等應用出現登錄異常或風控提示。迫于壓力,豆包團隊在12月5日發布公告,對金融支付、刷分激勵等敏感場景的AI操作能力進行了規范化限制。
互聯網平臺面臨一個艱難的戰略抉擇:是繼續“修筑高墻”保護自己的領地,還是主動開放API,與AI Agent共建一個新生態?這種博弈不僅發生在技術層面,更涉及到深層的商業利益分配。
從產業發展角度觀察,AI手機的興起正在推動整個產業鏈的轉型升級。芯片、傳感器等上游產業鏈迎來新的發展機遇,AI芯片、算力等各個環節的企業都在尋找與AI結合的新機會。同時,行業競爭焦點正從硬件參數轉向生態整合能力。隨著高通、聯發科等芯片廠商主導端側大模型適配,終端品牌的差異化空間將更多體現在AI能力的整合與創新上。這種轉變預示著手機行業可能迎來新一輪的洗牌。
市場數據也印證了AI手機的發展潛力。據IDC預測,2024年全球生成式AI手機出貨量將同比增長363.6%,達到2.342億部。到2028年,這一數字預計將達到9.12億部。高增長預期背后是巨大的市場潛力,但也提示著行業尚未形成穩定格局,各種技術路線都有其發展空間。
![]()
從用戶需求層面分析,智能手機創新疲軟已久,中信證券的研報顯示,目前全球換機周期延長至51個月。AI Agent被視為下一波換機潮的關鍵驅動力。然而,用戶對AI助手的接受度不僅取決于技術能力,還關乎信任建立。隱私安全、操作可靠性、使用成本等因素都將影響用戶的采納決策。
AI手機的形態很可能不會由單一路徑壟斷。系統級整合與視覺Agent路線各具優勢,或許會在競爭中相互借鑒、融合。正如業界觀察所指出的,決定最終格局的,將是哪些技術能夠真正落地、跑穩、跑廣,贏得用戶信任。
