網易首頁 > 網易科技 > 網易科技 > 正文

豆包智譜“左右互搏” AI手機爭霸戰打響微信淘寶們瑟瑟發抖？

2025-12-11 12:08:55　來源: 態℃

北京舉報

分享至

出品|網易科技《態度》欄目

作者|櫟行

編輯|丁廣勝

手機行業正迎來一場前所未有的“底層革命”。

轟動一時的豆包AI手機，落地“登陸”并不順利。幾天之內，騰訊系微信、《王者榮耀》，淘寶閑魚大麥等阿里系應用，乃至建行農行等主流平臺幾乎同步筑起高墻——登錄異常、強制下線、操作攔截與安全警告接連發生，使這款旨在“用AI串聯一切”的手機在短時間內處處碰壁。

然而戰火未熄，新變數已至：正當豆包陷入重圍之際，智譜突然宣布開源具備“Phone Use”能力的AutoGLM模型，支持微信、淘寶等超過50個高頻應用場景，為任何廠商提供了打造“類豆包”能力的開源路徑。

這一前一后，形成了鮮明對比：一邊是字節跳動的深度集成、底層嵌入的“豆包模式”；另一邊則是智譜開創的開源路徑。這標志著戰局從“單點突圍”轉向“生態對壘”。

在騰訊、阿里等平臺以“安全”為名實施技術限制的背后，實則是新舊入口話語權的激烈博弈——這不僅是技術的迭代升級，更是一場關乎生態主導權、用戶體驗定義權以及未來商業模式的核心競賽。行業格局或將因此重塑。

AI手機的兩種未來路徑

AI手機的發展正呈現兩條鮮明技術路徑。

一方是以豆包手機為代表的“系統級整合”路線。

豆包手機助手通過獲得系統級權限，直接嵌入操作系統底層，獲得了監控系統運行狀態、讀取應用界面信息、模擬用戶點擊操作的權限，從而能跨應用執行復雜任務。這需要手機廠商深度合作，將AI能力深度植入操作系統底層。

（圖為用戶測評豆包手機，語音要求手機買一瓶醬油。圖源：iFANr）

這種閉源路徑優勢在于執行效率高、體驗流暢，但深度集成需要手機廠商的全力配合，且不可避免地引發了關于權限過高的爭議。

另一方是智譜開創的“開源視覺路線”。

該方案不尋求系統級權限，而是通過計算機視覺技術，模擬人類與手機交互的基本方式：先通過屏幕截圖“看”懂界面，再通過大模型分析“思考”該做什么，最后模擬手指操作完成指令。

AutoGLM的創新之處在于將Agent行為分為“規劃者”和“執行者”兩層結構，分別負責決策和執行，這有效解決了“大模型看得懂但點不準”的行業難題。這種技術路徑的優勢在于兼容性強，不依賴應用廠商授權，但技術復雜度更高，體驗的流暢度和穩定性面臨更大挑戰。

（圖為智譜AutoGLM接入手機界面）

本質上，豆包是試圖改造手機本身，讓AI成為操作系統的核心組成部分；而智譜則是為用戶提供了一個在云端運作的AI助手，通過遠程控制方式操作應用。這兩種技術都旨在讓AI像人一樣操作手機應用，完成跨應用復雜任務，但它們的實現路徑和商業模式卻截然不同。

從大眾最為關心的隱私保護層面，兩種方案呈現出根本性的不同取向。

豆包AI手機由于需要系統級權限，理論上能夠訪問手機上的所有數據。盡管開發團隊強調采用了虛擬屏操作、權限隔離和本地處理等安全措施，并承諾敏感數據不會保存且不會進入模型訓練，但這一設計仍然難以完全消除用戶的隱私擔憂。有評論指出，“代碼是干凈的，但掌握代碼的人呢？”

AutoGLM則通過云端“云手機”方案從架構上嘗試規避這一風險。所有操作都在云端虛擬手機的沙箱環境中完成，模型無法接觸到用戶真實手機上的隱私數據。這種設計雖然降低了隱私風險，但也帶來了新的問題，如網絡依賴性、操作延遲等體驗層面的挑戰。

豆包和AutoGLM的不同選擇，反映了兩家公司在大模型時代的戰略定位差異。

豆包背后是字節跳動的“硬件夢”和超級入口野心。雖然字節明確表示無自研手機計劃，而是與多家手機廠商洽談合作，但其通過軟件定義硬件的方式改造現有入口系統，目標是在AI時代守住超級入口。這種差異化定位也反映在市場表現上。豆包手機憑借其創新性引發了高度關注，首批3萬臺備貨被一搶而空，閑魚價格被炒至萬元上下。

智譜則定位為AI能力提供者，不與手機廠商直接競爭。除了開源AutoGLM，智譜已與榮耀、三星等頭部手機廠商合作，將Agent體驗帶入其旗艦手機。而智譜通過開源策略，希望成為AI手機生態的“關鍵拼圖”，而非主導者。

AI手機到智駕時刻了嗎？

隨著AI手機概念的持續升溫，業界開始出現一個引人深思的比喻：AI Agent正推動手機產業迎來“智駕時刻”，如同自動駕駛技術對汽車行業的改造。

從技術成熟度來看，當前的AI手機確實處于類似“輔助駕駛”的早期階段。無論是豆包還是AutoGLM，都已能夠完成點外賣、訂機票等長達數十步的復雜操作，這證明了大模型在理解圖形界面和執行復雜任務方面的基本可行性。

然而，就像早期的自動駕駛系統一樣，現階段的AI手機助手仍然需要面對各種邊界情況，其可靠性、泛化能力與真正成熟可用的產品還有明顯差距。此前，財聯社在實測中發現，遇到設計特殊的APP界面時，可能出現操作適配不順暢的情況。

更為復雜的挑戰來自于生態層面的博弈。應用廠商與AI助手之間的沖突，本質上是關于“流量控制權”的重新分配。

周鴻祎此前坦言，這種能繞過App直接完成任務、讓服務直達用戶的AI助手，會直接沖垮互聯網大廠的護城河。很快，用戶反饋微信、淘寶等應用出現登錄異常或風控提示。迫于壓力，豆包團隊在12月5日發布公告，對金融支付、刷分激勵等敏感場景的AI操作能力進行了規范化限制。

互聯網平臺面臨一個艱難的戰略抉擇：是繼續“修筑高墻”保護自己的領地，還是主動開放API，與AI Agent共建一個新生態？這種博弈不僅發生在技術層面，更涉及到深層的商業利益分配。

從產業發展角度觀察，AI手機的興起正在推動整個產業鏈的轉型升級。芯片、傳感器等上游產業鏈迎來新的發展機遇，AI芯片、算力等各個環節的企業都在尋找與AI結合的新機會。同時，行業競爭焦點正從硬件參數轉向生態整合能力。隨著高通、聯發科等芯片廠商主導端側大模型適配，終端品牌的差異化空間將更多體現在AI能力的整合與創新上。這種轉變預示著手機行業可能迎來新一輪的洗牌。

市場數據也印證了AI手機的發展潛力。據IDC預測，2024年全球生成式AI手機出貨量將同比增長363.6%，達到2.342億部。到2028年，這一數字預計將達到9.12億部。高增長預期背后是巨大的市場潛力，但也提示著行業尚未形成穩定格局，各種技術路線都有其發展空間。