一個“豆包”或許可以被圍剿,但千千萬萬個“豆包”正在趕來的路上。
“每臺手機,都可以成為AI手機。”
12月9日早間,國內頭部大模型廠商智譜AI正式宣布開源其核心AI Agent模型——AutoGLM。這是一個歷經32個月研發、具備“Phone Use”(手機操作)能力的智能體框架。
![]()
智譜此時選擇開源,被業界解讀為一種技術上的“掀桌”行為——它意味著“人人都可以打造豆包手機”的愿景在技術上已成為可能。
對于行業來說,這或許是手機產業的“智駕時刻”。中信證券點評稱,AI Agent之于手機,正如自動駕駛之于汽車。
此次開源意味著硬件廠商、手機廠商和開發者均可基于AutoGLM,在自己的設備或系統中復現一個能“看懂”屏幕、并模擬真人進行點擊、輸入、滑動的AI助手。目前,AutoGLM已支持微信、淘寶、抖音、等超過50個高頻中文應用的核心場景,其自動化操作能力與此前引發熱議的“豆包手機”演示相似。
而這一動作發生在一個極其微妙且劍拔弩張之際。就在此前的一周內,字節跳動聯合努比亞發布的“豆包手機”攪動了整個科技圈,引發了互聯網巨頭們的集體“應激反應”。
破壁:從“豆包圍城”到“全員Agent”
事件的導火索可以追溯到一周前。
12月1日,字節跳動聯合中興通訊旗下努比亞推出了搭載“豆包手機助手”的nubia M153,售價3499元。這款手機憑借系統級權限,能夠模擬人類操作,跨越APP孤島執行點外賣、發微信、比價購物等復雜任務。這一創新迅速引爆市場,首批備貨瞬間售罄,在閑魚平臺上,該手機的未拆封報價甚至一度被炒至7999~9999元。
然而,這種“上帝之手”般的跨應用能力迅速觸碰了互聯網行業的逆鱗。而后,微信、淘寶及多家銀行APP隨即啟動了防御機制。用戶反饋,當豆包助手嘗試接管微信或淘寶時,會出現異常退出、風險提示甚至封號的情況。大廠們給出的理由是“安全與隱私”,但行業普遍認為,本質上這是對流量入口和數據控制權的殊死保衛戰。
就在行業以為AI手機將因巨頭封鎖而陷入短暫沉寂之際,智譜AI投下了一枚重磅炸彈。
據智譜官方通稿顯示,AutoGLM項目正式在GitHub上線,開源了包括訓練好的核心模型、Phone Use能力框架與工具鏈,以及覆蓋50+高頻中文App的可跑通Demo。智譜方面明確表示:
“這件事只在一家公司做,是不夠的。AutoGLM 開源的第一層初衷,是把這一層能力變成整個行業可以共同擁有、共同打磨的公共底座。”
市場分析人士指出,這一舉措的殺傷力在于,它將一項原本被視為“大廠核武器”的技術,變成了所有開發者唾手可得的工具。當技術門檻被夷平,巨頭們或許可以圍剿一款“豆包手機”,卻難以圍剿千千萬萬個基于開源框架自建的個性化Agent。
![]()
圖源:智譜AI官方公眾號 下同
解構:技術底層的“降維打擊”、32個月的“底層突圍”
為什么說這次開源是“掀桌子”?核心在于智譜選擇了一條讓巨頭難以防御的技術路徑。
根據智譜官方發布的技術細節及行業內部的深度拆解,AutoGLM的技術實現具有以下顛覆性特征:
1. 從“亂點”到“可控”的進化:
據智譜官方透露,AutoGLM的研發始于2023年4月。早期系統經常“迷失”在手機操作中,但經過32個月的打磨,團隊建立了一整套Phone Use能力框架,將點擊、滑動、輸入、界面理解抽象化。2024年11月,AutoGLM發出了人類歷史上第一個由AI完成的手機紅包——不是通過API,而是AI真正“看懂”了界面并完成了操作。
![]()
2. 視覺大模型+ADB的“降維打擊”:
不同于傳統腳本依賴易被封禁的無障礙服務(Accessibility),AutoGLM在底層調用了ADB(Android Debug Bridge)指令,并結合視覺大模型(AutoGLM-Phone-9B)。其運行邏輯是“看屏幕截圖 -> 大模型分析 -> 模擬手指點擊”。這種基于視覺的“類人操作”,讓APP廠商通過簡單的代碼檢測進行防御變得極其困難。只要人眼能看懂界面,AI就能操作。
![]()
![]()
3. 隱私問題的“終極解法”、繞過易被圍剿的接口:
針對大廠“圍剿”的理由——隱私安全,智譜在開源公告中給出了明確回應:“技術向整個生態開放,數據與隱私,永遠留在使用方這一側。” AutoGLM支持私有化部署,通過MobileRL等強化學習算法在云端虛擬手機中訓練,而實際運行時,企業和開發者可以在自己的合規環境中掌控數據。AutoGLM支持本地部署模式,模型運行和數據處理均在用戶設備端完成,數據不出手機。這種架構設計直接瓦解了互聯網大廠以“隱私泄露”為由進行圍剿的合法性基礎。
![]()
影響:手機產業的“智駕時刻”
站在投資者和行業發展的角度審視,智譜AutoGLM的開源具有里程碑式的意義,其不僅關乎技術,更關乎商業模式的重構。
1. 硬件廠商的“新賽點”
中信證券在12月5日的研報中指出,AI Agent之于手機,正如自動駕駛之于汽車。此前,手機廠商苦于缺乏能夠打通所有APP的超級入口,而AutoGLM的開源為榮耀、小米、OPPO等廠商,甚至中小硬件開發者提供了現成的技術底座。參考汽車行業“華為+賽力斯”的智選模式,未來“大模型廠商+手機廠商”的深度綁定將成為常態,AI手機有望迎來類似新能源汽車的爆發式增長。
![]()
2. 互聯網生態的“倒逼機制”
對于騰訊、阿里等互聯網巨頭而言,護城河正面臨嚴峻挑戰。當用戶可以通過AI Agent繞過APP的首頁推薦、廣告位,直接觸達核心服務(如直接訂票、比價購物),超級APP的流量分發邏輯將失效。智譜的開源將這種能力泛化后,巨頭們面臨的選擇只剩下兩個:要么繼續修筑高墻,冒著用戶體驗下降的風險死守;要么主動坐上談判桌,開放API,與AI Agent共建新生態。
3. 個體開發者的“賦能”
正如Linux開源推動了操作系統的普及,Stable Diffusion開源引爆了AI繪畫,AutoGLM的開源標志著手機Agent進入了“可編程”時代。未來,基于該框架,可能會誕生出專門服務于視障人士的公益Agent、專注于特定工作流的效率Agent,甚至是完全個性化的私人助理。
結語:新舊秩序的交替
2025年12月,從豆包手機的“沖鋒”到智譜AutoGLM的“開源”,短短十天內,中國互聯網經歷了一場關于入口、流量與控制權的劇烈震蕩。
AutoGLM的開源,實際上是把選擇權交還給了用戶和開發者。它宣告了僅僅依靠封閉生態和流量壟斷的時代正在過去。雖然當下的體驗或許還存在延遲或不穩定性,但智能體時代的到來無法阻擋。
對于市場而言,這不僅僅是一個技術新聞,更是一個明確的信號:智能終端的交互邏輯正在發生根本性逆轉,一個新的萬億級賽道——端側智能體經濟,已經轟然開啟。
開源地址可戳:https://github.com/zai-org/Open-AutoGLM
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.