本文系基于公開資料撰寫,僅作為信息交流之用,不構成任何投資建議
![]()
過去一周,中國AI領域接連發生的兩件事,形成了一組微妙的對應:字節跳動率先推出可實際體驗的“豆包AI手機”,讓人工智能大模型得以直接操控設備;緊接著,智譜宣布開源AutoGLM,相當于把“用AI操作手機”這項能力向所有人開放。
然而,新技術的亮相,迅速演變為一場遠超預期的爭議。
風暴的中心,正是那臺“豆包AI手機”——這款將大模型能力深植于操作系統底層的工程樣機“努比亞M153”,甫一問世,便遭遇微信、淘寶、美團等超級應用,以及多家高敏感度銀行應用的聯手抵制:或被拒絕登錄,或被持續彈出安全警告。
爭議的焦點,也隨之從對AI功能的驚嘆,迅速轉向其依賴的高系統權限(INJECT_EVENTS)所引發的隱私安全憂慮,乃至更深層的商業模式沖擊。一場關于技術邊界、數據主權與商業利益的激烈辯論,就此爆發。
相較于此前被輿論放大的商業競爭敘事,我更愿意從程序員的視角,探尋這場交鋒背后的深層邏輯與潛在含義。
01
這讓我想起了“Python”
談到“AI手機”(或稱AI手機助手),我第一個聯想到的,就是Python。
提起Python,許多人都不會陌生。1989年圣誕節,荷蘭程序員Guido van Rossum因不滿C語言之繁瑣、Shell腳本之簡陋,在閑暇之余創制了這門兼具功能完整與語法簡潔的新腳本語言。
此后,Python并未選擇與C++競逐性能,而是獨辟蹊徑,將“開發效率”奉為核心。在摩爾定律持續生效的年代,程序員的時間成本逐漸超越機器時間,Python恰好押中了未來:讓人更好用,比讓機器好用更有價值。
當然,C++作為經典編程語言并未因此失色。本質上,Python作為解釋型語言運行效率并不高,但其最擅長的,正是調用C/C++編寫的庫。面對高性能任務時,用C++完成底層實現,再封裝為Python接口,便能以一行Python代碼調動數千行C++邏輯。
隨著近年人工智能的興起,Python更成為深度學習框架TensorFlow與PyTorch的首選接口——想做AI,幾乎繞不開Python。
回看AI手機所做之事,與Python的思路高度相似:
Python的邏輯是:C++寫起來太麻煩,我用簡單的API在底層調用它。
AI手機的邏輯則是:App操作太繁瑣,我用自然語言在底層模擬點擊、串聯服務。
對普通用戶而言,AI手機的核心價值在于省時與提效——這與Python的定位高度契合。Python不與C++比拼性能,而是通過簡潔的接口調用底層復雜功能,最終成為連接人類邏輯與機器算力的橋梁。
但兩者的生態命運卻截然不同:Python與C++形成了經典的共生關系:C++開發者樂于讓自己的庫被Python調用,從而擴大影響力;豆包手機助手面臨的,卻是“生態抵抗”——微信、淘寶等應用不愿被AI直接調用,如同要求用戶“必須親手寫C++”,手動點擊、觀看廣告。
當深度學習的需求從服務器蔓延至手機,即便是C++、Java這樣的語言,也不得不為Python的易用性讓路。
AI手機未必能成為移動領域的Python,但“Python式”的演進方向——讓人更便捷地調動底層能力——已是清晰可見的趨勢。編程語言的演進早已揭示方向:技術的終極善意,是讓人做得更少,而非更多。
我們眼前正在發生的,不僅是一款新工具的出現,也不僅是字節與騰訊們的商業博弈,而是從“打開一個個App”到“AI串聯生成所有功能”的移動互聯網范式遷移。
因此,這場爭議遠不止于技術或商業競爭,本質上是“AI代理”新范式與“App中心化”舊秩序之間的激烈碰撞。我們目睹的,正是從“打開應用”到“AI生成服務”的范式轉移前夜。
02
AI手機的“Python之困”
如果說Python的成功源于與底層生態(C++庫)的和諧共生,那么豆包手機助手眼下正深陷“Python之困”——它急需調用的“庫”(各類App)并不愿被輕易“導入”。
實現跨應用自動化的核心技術之一,是獲取Android系統的INJECT_EVENTS
(注入事件)權限。這一權限允許應用模擬用戶的觸摸與點擊,堪稱系統級的“上帝之手”,也隨即引發了用戶對隱私與資金安全的強烈擔憂:一個擁有如此高階權限的AI,是否可能失控?
盡管豆包官方多次聲明所有操作需經用戶明確授權,敏感環節(如支付)會暫停并交由用戶手動完成,且承諾數據不用于訓練,但疑慮并未全然消散——用戶未必總是在充分理解后果的情況下授權,也難以實時監控AI的每一步行動。
更深層的阻力,源自商業利益的根本沖突。
互聯網平臺的“護城河”,正是建立在用戶必須打開App這一行為之上。AI助手繞過應用界面、直接調用服務,無異于架空應用的流量入口與交互價值。這已不是簡單的功能競爭,而是“入口控制權”與“數據主權”的爭奪。
一言以蔽之,AI手機助手觸動的,是互聯網商業模式的根基。因此,各大應用的“封堵”絕非偶然。
作為對排山倒海而來的阻力的應對,豆包已于12月5日宣布對AI操作能力進行規范化調整,暫時下線金融、支付類應用的操作能力,并限制刷分、刷激勵及部分游戲場景。這既是對安全關切的回應,也是在生態摩擦下的階段性妥協。
02
更大可能的演進邏輯
如果說字節發布的“豆包手機助手”是對App城墻發起的一次“奇襲”,那么智譜開源AutoGLM,則無異于在關鍵時刻,向戰場投下了一把更具普惠性的“攻城錘”。
事實上,智譜此舉并非首次嘗試。AutoGLM項目已持續演進一年有余,其早期形態依賴“云手機”環境,功能已與豆包助手相似。
此次開源雖未引發同等規模的商業震動,但從技術演進的角度看,其意義或許更為深遠。
字節的路徑是“單點突破”,而豆包手機助手所遭遇的封禁,也印證了這種路徑在當下生態中的局限——超級應用能夠通過點對點的防御輕易化解。但開源,卻可能發揮出“分布式”的力量。
一個有技術能力的學生,即可下載代碼、進行微調并部署于自己的設備中;更不必說大量開發者與公司,正等待在城墻松動時分得一杯羹。這不再是單次進攻,而是一場可能多點開花的“滲透戰”。
技術史上不乏相似的情節。2001年,微軟時任CEO史蒂夫·鮑爾默曾將Linux稱為“癌癥”,并試圖遏制其發展。然而,抵抗的結果并非開源技術的消亡,而是微軟最終全面擁抱Linux。當一項技術擺脫單一產品的形態,成為一種開放、普適的生態基礎時,封閉體系便難以僅靠“封殺”來固守。
如今的AI手機助手,正面臨相似的關口。一旦它從某個公司的“功能”進化為開發者皆可參與建設的“通用能力”,現有應用生態將面臨根本性的挑戰。盡管“安全性”始終是合理的質疑焦點,但其作為防御理由的邊際效應可能遞減——進入互聯網時代以來,人們早已在諸多場景中,為便利而讓渡了部分隱私。
短期內,視覺識別(CV)與多模態模型的持續進化,仍將為AI助手提供繞過API封鎖的技術路徑。長期看,更優雅的解決方案或許是走向類似MCP的標準化接口,讓App將核心功能封裝為安全的“能力組件”供AI調用。然而,讓各大平臺自愿開放接口,注定是一場漫長的博弈。
因此,最具可行性的“下一代Python”,或許將內生于操作系統本身。無論是iOS、Android還是HarmonyOS,由系統提供原生的AI代理服務,在權限管理與生態協調上具備天然優勢。
主流手機廠商也早已將自研AI助手定為核心戰略,系統層的AI主導權之爭,實則早已悄然展開。
03
終局勝利屬于誰?
Python沒有取代C++,App也不會被AI助手完全取代。
短期來看,博弈仍將繼續。騰訊、阿里等巨頭完全有能力——且正在推進——開發各自的“微信助手”、“淘寶助手”,在生態內部提升自動化體驗。然而,這類“各掃門前雪”的策略,難以孕育出那個能夠連接一切的“Python”。
技術演進的常見結局,是能力的下沉與融合:復雜功能被封裝成簡潔接口,從而催生新的產業層級與協作規則。
真正的“Python”,將是那個在技術可能性、商業利益與用戶權益之間找到最佳平衡的“連接器”。它可能源自開源社區的集體智慧,也可能誕生于操作系統廠商的頂層設計,但必然建立在行業廣泛接受的協議與標準之上。
據稱,相關行業機構已開始探討制定相關標準,強調“雙重授權”等原則,這預示著AI Agent的發展正從“野蠻生長”轉向“規范發展”。我們正站在交互范式切換的隘口,爭議、沖突與妥協,都是必經之路。
歷史不會重復,卻常押著相似的韻腳。
豆包手機助手與AutoGLM開源所引發的這場風波,或許正是這個時代更為復雜的“Python故事”跌宕起伏的開篇。最終,勝利不會歸于任何單一公司,而將屬于那個能讓技術善意、商業理性與用戶價值協同演進的新規則。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.