![]()
回看移動互聯網的爆發原點,蘋果的偉大之處不止于iPhone的硬件參數,更在于它通過App Store建立了一套契合用戶需求的移動互聯網的軟件生態。
借用歷史視角回望,我們或能窺見未來“iPhone”的雛形。
其軟件價值是一種能繁榮Agent生態的聚合能力,其硬件形態也未必是手機,甚至可能是眼鏡、頭顯、手表等其他智能終端。
作者|妍旭
出品|產業家
從最初的“AI是不是噱頭”,到“AI只是多了個語音助手”,再到“AI功能很酷,但并不常用”……在定義何為“真正的AI手機”這件事上,行業始終爭論不休。
但最近發生的幾件事,把“AI手機未來該往哪走”這一問題推到了臺前。
一邊是終端廠商的系統級融合。如字節豆包與中興合作推出AI手機,試圖將大模型作為底層原力注入硬件。再如向來奉行封閉生態的蘋果,開始在系統級AI上向外“借腦”,和谷歌、微軟等外部大模型合作,用于升級Siri及Apple Intelligence功能。
另一邊是應用巨頭的“生態自建”。在騰訊2025年Q3財報電話會上,騰訊總裁劉熾平明確表示,微信會推出一個AI智能體(Agent),使它成為每位微信用戶的個性化私人助理。
1月15日,阿里旗下千問APP宣布全面接入淘寶、支付寶、淘寶閃購、飛豬、高德等阿里生態業務,用戶通過語音或文字指令即可30秒完成跨平臺復雜任務如點外賣、買東西、訂機酒等。
看似分散的諸多事件,共同指向一個極具張力的宏大猜想:手機這個終端,正在從一個“裝滿APP的屏幕”,進化為一個有自主性和感知決策能力的“AI入口”。
一、AI手機,路徑分野
2023年10月,高通發布驍龍8Gen3,聯發科推出天璣9300,NPU性能的暴漲讓手機+AI大模型成為現實。Deepseek爆火帶動生成式AI應用全面開花,C端用戶的AI需求被徹底點燃。
技術條件成熟,應用需求得到驗證,AI手機也從概念走向規模化。IDC中國區總裁霍錦潔表示,2024年全球新一代AI手機出貨量將達到1.7億部,占智能手機整體出貨量的15%。行業預計2026年全球AI手機滲透率將突破38%。
![]()
時至今日,圍繞AI手機,業內已然分化出兩條截然不同的演進路徑。
一條是由操作系統或終端廠商主導的AI原生化,也就是我們常說的GUI Agent。它并不要求應用本身為AI做出改造,而是試圖讓AI像人一樣理解、操作界面。
豆包AI手機是GUI最為典型的落地樣本。去年12月,豆包手機助手技術預覽版發布,首次將“AI接管決策”這一設想在終端完整呈現。用戶只需一句「幫我比價下單」,手機頁面開始自動跳轉、識別界面、點擊按鈕、領券、結算,全程不依賴任何官方接口。這種近乎擬人化的操作拓展了AI手機的想象邊界,迅速在科技圈引發熱烈討論。
魅族也是GUI路線的推崇者,它是國內最早提出“視覺一體化”概念的廠商之一。在去年5月最新發布的Flyme AIOS 2操作系統中,其搭載的“Task Robot”便是旨在由AI模擬人工在GUI界面上進行點擊和操作。
![]()
另一條是由應用巨頭主導的業務AI化。它不依賴對人類操作行為的模擬,而是通過A2A(Agent to Agent)的方式,在應用內部拆解出可被調用的能力模塊。各Agent之間通過統一協議直接交換數據、調用功能,從底層完成任務協作,繞過“看屏幕、點按鈕”這一中間環節。
阿里千問和未來將要推出的騰訊微信Agent便是這一路線的踐行者。前者通過MCP+A2A的通用Agent體系,把淘寶、飛豬、支付寶、高德等拆成大量原子能力,接入“任務助理”;后者則被業界普遍預期,會把微信、企業微信、小程序等生態能力全面Agent化。
對用戶來說,只需一句自然語言指令,便可以觸發跨搜索、社交、支付、出行等多業務協作,真正體現出“任務拆解+跨服務調用”的A2A精髓。
在剛剛結束的千問發布會上,這一路線的落地效果有了更直觀的呈現。用戶只需一句「幫我點40杯霸王茶姬的伯牙絕弦」,千問即可在不跳轉頁面的情況下完成選品、下單和支付,幾分鐘后奶茶送達;輸入「春節帶家人去三亞」或「幫我規劃云南旅行」,千問則會聯動飛豬和高德完成機票、酒店、行程規劃及必要電話確認,實現“一句話,整套行程自動排好”;在政務和民生服務中,如用戶問「杭州戶口如何辦理護照」,千問不僅能講清政策和材料清單,還可直接給出線上辦理入口,幫助用戶少跑冤枉路。
如千問C端事業群總裁吳嘉在發布會上所言,“AI在擁有超強大腦之后,開始長出了能夠觸達真實世界的手和腳,在生活中實實在在地替用戶干活。”
![]()
兩條路線各有所長。GUI路線最大優勢在于“無感兼容”,理論上,AI只要能看懂屏幕,就能直接完成操作,A2A由于是通過協議直接調用APP,其執行的精準度與響應速度遠高于模擬點擊,在效率和準確性上更優,也更適合交易、支付、履約等高價值、高風險場景。
目前來看,兩條路線雖然都撞上了既有APP生態的“柏林墻”,但GUI路線下,由于涉及更多系統級權限與隱私數據,相關風險更早暴露,落地過程中的摩擦與阻力也更加明顯。
豆包手機限量發售后僅2-3天,微信、支付寶、美團、以及建行、農行等主流銀行APP,便已經對豆包式的自動化操作做了不同程度的技術和風控限制:有的觸發安全風控導致登錄異常,有的直接識別并屏蔽此類“代操作”行為。
系統級AI的控制權,幾乎是所有手機廠商都不愿外放的底牌,必須握在自己手中。這也導致豆包手機雖然在交互創新上給出了積極的探索,但短期內還是很難進入國內頭部手機廠商的合作視野。
所以我們會看到,華為、榮耀、小米等頭部手機廠商一邊對豆包助手在OS做系統層掐斷(如權限拒絕),一邊力推自家AI助手。華為升級“小藝”把智能體深度綁定進鴻蒙生態,小米以“超級小愛”承接系統級多模態交互與跨應用執行,榮耀則在發布會上讓YOYO上演“一口氣點2000杯咖啡”的花活兒,向用戶展示出“系統級會動手”。
某種程度上,這是手機廠商們在用“自有智能體”替代“外來總管”,展示出其既要占住AI入口,又要守住生態主導權的決心。
![]()
相比之下,雖然能預見的是,A2A同樣繞不開不同應用廠商“商業授權”這道坎,卻已是目前在局部范圍內展現出的“最優解”。
阿里千問系Agent或微信Agent,通過自有生態內的高頻、高價值場景,驗證A2A路線的技術可靠性,實現“小原生”,再以統一協議和成熟范式為樣板,逐步對外開放接口,吸引更多第三方服務以“接入Agent網絡”的方式走向“更大的原生”。
據了解,吳嘉還在千問發布會后的采訪中透露,“除了接入阿里生態,千問會在未來接入第三方的產品,這件事已在討論中。”
至少在現階段,這種從內部生長出來的秩序,比強行接管外部APP的GUI路線面臨的阻力要更小。
二、可控性進化:
AI手機的第一要義
從演進方向來看,GUI更像從更高一級調度層出發,“自上而下”統籌各類應用,A2A則像由業務自身先完成智能體改造,再逐步形成協作網絡的“自下而上”。
若論體驗感,GUI路線明顯更優,因為它更“未來”,用戶很容易在演示場景中發現“Aha moment”。若論成熟度和穩定性,A2A路線有更大概率發展成可持續的基礎能力,也符合AI手機的演進方向。

(豆包手機演示圖)
但這并不意味著兩條路線必然走向對立。OPPO ColorOS智慧產品研發負責人姜昱辰就曾在采訪中提到,“OPPO將采取差異化策略,針對社交、支付等高頻使用場景,優先構建智能體間的直接通信協議;而對于低頻長尾需求,則保留圖形界面交互作為補充方案。”
這背后,其實對應著兩種截然不同的技術范式:AI是“模擬人做事”,還是“直接調用能力”。GUI Agent在簡單場景下尚可奏效,但一旦涉及多步驟、多分支的復雜任務,穩定性就會下降。
相比之下,當AI是從應用本身出發,完成從APP到Agent的升級,其基于工作流的進化和理解是循序漸進的,與之對應的是復雜任務成功率也會顯著提升。由此可見,AI Agent競爭的核心,不止在于“能力有多強”,更在于“是否足夠可控”。
真正的分水嶺,出現在合規與責任界定。中國信通院牽頭發布的《端云協同智能體交互雙重授權安全指引》,重點提到了“構建由用戶和應用雙重授權的安全機制”,明確智能體AI“需同時獲得應用授權與用戶授權,才能合法訪問第三方應用”。
![]()
GUI Agent繞過了應用對AI許可授權的過程,一旦在支付、游戲、金融等場景出現損失或爭議,就會面臨責任歸屬的難題:這是用戶“自作主張”的后果?是AI服務提供方的責任?還是應用方沒有做好防護?在沒有“用戶+應用雙重授權”的前提下,很難建立一套各方都認可的責任與合規框架。
隱私與數據安全,進一步放大了GUI路線的風險。為了跨APP代操作,GUI Agent往往需要使用諸如READ_FRAME_BUFFER、INJECT_EVENTS這類系統級敏感權限,直接讀取屏幕畫面、模擬點擊與輸入。
對普通用戶而言,這等價于把自己的聊天記錄、支付頁面、驗證碼輸入、銀行余額,一次性暴露給一個“看不見的助手”。即便產品方聲稱“數據不上云”“截圖不存儲”,用戶也很難真正理解數據在本地和云端之間的流動路徑,信任門檻非常高。
這種擔憂并非用戶的“技術焦慮”,而是已經在行業內部被反復討論的現實風險。中國信通院數安智庫專家曾令平接受媒體采訪時坦言,系統級AI確實存在多重風險。
“頂格的系統權限如同開‘后門’,可讀取屏幕上的所有信息,包括各種隱私數據;模擬點擊功能可能被惡意利用,威脅資金安全;部分廠商權限開通不透明,責任劃分模糊,也會放大安全隱患。”
從現實反饋來看,監管與頭部平臺對這種可能“越權”的系統級能力始終保持高度警惕。一旦允許某個外部智能體在屏幕層面對金融操作、登錄驗證進行自動化處理,從技術上就必須假設:只要有權限,就存在被惡意濫用、被中間人攻擊或被其他惡意程序劫持的可能。這也是為何在豆包手機助手的測試階段,銀行、支付類應用的自動化能力很快就被主動收縮和下線。
![]()
(OWASP(開放全球應用安全項目)發布的《2026年智能體應用安全十大風險》“身份與權限濫用”是十大風險之一)
與之對應,A2A路線在設計之初便明確區分了角色邊界:人是決策主體,AI負責執行和優化。用戶負責給出目標與偏好,主Agent拆解任務并規劃步驟,子Agent則在各自業務域內,調用經過應用方授權和封裝的能力,在可控邊界內協同完成任務。
在這一過程中,“用戶授權”和“應用授權”被天然地綁定在一起:應用方通過協議公開哪些能力可以被智能體調用、調用頻率如何限制、涉及哪些數據字段,這構成了“應用授權”的硬邊界,也讓用戶更容易理解AI的能力范圍。
與此同時,用戶會在具體場景里授權某個Agent代表自己調用這些能力,并在關鍵決策節點給予確認。
AI提出建議,人來拍板,最終由業務方按照協議執行。既降低了對系統級高權限的依賴,也將隱私與責任問題拆解到更細粒度的接口與交互之中,更易被監管接受,也便于平臺審計。
如果再把時間周期拉長,A2A更等同于搭建了一個有APP安全和數據安全協議底層的“超級Agent”。
它的進化方式并非推翻現有生態,而是基于既有的用戶行為邏輯,在保留現階段軟件生態、APP生態基礎和商業價值生態的基礎之上,向AI邁出一步,為C端用戶提供一種有真實體感的“體驗附加項”。
這也更符合近兩年被頻繁提及的“人本智能(Human-Centered AI)”理念,即AI的核心價值并非取代人,而是在安全、可控的邊界內,承接人的目標與責任,把技術能力轉化為對教育、醫療等普惠場景的真實改善。
![]()
當然,A2A路線也并非全無挑戰,隨著千問、微信等超級Agent繼續向前演進,超級Agent之間如何打通協作,不同生態中誰作為主Agent、誰作為子Agent,以及底層模型之間的語義差異等等,都是繞不開的問題。
試想一下,未來的某一天,你讓淘寶Agent負責采購野餐裝備,同時調用美團Agent訂附近的下午茶。但在兩個Agent的“對話”中,兩者對“即時送達”的理解并不一致——淘寶認為是“當天可送”,而美團默認的是“30分鐘內送達”。
結果在協商配送時間時,系統給出了一個雙方都無法兌現的承諾:本該“無貨”的商品,被包裝成了“換個口味即可立刻送達”,最終導致訂單失敗,用戶白等一場。
但博弈往往是新秩序的前奏,就像過去二十年,互聯網依賴HTTP、TCP/IP這樣的底層共識運行,隨著技術革新的深化,不排除未來政策或行業層面可能出現“超級Agent to超級Agent”的公共協議。到那時,AI手機才真正推開了通往全能交互的大門。
三、終極猜想:尋找AI時代的「iPhone」
如果說移動互聯網時代的核心產品邏輯,是“以APP為中心組織服務”,那么AI時代正在浮現的,是一個以Agent為中心重構產品、生態與用戶體驗的新范式。
回看移動互聯網的爆發原點,蘋果的偉大之處不止于iPhone的硬件參數,更在于它通過App Store建立了一套契合用戶需求的移動互聯網的軟件生態。
借用歷史視角回望,我們或能窺見未來“iPhone”的雛形。
其軟件價值是一種能繁榮Agent生態的聚合能力,其硬件形態也未必是手機,甚至可能是眼鏡、頭顯、手表等其他智能終端。
當應用不再是靜止的圖標,而是以Agent的形式流動起來時,AI的角色也隨之發生改變。它不再只是提升點擊效率的輔助工具,而是開始真正介入并重塑價值創造的核心環節。
當AI Agent成為連接用戶與服務的核心入口,競爭的焦點也不再是“誰占據了用戶更多時間”,而是誰更高效地完成了用戶的真實需求——“流量”從“時間占有”升級為“需求滿足”。
事實上,Agent從“工具”進化為“服務主體”已逐漸成為業內共識。微軟CEO薩提亞·納德拉在微軟Build 2025開發者大會上提到,AI不只是協作工具,更是可被信賴的數字同事,能夠獨立思考、執行任務。
OpenAI CEO薩姆·奧特曼也在2025年的訪談中提到,AI正在經歷從“推理引擎”到“個人代理(Personal Agent)”的跨越。
當用戶選擇某個Agent,本質上是在選擇一個能代替自己做決策的“智能服務商”。這也對未來的AI終端提出了更高要求:它不僅要理解指令,更要理解用戶背后的利益邊界、風險偏好與決策底線。
因此,無論是AI手機,還是未來可能出現的其他AI終端,本質上都是AI Agent的硬件載體,而非Agent本身。其核心演進邏輯,都應遵循“人本位”原則,即AI不應越俎代庖代替人類做決策。
這一判斷,也與另一個正在顯現的大趨勢相呼應——AI時代,價值將更加集中地體現為企業可被Agent調用和放大的核心能力,比如阿里、京東的電商履約,比如騰訊的社交關系鏈等等,都被轉化為一個明確的AI價值符號,最終這些符號進行排列組合,企業之間不斷聚合協同,形成更極致的終極AGI產品。
近期國家市場監管總局對外賣行業巨頭及攜程的約談,釋放出一個清晰信號:協同聚合是符合社會價值的,平臺“通吃”單打獨斗反而會帶來更大的用戶和商業風險。
這意味著,未來的“終端霸主”,需在商業變現、生態公平之間找到最優用戶需求價值,和最優社會穩定價值的平衡點。
雖道阻且長,但沸騰推動進步,我們或許仍無法準確描繪AI時代「iPhone」的最終形態,但可以確信的是——它一定誕生于Agent生態真正繁榮、協同而非通吃成為共識的那一刻。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.