網易首頁 > 網易號 > 正文申請入駐

AI超級入口的另一種可能

2026-03-12 19:57:48　來源: 胡說成理

河南舉報

分享至

春節(jié)復工后的兩周不到的時間里，就已經很少有人再談論春節(jié)期間的AI入口大戰(zhàn)，公眾的注意力轉移到了OpenClaw上，在一種難言的FOMO情緒下，各種“龍蝦學習群”人滿為患、OpenClaw的部署教程一賣就是幾十萬、甚至在線下上門安裝OpenClaw居然成為一門生意。

這一次，手機端跟進也非常快，多家企業(yè)放出擬推出移動端 claw的消息；而3月11日，華為終端BG首席執(zhí)行官何剛正式曬出鴻蒙版小藝Claw Beta界面，體驗數(shù)日后直言 “很驚喜，挺好用的”。

這不是單純的追熱點，而是反映了手機特別是能夠自研操作系統(tǒng)的手機廠商，對于智能體這個關鍵詞的高度敏感和及時卡位。

那么，AI原生的時代，就以這種出人意料的方式降臨了嗎？

我認為恰恰相反——OpenClaw的爆火，確實證明了人們對一個“系統(tǒng)級AI助手”的渴望，但實話實說，它的誕生方式，大概率不是通過Claw這種方式：它的確是低門檻，但絕不是無門檻。

OpenClaw只是證明了人們對“AI原生+本地部署”的渴望，但真正實現(xiàn)這種能力的，可能并不是OpenClaw這種形態(tài)，而是更先天的被內置在操作系統(tǒng)的底層能力里。

只有掌握了對操作系統(tǒng)的深度定義權，才最有可能在競逐“AI第一入口”的長跑中，后來居上。

——導語

一場被忽視的發(fā)布會

2月25日是大年初九，一場在海外舉行的發(fā)布會，在國內沒有激起一點水花，幾乎無人關注。

這天，是三星Galaxy S26系列新機的發(fā)布會，引起關注的是一段簡單的演示——用戶對著手機說“幫我叫個Uber去機場”，手機就在后臺自動打開應用、讀取當前位置、選擇車型、估價，整個過程無需切換App，只需用戶最后確認支付。

在海外用戶高叫這次活動帶來了“驚喜甚至驚嚇”的時候，中國用戶之所以付之以沉默，真實的原因僅有一個——我們對這種演示已經審美疲勞甚至深度怯魅了。

在國產手機2025年甚至2024年的發(fā)布會上，還有哪家國產手機廠商沒有展示過這種“系統(tǒng)級能力”嗎？

某種程度上講，這從一個側面證明了，中國AI在應用層面已經跑到了全球的前面，而非尾隨。

但回歸到這次發(fā)布會的時點，它和國內的春晚AI紅包大戰(zhàn)并非沒有聯(lián)系，而是基于一個同樣的背景——AI在用戶側的第一入口之戰(zhàn)，比我們想象的開始的更早、更隱秘、更底層。

雖然大家都叫“手機AI入口”，但嚴格說來，它們的底層邏輯并不相同，競爭走向也絕不相似。

因此，我將之分類為“超級外掛式入口”、“系統(tǒng)級外掛入口”和“系統(tǒng)原生級入口”。

第一種“超級外掛式入口”，也就是我們在春晚紅包大戰(zhàn)中看到的幾大巨頭的新APP。它們的特點是適配性最好——不挑機型、不挑配置、即下即用、界面友好；但它們較大的短板是——和系統(tǒng)之間是純粹的操作系統(tǒng)-APP式的主從關系。這種外掛式的連接方式，決定了它們在調動手機的本地能力、本地應用、獲得授權等方面是困難重重、壁壘無數(shù)的——特別是在強調數(shù)據(jù)安全，操作系統(tǒng)日益收緊系統(tǒng)權限的當下。

第二種我稱之為“系統(tǒng)級外掛入口”，前一段時間引發(fā)廣泛關注的豆包手機，就基本是這一核心路徑的代表——端云協(xié)同GUI操作。

所謂端云協(xié)同GUI操作，通俗的說，是一種“模擬人類操作APP”的方式完成工作流——在你看似手機“自動”執(zhí)行的每一步操作的背后，后臺的工作邏輯是不斷截圖上傳至云端讓模型識別確認，然后完成一次次虛擬點擊——也就是說，相當于讓AI代替人來操作各個APP。

這就是此前豆包x努比亞的AI手機的工作方式，它自有先天的優(yōu)點，就是普適性極強。理論上說，只要云端大模型能力足夠，任何APP的界面交互，AI都能完成，尤其不需要對APP進行一對一的適配。

因此，這款手機在國內外剛發(fā)布時，吸引了大量關注，有媒體甚至稱為“AI原生手機的先鋒”，這并不是過譽。

但是，這種模式的缺點也是顯而易見的——它的流暢運行，基于后臺的無數(shù)次截圖上傳，因此高度依賴網絡的穩(wěn)定性，任務執(zhí)行效率相對較低，時延明顯。

之所以此后激發(fā)了一輪大廠的抵制，更不僅僅是出于對用戶側的安全隱患的考量，還在于大廠也的多重考慮。

從利益角度，讀屏模式動了超級APP的商業(yè)根基——如果智能體執(zhí)行任務時，用戶無需操作APP就能完成全鏈路操作，就會導致最常見的開屏廣告和APP內廣告形同虛設，直接截流用戶時長和廣告曝光，顛覆了“入口=流量=收入”的移動互聯(lián)網基本商業(yè)模式。

從安全角度說，一個APP如果無法管控用戶數(shù)據(jù)流轉，無法履行數(shù)據(jù)安全主體責任，目前仍是不可想象的，更重要的是，這種“擬人操作”如果在系統(tǒng)層沒有得到監(jiān)管，對用戶隱私、數(shù)據(jù)安全性的保護上，是最容易受到質疑的。因為其調用的是系統(tǒng)底層權限，能截屏到安全窗口這種本應受高度保護的界面。

那么，還有直接點的辦法嗎？這就是第三種方案：“系統(tǒng)級原生調用”，這種方式不需要屏幕截圖，AI助理甚至不需要打開APP，而是通過協(xié)議直接和APP交互數(shù)據(jù)，各APP之間（也是各Agen之間）也通過協(xié)議直接交互數(shù)據(jù)。

但事情的微妙之處也在這個層面，同為“系統(tǒng)級調用”，實現(xiàn)的路徑大不相同。

對于安卓/IOS系統(tǒng)來說，它的基礎設計是：用戶明確打開某個 App，在那個 App 的 UI 內完成任務。

它的表層難度是，AI 要把“用戶的模糊意圖”翻譯成“多 App 動作鏈”，屬于典型的后加（外掛）能力，會天然和原來的默認路徑發(fā)生摩擦。這就需要1:1的調優(yōu)，因此它的尷尬特別鮮明的體現(xiàn)在——演示的時候無比絲滑，真實環(huán)境下則要么要求用戶頻繁確認、切換、跳轉，要么就需要用戶授以更深的系統(tǒng)權限和接口。

而它的底層難度更反映在，在 App 時代，OS 給 App 的是沙箱 + 權限，不是“把能力貢獻給系統(tǒng)代理”的統(tǒng)一協(xié)議，所以，安卓/IOS不得不別辟蹊徑，通過后天補強的方式給系統(tǒng)“外接”一個新的AI器官。

這也解釋了，作為全球智能手機操作系統(tǒng)市占率最高的安卓的東家+擁有業(yè)界最強模型之一Gemini的谷歌，為什么在2026年的時候才展示較為初級的系統(tǒng)級AI能力；而另一家巨頭蘋果，經過無數(shù)次的跳票和證偽，最后基本落定目前最大概率的方式也是直接集成Gemini。

安卓和IOS的尷尬，是歷史的包袱在面臨時代切換時的必然，但也可能是其落后于時代的開始。

以微軟為例，在PC時代，它在全球計算設備上的覆蓋率近90%（甚至更高），堪稱操作系統(tǒng)的全球主導。但從2017年首次市占率低于安卓后，Windows的覆蓋率如今已經降至約30%，相對損失超過60個百分點的市占率，實際上交出了除桌面計算市場之外的操作系統(tǒng)主導權……而這一切，未必不會在安卓和IOS身上重演。

相對來說，身為全球第三大移動操作系統(tǒng)的鴻蒙，雖然絕對設備量仍然有限，但勝在沒有任何互聯(lián)網時代的包袱。

因此，在這場操作系統(tǒng)級的較量中，華為的鴻蒙展現(xiàn)出了一種獨特的、甚至是具有體系結構優(yōu)勢的“第三種可能”。它不同于安卓和iOS在舊架構上“打補丁”式的AI集成，從設計伊始就是為“原生智能”準備的。2026年MWC上展示的鴻蒙架構，通過微內核的垂直整合，實現(xiàn)了從硬件算力調度到端側模型響應的極致優(yōu)化。

也就是說，通過在理解用戶意圖上的底層意圖框架（Intention Framework）和系統(tǒng)級 Intent 協(xié)議（這也是安卓和蘋果目前補課的重點），這種架構上的領先，讓鴻蒙在處理理解模糊意圖、長任務、多設備協(xié)作、跨應用數(shù)據(jù)流轉時，有著上一代操作系統(tǒng)很難彌補的結構性優(yōu)勢。

但要把結構性優(yōu)勢變成商業(yè)上的勝勢，鴻蒙要走的路還很長。

傳統(tǒng)大廠Agent前的三堵墻

如果遴選一個2025年的年度AI關鍵詞，智能體（Agent）是無二的選擇。

對話智能靠“推理”，行為智能靠“行動”，當我們的注意力從對話機器人開始轉移到智能體身上時，我們也快速的從“對話智能”時代進入了“行動智能”時代。

為什么我認為操作系統(tǒng)級內置的“行動智能調度模塊”具有比“超級外掛式入口”有強得多的潛力，是因為從對話智能向行動智能轉換的過程中，后者會遇到三堵厚墻。

把這三堵墻講清楚，才能解釋為什么“系統(tǒng)級天然入口”更可能成為AI應用的終局形態(tài)。

第一道墻是產品墻，簡言之，人都是懶的——用戶不愿意為了“更聰明”再多裝一個入口。

外掛入口要成功，必須把“使用”變成“默認”。這意味著它不僅要回答得好，還要把“打開它”這件事變得像呼吸一樣自然。而春節(jié)戰(zhàn)役已經證明了，短期內拉新不難，難的是因為無法有效觸達物理世界，很難把一次性嘗鮮變成長期的路徑依賴——至少，除了豆包手機初窺門徑外，其它的對話式智能體雖然口號不同，但已展現(xiàn)出的行為智能能力，可以說乏善可陳。

第二堵墻，是技術墻——跨 App 的行動需要標準化接口、權限治理、可觀測與回滾。

當 Agent 不是給你生成一堆文字，而是替你叫車、下單、改簽、付款時，它必須進入更高權限、更高風險的領域：位置、支付、通訊錄、電話、短信。

這里最難的從來不是“能不能接”，而是“出了事誰負責”。

谷歌在 Galaxy S26 上把“詐騙檢測”這種高敏感能力直接集成到系統(tǒng)電話應用，搭載鴻蒙的mate80能夠在檢測到外界窺視時啟動視覺模糊策略，這都是典型的“系統(tǒng)級治理思路”：高權限能力必須和 OS 的安全邊界綁定。

而外掛式入口想獲得同等信任，需要付出更高成本：既要技術可用，還要治理可信，而后者絕對比前者更難。

第三堵墻，我稱為商業(yè)墻——超級 App，天然不愿把核心能力開放給“可能截流的友商”。

這是外掛入口最現(xiàn)實的難題：當你希望調用外賣、打車、支付、內容時，這些超級 App 會天然警惕：你是入口，也是競爭者；你掌握了路徑，就掌握了流量。

這就造成了，即便“技術上能做，商業(yè)上也未必愿意配合”。所以你會看到，很多外掛式入口哪怕具備強大的智能體調度能力，但最終只能“調起一部分有限的合作方”。這不是能力不行，是“開放接口”幾乎相當于整個移動互聯(lián)網時代“私域化本質”的生態(tài)不正確。

但是我敢說，這種“頭部APP拒止Agent調用”的時代已經快結束了。

無論是國際還是國內，由于智能體蘊含的巨大潛力，目前行業(yè)已形成云/智能企業(yè)倒逼通用協(xié)議誕生的狀態(tài)。

目前，海外主流協(xié)議有Anthropic的MCP協(xié)議、谷歌的安卓AppFunctions框架；國內則有階躍星辰的GUI-MCP協(xié)議；另外，國內的一部分頭部手機廠商，據(jù)信也在聯(lián)合推動國內安卓生態(tài)的AI Agent接口標準統(tǒng)一。

相對而言，鴻蒙在這方面的架構準備、生態(tài)準備和行業(yè)共識引導，更是做的相當有先見性的。

那么，也許你會問我一個問題，為什么鴻蒙生態(tài)目前還沒有出現(xiàn)現(xiàn)象級的智能體生態(tài)爆發(fā)？

水到渠成

其實，關于鴻蒙生態(tài)里的智能體應用的案例，可以說是一直以一種“小火慢燉”的形式在逐漸推進——華為天氣、音樂、瀏覽器等自有應用，主動擁抱 Agent 形態(tài)，已形成示范效應；喜馬拉雅、小紅書、微博智搜等第三方場景，也開始通過系統(tǒng)入口觸發(fā)推薦與問答閉環(huán)。

這其實是Agent落地的一個規(guī)律——優(yōu)先落地的往往是高容錯率、低風險級的業(yè)務，然后逐步走向高風險、高頻業(yè)務。

而且，這些案例，雖然還不夠豐富，但都共同指向一個趨勢：未來用戶對系統(tǒng)級 Agent 的期待，不是“你能不能回答”，而是“你能不能把服務編排得足夠短、足夠順”。

另外，從最新放出的328beta版測試來看，鴻蒙新系統(tǒng)的一個很大賣點，除了底層重構外，端側大模型4.0也第一次被放了出來，這個約10GB的本地大模型，主打一個“本地AI大腦”，完全離線可用。這不但是華為第一次把完整的本地大模型直接部署到手機，讓大量AI計算在手機里完成，速度更快、隱私更安全，也為逐步推進的端云協(xié)同，打下了更深的地基。

其實，稍早前的HDC2025 上，華為就已經發(fā)布鴻蒙智能體框架 HMAF 與《Agent時代，鴻蒙應用生而智能——鴻蒙智能體框架白皮書》，并推出小藝智能體開放平臺，明確提出“系統(tǒng)、應用/元服務與智能體”的協(xié)同范式，目標是讓智能體以更快速度滲透行業(yè)，形成協(xié)同網絡。

如果說安卓的方向，還是有些“半外掛”色彩的“把 Gemini更深度的嵌入系統(tǒng)”，鴻蒙的表述則更具有整體的“框架感”：它試圖定義一個多智能體協(xié)同的操作系統(tǒng)范式——系統(tǒng)級入口不是單個 Agent，而是調度中樞——也就是說，我們熟悉的小藝，未來不再是存在感略弱的“系統(tǒng)助手”，而是定位為系統(tǒng)級智能中樞（而不是一道門），它可拆解復雜任務并調度多智能體協(xié)作完成。

如果要用一句話總結鴻蒙在“行動智能”時代的準備，那就是——在全新的 HMAF 結構下，鴻蒙體驗從“APP觸控”轉向“自然語言交互”，并通過小藝對話、導航條、chips 推薦等系統(tǒng)級分發(fā)入口理解意圖、觸達服務、完成閉環(huán)。

這段描述，其實已經直指“天然入口”的精髓：入口不是下載來的，而是系統(tǒng)原生長出來的——這就是天然入口相當于外掛入口的最大優(yōu)勢，它天然就在那里。

另外，如果說針對外掛入口的瓶頸，是在我們前面說的“三堵墻”，那么小藝這樣的系統(tǒng)級天然入口的優(yōu)勢就在于：它天然穿過了這三堵墻——它并不是要消滅超級 App，而是要把App變成可編排的執(zhí)行單元，把入口變成系統(tǒng)語法，把鴻蒙生態(tài)這個客觀上的第三方，變成智能體爆發(fā)的最佳土壤。

一方面，為了方便APP的接入，小藝智能體開放平臺強調“從開發(fā)到運行到運營”的全流程，并提供 50+ 鴻蒙系統(tǒng)插件、意圖框架兼容 MCP 工具、支持 A2A 多智能體協(xié)同，甚至可通過自然語言創(chuàng)建工作流并自動優(yōu)化提示詞，現(xiàn)在甚至連鴻蒙版的OpenClaw——小藝Claw也被曬出來了。

可以說，從天然的預留架構、到友好的生態(tài)設置再到多元化的部署方式，鴻蒙應該是目前所有移動操作系統(tǒng)中“Agent親和力”最好的一個，它的未來不可限量。

那么，也許你會追問，為什么還不爆發(fā)？

前面說過，行動智能時代的到來，既需要技術上的準備，也需要商業(yè)上的準備。

爆與不爆，一方面取決于前面說的微觀技術準備，另一方面取決于大家都在等待的一個答案——AI時代，到底需要什么樣的應用產品形態(tài)？

如果說，過去16年，移動互聯(lián)網的主體敘事，就是微信、淘寶、美團、抖音等超級APP的成長史，那么，這些超級巨頭的共同特點是：盡可能把用戶的時間和注意力，都留在一個App里。

但智能體時代的底層邏輯變了，它不是要圈住你，而是想成為你和其他App之間的中介。

未來的小藝想承載的，可能是如此——我是天然入口，但我甚至不介意你是否認為我是不是入口，我是一個開放的、本地的、用戶可控制的AI能力層，我足夠第三方、足夠開放，我既不是要搞一個封閉式的花園圍墻，也不是要在你必經的路徑上硬設一個收費站，而是類似于openClaw的邏輯——我是你的使能工具，我最大化的幫你實現(xiàn)一個夢想：“用自然交互的方式指揮我，讓你想去哪就去哪，想完成什么任務就完成什么任務，想調用什么模型就調用什么，而且很安全、很本地，最后的數(shù)據(jù)管轄權還歸你自己。”

如果所有人都意識到這才是未來，那么它火爆的那一天，可能就是明天。

結語：

超級入口的時代，可能要過去了。因為Agent天然是跨域運行的，它的能力上限和價值上限，不完全在于它本身能做什么，而在于它能連接到什么量級、多少數(shù)量的賦能客體。

在這個背景下，總會走到這一天——不再是超級APP放下身段“開放能力”，而是它們自己拆開私域的壁壘，只求得到同等的被調動、被喚起、被使用的機會。

這才是超級智能體存在的更大意義。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.