春節(jié)復工后的兩周不到的時間里,就已經很少有人再談論春節(jié)期間的AI入口大戰(zhàn),公眾的注意力轉移到了OpenClaw上,在一種難言的FOMO情緒下,各種“龍蝦學習群”人滿為患、OpenClaw的部署教程一賣就是幾十萬、甚至在線下上門安裝OpenClaw居然成為一門生意。
這一次,手機端跟進也非常快,多家企業(yè)放出擬推出移動端 claw的消息;而3月11日,華為終端BG首席執(zhí)行官何剛正式曬出鴻蒙版小藝Claw Beta界面,體驗數(shù)日后直言 “很驚喜,挺好用的”。
這不是單純的追熱點,而是反映了手機特別是能夠自研操作系統(tǒng)的手機廠商,對于智能體這個關鍵詞的高度敏感和及時卡位。
那么,AI原生的時代,就以這種出人意料的方式降臨了嗎?
我認為恰恰相反——OpenClaw的爆火,確實證明了人們對一個“系統(tǒng)級AI助手”的渴望,但實話實說,它的誕生方式,大概率不是通過Claw這種方式:它的確是低門檻,但絕不是無門檻。
OpenClaw只是證明了人們對“AI原生+本地部署”的渴望,但真正實現(xiàn)這種能力的,可能并不是OpenClaw這種形態(tài),而是更先天的被內置在操作系統(tǒng)的底層能力里。
只有掌握了對操作系統(tǒng)的深度定義權,才最有可能在競逐“AI第一入口”的長跑中,后來居上。
——導語
01
一場被忽視的發(fā)布會
2月25日是大年初九,一場在海外舉行的發(fā)布會,在國內沒有激起一點水花,幾乎無人關注。
這天,是三星Galaxy S26系列新機的發(fā)布會,引起關注的是一段簡單的演示——用戶對著手機說“幫我叫個Uber去機場”,手機就在后臺自動打開應用、讀取當前位置、選擇車型、估價,整個過程無需切換App,只需用戶最后確認支付。
在海外用戶高叫這次活動帶來了“驚喜甚至驚嚇”的時候,中國用戶之所以付之以沉默,真實的原因僅有一個——我們對這種演示已經審美疲勞甚至深度怯魅了。
在國產手機2025年甚至2024年的發(fā)布會上,還有哪家國產手機廠商沒有展示過這種“系統(tǒng)級能力”嗎?
某種程度上講,這從一個側面證明了,中國AI在應用層面已經跑到了全球的前面,而非尾隨。
但回歸到這次發(fā)布會的時點,它和國內的春晚AI紅包大戰(zhàn)并非沒有聯(lián)系,而是基于一個同樣的背景——AI在用戶側的第一入口之戰(zhàn),比我們想象的開始的更早、更隱秘、更底層。
雖然大家都叫“手機AI入口”,但嚴格說來,它們的底層邏輯并不相同,競爭走向也絕不相似。
因此,我將之分類為“超級外掛式入口”、“系統(tǒng)級外掛入口”和“系統(tǒng)原生級入口”。
第一種“超級外掛式入口”,也就是我們在春晚紅包大戰(zhàn)中看到的幾大巨頭的新APP。它們的特點是適配性最好——不挑機型、不挑配置、即下即用、界面友好;但它們較大的短板是——和系統(tǒng)之間是純粹的操作系統(tǒng)-APP式的主從關系。這種外掛式的連接方式,決定了它們在調動手機的本地能力、本地應用、獲得授權等方面是困難重重、壁壘無數(shù)的——特別是在強調數(shù)據(jù)安全,操作系統(tǒng)日益收緊系統(tǒng)權限的當下。
第二種我稱之為“系統(tǒng)級外掛入口”,前一段時間引發(fā)廣泛關注的豆包手機,就基本是這一核心路徑的代表——端云協(xié)同GUI操作。
所謂端云協(xié)同GUI操作,通俗的說,是一種“模擬人類操作APP”的方式完成工作流——在你看似手機“自動”執(zhí)行的每一步操作的背后,后臺的工作邏輯是不斷截圖上傳至云端讓模型識別確認,然后完成一次次虛擬點擊——也就是說,相當于讓AI代替人來操作各個APP。
這就是此前豆包x努比亞的AI手機的工作方式,它自有先天的優(yōu)點,就是普適性極強。理論上說,只要云端大模型能力足夠,任何APP的界面交互,AI都能完成,尤其不需要對APP進行一對一的適配。
因此,這款手機在國內外剛發(fā)布時,吸引了大量關注,有媒體甚至稱為“AI原生手機的先鋒”,這并不是過譽。
但是,這種模式的缺點也是顯而易見的——它的流暢運行,基于后臺的無數(shù)次截圖上傳,因此高度依賴網絡的穩(wěn)定性,任務執(zhí)行效率相對較低,時延明顯。
之所以此后激發(fā)了一輪大廠的抵制,更不僅僅是出于對用戶側的安全隱患的考量,還在于大廠也的多重考慮。
從利益角度,讀屏模式動了超級APP的商業(yè)根基——如果智能體執(zhí)行任務時,用戶無需操作APP就能完成全鏈路操作,就會導致最常見的開屏廣告和APP內廣告形同虛設,直接截流用戶時長和廣告曝光,顛覆了“入口=流量=收入”的移動互聯(lián)網基本商業(yè)模式。
從安全角度說,一個APP如果無法管控用戶數(shù)據(jù)流轉,無法履行數(shù)據(jù)安全主體責任,目前仍是不可想象的,更重要的是,這種“擬人操作”如果在系統(tǒng)層沒有得到監(jiān)管,對用戶隱私、數(shù)據(jù)安全性的保護上,是最容易受到質疑的。因為其調用的是系統(tǒng)底層權限,能截屏到安全窗口這種本應受高度保護的界面。
那么,還有直接點的辦法嗎?這就是第三種方案:“系統(tǒng)級原生調用”,這種方式不需要屏幕截圖,AI助理甚至不需要打開APP,而是通過協(xié)議直接和APP交互數(shù)據(jù),各APP之間(也是各Agen之間)也通過協(xié)議直接交互數(shù)據(jù)。
但事情的微妙之處也在這個層面,同為“系統(tǒng)級調用”,實現(xiàn)的路徑大不相同。
對于安卓/IOS系統(tǒng)來說,它的基礎設計是:用戶明確打開某個 App,在那個 App 的 UI 內完成任務。
它的表層難度是,AI 要把“用戶的模糊意圖”翻譯成“多 App 動作鏈”,屬于典型的后加(外掛)能力,會天然和原來的默認路徑發(fā)生摩擦。這就需要1:1的調優(yōu),因此它的尷尬特別鮮明的體現(xiàn)在——演示的時候無比絲滑,真實環(huán)境下則要么要求用戶頻繁確認、切換、跳轉,要么就需要用戶授以更深的系統(tǒng)權限和接口。
而它的底層難度更反映在,在 App 時代,OS 給 App 的是沙箱 + 權限,不是“把能力貢獻給系統(tǒng)代理”的統(tǒng)一協(xié)議,所以,安卓/IOS不得不別辟蹊徑,通過后天補強的方式給系統(tǒng)“外接”一個新的AI器官。
這也解釋了,作為全球智能手機操作系統(tǒng)市占率最高的安卓的東家+擁有業(yè)界最強模型之一Gemini的谷歌,為什么在2026年的時候才展示較為初級的系統(tǒng)級AI能力;而另一家巨頭蘋果, 經過無數(shù)次的跳票和證偽,最后基本落定目前最大概率的方式也是直接集成Gemini。
安卓和IOS的尷尬,是歷史的包袱在面臨時代切換時的必然,但也可能是其落后于時代的開始。
以微軟為例,在PC時代,它在全球計算設備上的覆蓋率近90%(甚至更高),堪稱操作系統(tǒng)的全球主導。但從2017年首次市占率低于安卓后,Windows的覆蓋率如今已經降至約30%,相對損失超過60個百分點的市占率,實際上交出了除桌面計算市場之外的操作系統(tǒng)主導權……而這一切,未必不會在安卓和IOS身上重演。
![]()
相對來說,身為全球第三大移動操作系統(tǒng)的鴻蒙,雖然絕對設備量仍然有限,但勝在沒有任何互聯(lián)網時代的包袱。
因此,在這場操作系統(tǒng)級的較量中,華為的鴻蒙展現(xiàn)出了一種獨特的、甚至是具有體系結構優(yōu)勢的“第三種可能”。它不同于安卓和iOS在舊架構上“打補丁”式的AI集成,從設計伊始就是為“原生智能”準備的。2026年MWC上展示的鴻蒙架構,通過微內核的垂直整合,實現(xiàn)了從硬件算力調度到端側模型響應的極致優(yōu)化。
也就是說,通過在理解用戶意圖上的底層意圖框架(Intention Framework)和系統(tǒng)級 Intent 協(xié)議(這也是安卓和蘋果目前補課的重點),這種架構上的領先,讓鴻蒙在處理理解模糊意圖、長任務、多設備協(xié)作、跨應用數(shù)據(jù)流轉時,有著上一代操作系統(tǒng)很難彌補的結構性優(yōu)勢。
但要把結構性優(yōu)勢變成商業(yè)上的勝勢,鴻蒙要走的路還很長。
02
傳統(tǒng)大廠Agent前的三堵墻
如果遴選一個2025年的年度AI關鍵詞,智能體(Agent)是無二的選擇。
對話智能靠“推理”,行為智能靠“行動”,當我們的注意力從對話機器人開始轉移到智能體身上時,我們也快速的從“對話智能”時代進入了“行動智能”時代。
![]()
為什么我認為操作系統(tǒng)級內置的“行動智能調度模塊”具有比“超級外掛式入口”有強得多的潛力,是因為從對話智能向行動智能轉換的過程中,后者會遇到三堵厚墻。
把這三堵墻講清楚,才能解釋為什么“系統(tǒng)級天然入口”更可能成為AI應用的終局形態(tài)。
第一道墻是產品墻,簡言之,人都是懶的——用戶不愿意為了“更聰明”再多裝一個入口。
外掛入口要成功,必須把“使用”變成“默認”。這意味著它不僅要回答得好,還要把“打開它”這件事變得像呼吸一樣自然。而春節(jié)戰(zhàn)役已經證明了,短期內拉新不難,難的是因為無法有效觸達物理世界,很難把一次性嘗鮮變成長期的路徑依賴——至少,除了豆包手機初窺門徑外,其它的對話式智能體雖然口號不同,但已展現(xiàn)出的行為智能能力,可以說乏善可陳。
第二堵墻,是技術墻——跨 App 的行動需要標準化接口、權限治理、可觀測與回滾。
當 Agent 不是給你生成一堆文字,而是替你叫車、下單、改簽、付款時,它必須進入更高權限、更高風險的領域:位置、支付、通訊錄、電話、短信。
這里最難的從來不是“能不能接”,而是“出了事誰負責”。
谷歌在 Galaxy S26 上把“詐騙檢測”這種高敏感能力直接集成到系統(tǒng)電話應用,搭載鴻蒙的mate80能夠在檢測到外界窺視時啟動視覺模糊策略,這都是典型的“系統(tǒng)級治理思路”:高權限能力必須和 OS 的安全邊界綁定。
而外掛式入口想獲得同等信任,需要付出更高成本:既要技術可用,還要治理可信,而后者絕對比前者更難。
第三堵墻,我稱為商業(yè)墻——超級 App,天然不愿把核心能力開放給“可能截流的友商”。
這是外掛入口最現(xiàn)實的難題:當你希望調用外賣、打車、支付、內容時,這些超級 App 會天然警惕:你是入口,也是競爭者;你掌握了路徑,就掌握了流量。
這就造成了,即便“技術上能做,商業(yè)上也未必愿意配合”。所以你會看到,很多外掛式入口哪怕具備強大的智能體調度能力,但最終只能“調起一部分有限的合作方”。這不是能力不行,是“開放接口”幾乎相當于整個移動互聯(lián)網時代“私域化本質”的生態(tài)不正確。
但是我敢說,這種“頭部APP拒止Agent調用”的時代已經快結束了。
無論是國際還是國內,由于智能體蘊含的巨大潛力,目前行業(yè)已形成云/智能企業(yè)倒逼通用協(xié)議誕生的狀態(tài)。
目前,海外主流協(xié)議有Anthropic的MCP協(xié)議、谷歌的安卓AppFunctions框架;國內則有階躍星辰的GUI-MCP協(xié)議;另外,國內的一部分頭部手機廠商,據(jù)信也在聯(lián)合推動國內安卓生態(tài)的AI Agent接口標準統(tǒng)一。
相對而言,鴻蒙在這方面的架構準備、生態(tài)準備和行業(yè)共識引導,更是做的相當有先見性的。
那么,也許你會問我一個問題,為什么鴻蒙生態(tài)目前還沒有出現(xiàn)現(xiàn)象級的智能體生態(tài)爆發(fā)?
03
水到渠成
其實,關于鴻蒙生態(tài)里的智能體應用的案例,可以說是一直以一種“小火慢燉”的形式在逐漸推進——華為天氣、音樂、瀏覽器等自有應用,主動擁抱 Agent 形態(tài),已形成示范效應;喜馬拉雅、小紅書、微博智搜等第三方場景,也開始通過系統(tǒng)入口觸發(fā)推薦與問答閉環(huán)。
這其實是Agent落地的一個規(guī)律——優(yōu)先落地的往往是高容錯率、低風險級的業(yè)務,然后逐步走向高風險、高頻業(yè)務。
而且,這些案例,雖然還不夠豐富,但都共同指向一個趨勢:未來用戶對系統(tǒng)級 Agent 的期待,不是“你能不能回答”,而是“你能不能把服務編排得足夠短、足夠順”。
另外,從最新放出的328beta版測試來看,鴻蒙新系統(tǒng)的一個很大賣點,除了底層重構外,端側大模型4.0也第一次被放了出來,這個約10GB的本地大模型,主打一個“本地AI大腦”,完全離線可用。這不但是華為第一次把完整的本地大模型直接部署到手機,讓大量AI計算在手機里完成,速度更快、隱私更安全,也為逐步推進的端云協(xié)同,打下了更深的地基。
其實,稍早前的HDC2025 上,華為就已經發(fā)布鴻蒙智能體框架 HMAF 與《Agent時代,鴻蒙應用 生而智能——鴻蒙智能體框架白皮書》,并推出小藝智能體開放平臺,明確提出“系統(tǒng)、應用/元服務與智能體”的協(xié)同范式,目標是讓智能體以更快速度滲透行業(yè),形成協(xié)同網絡。
如果說安卓的方向,還是有些“半外掛”色彩的“把 Gemini更深度的嵌入系統(tǒng)”,鴻蒙的表述則更具有整體的“框架感”:它試圖定義一個多智能體協(xié)同的操作系統(tǒng)范式——系統(tǒng)級入口不是單個 Agent,而是調度中樞——也就是說,我們熟悉的小藝,未來不再是存在感略弱的“系統(tǒng)助手”,而是定位為系統(tǒng)級智能中樞(而不是一道門),它可拆解復雜任務并調度多智能體協(xié)作完成。
如果要用一句話總結鴻蒙在“行動智能”時代的準備,那就是——在全新的 HMAF 結構下,鴻蒙體驗從“APP觸控”轉向“自然語言交互”,并通過小藝對話、導航條、chips 推薦等系統(tǒng)級分發(fā)入口理解意圖、觸達服務、完成閉環(huán)。
這段描述,其實已經直指“天然入口”的精髓:入口不是下載來的,而是系統(tǒng)原生長出來的——這就是天然入口相當于外掛入口的最大優(yōu)勢,它天然就在那里。
另外,如果說針對外掛入口的瓶頸,是在我們前面說的“三堵墻”,那么小藝這樣的系統(tǒng)級天然入口的優(yōu)勢就在于:它天然穿過了這三堵墻——它并不是要消滅超級 App,而是要把App變成可編排的執(zhí)行單元,把入口變成系統(tǒng)語法,把鴻蒙生態(tài)這個客觀上的第三方,變成智能體爆發(fā)的最佳土壤。
一方面,為了方便APP的接入,小藝智能體開放平臺強調“從開發(fā)到運行到運營”的全流程,并提供 50+ 鴻蒙系統(tǒng)插件、意圖框架兼容 MCP 工具、支持 A2A 多智能體協(xié)同,甚至可通過自然語言創(chuàng)建工作流并自動優(yōu)化提示詞,現(xiàn)在甚至連鴻蒙版的OpenClaw——小藝Claw也被曬出來了。
可以說,從天然的預留架構、到友好的生態(tài)設置再到多元化的部署方式,鴻蒙應該是目前所有移動操作系統(tǒng)中“Agent親和力”最好的一個,它的未來不可限量。
那么,也許你會追問,為什么還不爆發(fā)?
前面說過,行動智能時代的到來,既需要技術上的準備,也需要商業(yè)上的準備。
爆與不爆,一方面取決于前面說的微觀技術準備,另一方面取決于大家都在等待的一個答案——AI時代,到底需要什么樣的應用產品形態(tài)?
如果說,過去16年,移動互聯(lián)網的主體敘事,就是微信、淘寶、美團、抖音等超級APP的成長史,那么,這些超級巨頭的共同特點是:盡可能把用戶的時間和注意力,都留在一個App里。
但智能體時代的底層邏輯變了,它不是要圈住你,而是想成為你和其他App之間的中介。
未來的小藝想承載的,可能是如此——我是天然入口,但我甚至不介意你是否認為我是不是入口,我是一個開放的、本地的、用戶可控制的AI能力層,我足夠第三方、足夠開放,我既不是要搞一個封閉式的花園圍墻,也不是要在你必經的路徑上硬設一個收費站,而是類似于openClaw的邏輯——我是你的使能工具,我最大化的幫你實現(xiàn)一個夢想:“用自然交互的方式指揮我,讓你想去哪就去哪,想完成什么任務就完成什么任務,想調用什么模型就調用什么,而且很安全、很本地,最后的數(shù)據(jù)管轄權還歸你自己。”
如果所有人都意識到這才是未來,那么它火爆的那一天,可能就是明天。
結語:
超級入口的時代,可能要過去了。因為Agent天然是跨域運行的,它的能力上限和價值上限,不完全在于它本身能做什么,而在于它能連接到什么量級、多少數(shù)量的賦能客體。
在這個背景下,總會走到這一天——不再是超級APP放下身段“開放能力”,而是它們自己拆開私域的壁壘,只求得到同等的被調動、被喚起、被使用的機會。
這才是超級智能體存在的更大意義。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.