![]()
編者按: 當 AI 開始尋找自己的形狀,有些選擇出人意料。 AI 在智能手機上生出了一顆獨立按鍵,似乎讓智能手機找回了久違的進化動力。眼鏡憑借著視覺和聽覺的天然入口,隱隱有了下一代個人終端的影子。一些小而專注的設備,在某些瞬間似乎比 All in one 的設備更為可靠。與此同時,那些寄望一次性替代手機的激進嘗試,卻遭遇了現實的冷遇。 技術的落地,從來不只是功能的堆疊,更關乎人的習慣、場景的契合,以及對「好用」的重新定義。 愛范兒推出「AI 器物志」欄目,想和你一起觀察:AI 如何改變硬件設計,如何重塑人機交互,以及更重要的——AI 將以怎樣的形態進入我們的日常生活?
原本以為,三星 Galaxy S26 系列早已被曝光,發布會也就走個流程。沒想到三星和 Google 還藏了一手。
兩家公司共同展示了 S26 搭載的全新 Gemini 智能體能力:口頭吩咐一句話,Gemini 就能在 Uber 幫你打車,或者 DoorDash 上點外賣。
![]()
▲ 圖源:Android Central
這個功能目前還處于早期預覽階段,僅在美國和韓國提供。
你可以理解為,Google 和三星一起聯手,做了一個全球版的「豆包手機」(準確來說叫豆包手機助手)。Galaxy S26 系列只是開始,這些能力后續會推送到 Google Pixel 10 手機,以及更多 Android 17 設備上。
在看過、用過許多個手機/電腦系統級 AI 智能體,也深度使用過「豆包手機」之后,再看這次的 Gemini 智能體,我覺得關于它的討論不該止于一個「新功能」。
誠然,這不是 Android 操作系統的底層框架首次為了容納智能體而被深度定制——包括 OPPO、榮耀、華為等在內的許多廠商都已經做了相當多的早期的嘗試。
但這可是 Google,是 Android 操作系統的絕對擁有者。
如果說字節跳動作為一個「外人」,做的嘗試對國民級 app 犯了「大不敬」——Google 來做這件事情,意義就完全不一樣了。
不過別急,我們還是先看看,這次 Google 和三星做的「豆包手機」,到底怎么一回事。
三星「豆包手機」,用起來怎么樣?
三星和 Google 這次展現的「Gemini 自動任務」能力,能夠模仿人類操作手機,從而實現任務的自動化。背后的實現思路,是 AI 讀屏理解 + 系統底層/應用層 API 的雙重路徑。
需要注意的是,字節和努比亞共同開發的「豆包手機」,重度使用系統級權限的能力,以及讀屏,而非 API。你可以理解為,豆包手機主要走的是「沒跟應用開發者打好招呼」的,「硬來」的實現思路,也為國民級 app 對其封殺抵制留下了把柄。
而三星和 Google 這次在 Galaxy S26 系列上做的 Gemini 智能體,可以說兩者兼備。根據三星方面透露的信息,其應用商城排名前 200 的應用都能支持(但僅限特定應用的使用效果可以保證,后面詳述)——說明三星、Google 至少大體上這些應用開發者打好了招呼。
我們來看看《連線》雜志編輯的體驗效果:她直接呼出 Gemini,告訴它自己要去機場,Gemini 應用本身會打開一個「虛擬窗口」中打開 Uber,并在后臺開始執行這個動作,用戶可以隨時點擊進入查看 Gemini 的執行進程。
由于當地有幾個不同的機場,Gemini 很快又提醒用戶選擇合適的目的地;下單時,Gemini 也會把界面推到用戶面前,方便用戶選擇合適的車輛并支付。
Gemini 的「虛擬窗口」,可以理解為一個沙箱化的「虛擬機」,是 Google 對用戶隱私保護的一種考量。過去的 Gemini 運行在 Android 系統中,但這次的新 Gemini 智能體操作應用時,僅限在這個沙箱內工作,并不會觸及設備的其他部分。
再多提一嘴:如果大家用過 Manus、 月暗的 Kimi computer、智譜 AutoGLM 等,具備云電腦/云手機能力的智能體產品,應該就很容易理解這個 Gemini 虛擬機的邏輯了。
![]()
▲ 圖源:9To5Google
這算是相當簡單的任務,不少國產 AI 手機助手在一年前都已經攻克了這種場景。
而 Gemini 更加殺手級的能力,是和此前已經長線布局的讀屏、抓信息特性相結合。
比如,當用戶和朋友聊到聚會要訂披薩,用戶可以直接叫出 Gemini,吩咐一句「弄清楚訂單」,Gemini 就能直接抓取聊天中提到的披薩店,甚至特定的披薩種類,整理好每個人的需求。
隨后,用戶可以直接讓 Gemini 在外賣平臺 Grubhub 上點外賣,AI 會按照剛梳理完成的訂單需求,在后臺自動化把所有食物添加到購物車,交付給用戶確認和下單。
有時,訂餐的情況會沒那么順利,Gemini 也會嘗試自己先去解決突發狀況,并給用戶提供解決方案。有一次,披薩店在繁忙時段限制了大號披薩的下單量,Gemini 就會詢問能不能點兩個中號代替。
還有一個例子:用 Google Keep 筆記列舉了燒烤派對的出席名單,并標注了素食主義者。Gemini 可以先計算好整個派對總共需要多少熱狗和面包,然后再讓它去采購食材,幾分鐘后商品全部被安放在了 DoorDash 平臺的購物車里。
Google Android 生態系統總裁 Sammer Samat 透露,Gemini 并非提前「記住」了這些平臺操作的步驟和線路,而是真的在利用推理能力,模仿人類查看屏幕并進行下一步操作,這意味著 Gemini 未來能在更多場景發揮潛力。
這里你能看到,Gemini 首批主打訂餐、叫車場景,這一點倒是更像春節前千問所做的事情。
![]()
▲ 圖源:Wired
又一個「豆包手機」,來自 Android 官方
對比真正「全能」,連微信收藏都能幫忙找的豆包手機助手(至少在被抵制之前),Gemini 目前的能力還相當局限,聚焦在打車、外賣、雜貨這些日常場景,雖說底層技術能力更強,但用戶的實機使用效果,跟鴻蒙的小藝、榮耀的 YOYO 等國產手機 AI 助手并無太大不同。
不過正如文章一開頭提到,Google 手握一整個 Android 生態,有著絕對的號召力和掌控力。
隨著 Gemini 自動化能力的發布,Google 也詳細公開了背后 Android 系統的底層布局和未來計劃——有兩個方向,簡單來說,就是既「蘋果」又「豆包」。
首先,Google 去年發布了一個名叫「AppFunctions」的框架,允許開發者公開應用特定的功能和特性入口,以便 AI 助手調用。
Google 將 AppFunctions 類比為 Android 的「模型上下文協議」(MCP),可以簡單理解為一個對話標準,幫助第三方的 App 應用和 AI 模型進行對接。
![]()
這個框架類似蘋果的 App Intents。在蘋果的構思中,用戶可以使喚 Siri 來操作各種 app 來實現功能,而底層實現方式就是通過 App Intents ——新一代 Siri 遲遲不能落地的前提下,App Intents 足以提供不錯的效果。
Google 的 AppFunctions 也是同理。
比如用戶下達指令,希望能從好友的電子郵件中找到一個食譜,并將相關配料加入購物清單中。AI 接到命令,首先調用郵件 App「搜索」的功能入口,檢索并提取出相關內容,然后調用備忘錄的「購物清單」入口,把數據填入整理。
一些 AppFunction 功能已經在三星 Galaxy S26 和 One UI 8.5 系統中落地。比如,用戶可以對 Gemini 下達指令,找出相冊中的特定照片,并用短信發送給朋友。
需要注意的是,整個過程中,Gemini 不需要打開相冊和短信 App,甚至沒離開 Gemini App,而是通過 AppFunctions,把對應入口抓取到 Gemini 之中執行操作,效率更高。
本質上,基于 AppFunctions 的實現方式,和過去的 API 路徑邏輯相同。這是一種「打好了招呼」的解題思路。

但是,并非所有 App 都做好了相關的適配。沒關系,Google 還做了另一手準備。
昨天發在 Android 開發者博客上的一篇文章中,Google 明確提出:公司還在開發一個 UI 自動化的框架,讓 AI 助手和第三方應用模仿人類,直接打開 App 一步步操作。
![]()
——這,就是翻版的「豆包手機」了。
不過,盡管 Google 說以后 UI 自動化會承擔真正的「重活」,在這次的 Galaxy 26 系列當中,UI 自動化只是一個「早期預覽版」。
![]()
▲ 豆包手機幫我種草比價洗發水
如果說 AppFunctions 需要 App 開發者進行額外的適配工作,那么 UI 自動化框架則是把工作量都留給 AI 智能體,無需任何額外適配,但效果非常取決 AI 智能體的能力,優勢就在于一上線就能覆蓋大量應用。
現在你可以看到,在 Google 的 Android Gemini 智能體計劃中,AppFunctions 和 UI 自動化是兩條路線,互為補充:通過規范化、可追溯的接口方式來確保最大限度的兼容性,同時為真正代表未來的讀屏交互模式打好基礎。
Google 還表示,這不會只是 Gemini 的專屬功能,而是 Android 系統的特性。
這也意味著,未來不管是手機廠商自己內置的 AI 助手,還是 ChatGPT 等第三方應用,都能調用 AppFunctions 執行任務,或者「讀懂」手機 UI 進行自動操作。
值得一提的是,在國行用不了 Gemini 的情況下,三星 Galaxy S26 的 Bixby 助手也能實現點外賣、叫車、電商比價的功能。我們可以合理推斷,三星在國內也找到了一家模型供應商來替代 Gemini 的身份,至于這些大模型小龍當中具體是誰,可能就取決于過去一年里誰在手機智能體上成績更突出了。
![]()
AI 手機的道路,不會只有「孤勇者」
去年「豆包手機」驚艷亮相,又因為令人遺憾的情況而「早夭」。在深感遺憾的同時,也讓我們不禁去思考,AI 自動化的模式,就是 AI 手機的理想模式嗎?
這個問題,沒有個三五年也得不出答案。至少,豆包手機不是單打獨斗,手握 Android 系統的 Google,同樣選擇了這個路線,而且話語權大得多。
![]()
其實當豆包手機火到海外之后,就有網友開始暢想,如果 Google 在 Pixel 以及 Android 手機上推廣這個技術,那前景將會非常廣闊。
雖然我覺得,Google 對于怎么回答「AI 手機」這個命題,其實也沒有一個非常清晰的答案,更像是因為手上同時有 AI、系統和硬件,每個方向都嘗試一下,說不定就有一條路跑通了。
但至少,Google 已經為 Android 打好了「系統級自動化」的樣板,接下來不少新機,都有了化身「豆包手機」的潛力。
這個浪潮或許還不止于 Android 陣營。別忘了,蘋果已經和 Google 達成合作,Gemini 將成為 Siri 的技術支持。而 App Intents 和 AppFunctions 又非常相似……

▲ AI Siri 的演示
再往前看一點:Gemini 智能體甚至不只局限于 AI 手機。在 Sammer Samat 設想中,未來智能眼鏡、AI 吊墜,甚至是汽車,只要有 Gemini,就能用它來完成復雜的任務——當然,這樣的場景距離落地還有距離。
不過,Google 也只是在技術層面跑通了 AI 自動化的路線,而范式成立,不代表問題消失。豆包手機當時遇到的種種矛盾,也會成為后來者不得不面對的挑戰。
首先當然是隱私和安全問題。Google 的餅畫得很大,未來調用、操作手機 App 的將不僅限于 Gemini,一些第三方 AI 應用能更深入用戶的數據核心,如果有偽裝的惡意應用利用了這些接口,也會造成更大的損失。
![]()
▲ 圖源:9To5Google
更激烈的矛盾,是手機硬件廠商、模型/智能體能力提供商、大平臺應用這三者之間,圍繞 AI 時代新「入口」的爭奪。這也是原版的豆包手機,一度最難逾越的高墻。
畢竟,用 Gemini 叫車,可能意味著用戶不用再看到 Uber 的會員促銷、廣告推薦,甚至不再形成品牌黏性,直接損害到應用服務商/廣告行業的收益。
中國有互聯網/AI 巨頭,海外何嘗不是如此?像 Meta、Amazon 這樣的老對手,本身還擁有強勢的平臺與生態,它們未必心甘情愿對 Google 開放,讓 Gemini 來自動化一切。無論是以隱私、安全,還是平臺規則為由,設置限制、提高接入門檻,博弈必然發生,爭斗將進一步白熱化。
至少 Google 對未來很有信心。Sammer Samat 認為,AI 技術已經進入了「正在進行時」,開發者與其絞盡腦汁對抗 ,還不如去思考一個合適的方式擁抱它。
新與舊的對抗不可避免,最終的勝利者,只會是那些在變革前夜,就已經在勇敢追逐的玩家。
參考資料:
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.