網易首頁 > 網易號 > 正文申請入駐

深度解析谷歌版「豆包手機」：Android 的統治者下了一盤什么棋？｜AI 器物志

2026-02-27 10:28:30　來源: 愛范兒

廣東舉報

分享至

編者按：當 AI 開始尋找自己的形狀，有些選擇出人意料。 AI 在智能手機上生出了一顆獨立按鍵，似乎讓智能手機找回了久違的進化動力。眼鏡憑借著視覺和聽覺的天然入口，隱隱有了下一代個人終端的影子。一些小而專注的設備，在某些瞬間似乎比 All in one 的設備更為可靠。與此同時，那些寄望一次性替代手機的激進嘗試，卻遭遇了現實的冷遇。技術的落地，從來不只是功能的堆疊，更關乎人的習慣、場景的契合，以及對「好用」的重新定義。愛范兒推出「AI 器物志」欄目，想和你一起觀察：AI 如何改變硬件設計，如何重塑人機交互，以及更重要的——AI 將以怎樣的形態進入我們的日常生活？

原本以為，三星 Galaxy S26 系列早已被曝光，發布會也就走個流程。沒想到三星和 Google 還藏了一手。

兩家公司共同展示了 S26 搭載的全新 Gemini 智能體能力：口頭吩咐一句話，Gemini 就能在 Uber 幫你打車，或者 DoorDash 上點外賣。

▲ 圖源：Android Central

這個功能目前還處于早期預覽階段，僅在美國和韓國提供。

你可以理解為，Google 和三星一起聯手，做了一個全球版的「豆包手機」（準確來說叫豆包手機助手）。Galaxy S26 系列只是開始，這些能力后續會推送到 Google Pixel 10 手機，以及更多 Android 17 設備上。

在看過、用過許多個手機/電腦系統級 AI 智能體，也深度使用過「豆包手機」之后，再看這次的 Gemini 智能體，我覺得關于它的討論不該止于一個「新功能」。

誠然，這不是 Android 操作系統的底層框架首次為了容納智能體而被深度定制——包括 OPPO、榮耀、華為等在內的許多廠商都已經做了相當多的早期的嘗試。

但這可是 Google，是 Android 操作系統的絕對擁有者。

如果說字節跳動作為一個「外人」，做的嘗試對國民級 app 犯了「大不敬」——Google 來做這件事情，意義就完全不一樣了。

不過別急，我們還是先看看，這次 Google 和三星做的「豆包手機」，到底怎么一回事。

三星「豆包手機」，用起來怎么樣？

三星和 Google 這次展現的「Gemini 自動任務」能力，能夠模仿人類操作手機，從而實現任務的自動化。背后的實現思路，是 AI 讀屏理解 + 系統底層/應用層 API 的雙重路徑。

需要注意的是，字節和努比亞共同開發的「豆包手機」，重度使用系統級權限的能力，以及讀屏，而非 API。你可以理解為，豆包手機主要走的是「沒跟應用開發者打好招呼」的，「硬來」的實現思路，也為國民級 app 對其封殺抵制留下了把柄。

而三星和 Google 這次在 Galaxy S26 系列上做的 Gemini 智能體，可以說兩者兼備。根據三星方面透露的信息，其應用商城排名前 200 的應用都能支持（但僅限特定應用的使用效果可以保證，后面詳述）——說明三星、Google 至少大體上這些應用開發者打好了招呼。

我們來看看《連線》雜志編輯的體驗效果：她直接呼出 Gemini，告訴它自己要去機場，Gemini 應用本身會打開一個「虛擬窗口」中打開 Uber，并在后臺開始執行這個動作，用戶可以隨時點擊進入查看 Gemini 的執行進程。

由于當地有幾個不同的機場，Gemini 很快又提醒用戶選擇合適的目的地；下單時，Gemini 也會把界面推到用戶面前，方便用戶選擇合適的車輛并支付。

Gemini 的「虛擬窗口」，可以理解為一個沙箱化的「虛擬機」，是 Google 對用戶隱私保護的一種考量。過去的 Gemini 運行在 Android 系統中，但這次的新 Gemini 智能體操作應用時，僅限在這個沙箱內工作，并不會觸及設備的其他部分。

再多提一嘴：如果大家用過 Manus、月暗的 Kimi computer、智譜 AutoGLM 等，具備云電腦/云手機能力的智能體產品，應該就很容易理解這個 Gemini 虛擬機的邏輯了。

▲ 圖源：9To5Google

這算是相當簡單的任務，不少國產 AI 手機助手在一年前都已經攻克了這種場景。

而 Gemini 更加殺手級的能力，是和此前已經長線布局的讀屏、抓信息特性相結合。

比如，當用戶和朋友聊到聚會要訂披薩，用戶可以直接叫出 Gemini，吩咐一句「弄清楚訂單」，Gemini 就能直接抓取聊天中提到的披薩店，甚至特定的披薩種類，整理好每個人的需求。

隨后，用戶可以直接讓 Gemini 在外賣平臺 Grubhub 上點外賣，AI 會按照剛梳理完成的訂單需求，在后臺自動化把所有食物添加到購物車，交付給用戶確認和下單。

有時，訂餐的情況會沒那么順利，Gemini 也會嘗試自己先去解決突發狀況，并給用戶提供解決方案。有一次，披薩店在繁忙時段限制了大號披薩的下單量，Gemini 就會詢問能不能點兩個中號代替。

還有一個例子：用 Google Keep 筆記列舉了燒烤派對的出席名單，并標注了素食主義者。Gemini 可以先計算好整個派對總共需要多少熱狗和面包，然后再讓它去采購食材，幾分鐘后商品全部被安放在了 DoorDash 平臺的購物車里。

Google Android 生態系統總裁 Sammer Samat 透露，Gemini 并非提前「記住」了這些平臺操作的步驟和線路，而是真的在利用推理能力，模仿人類查看屏幕并進行下一步操作，這意味著 Gemini 未來能在更多場景發揮潛力。

這里你能看到，Gemini 首批主打訂餐、叫車場景，這一點倒是更像春節前千問所做的事情。

▲ 圖源：Wired

又一個「豆包手機」，來自 Android 官方

對比真正「全能」，連微信收藏都能幫忙找的豆包手機助手（至少在被抵制之前），Gemini 目前的能力還相當局限，聚焦在打車、外賣、雜貨這些日常場景，雖說底層技術能力更強，但用戶的實機使用效果，跟鴻蒙的小藝、榮耀的 YOYO 等國產手機 AI 助手并無太大不同。

不過正如文章一開頭提到，Google 手握一整個 Android 生態，有著絕對的號召力和掌控力。

隨著 Gemini 自動化能力的發布，Google 也詳細公開了背后 Android 系統的底層布局和未來計劃——有兩個方向，簡單來說，就是既「蘋果」又「豆包」。

首先，Google 去年發布了一個名叫「AppFunctions」的框架，允許開發者公開應用特定的功能和特性入口，以便 AI 助手調用。

Google 將 AppFunctions 類比為 Android 的「模型上下文協議」（MCP），可以簡單理解為一個對話標準，幫助第三方的 App 應用和 AI 模型進行對接。

這個框架類似蘋果的 App Intents。在蘋果的構思中，用戶可以使喚 Siri 來操作各種 app 來實現功能，而底層實現方式就是通過 App Intents ——新一代 Siri 遲遲不能落地的前提下，App Intents 足以提供不錯的效果。

Google 的 AppFunctions 也是同理。

比如用戶下達指令，希望能從好友的電子郵件中找到一個食譜，并將相關配料加入購物清單中。AI 接到命令，首先調用郵件 App「搜索」的功能入口，檢索并提取出相關內容，然后調用備忘錄的「購物清單」入口，把數據填入整理。

一些 AppFunction 功能已經在三星 Galaxy S26 和 One UI 8.5 系統中落地。比如，用戶可以對 Gemini 下達指令，找出相冊中的特定照片，并用短信發送給朋友。

需要注意的是，整個過程中，Gemini 不需要打開相冊和短信 App，甚至沒離開 Gemini App，而是通過 AppFunctions，把對應入口抓取到 Gemini 之中執行操作，效率更高。

本質上，基于 AppFunctions 的實現方式，和過去的 API 路徑邏輯相同。這是一種「打好了招呼」的解題思路。

但是，并非所有 App 都做好了相關的適配。沒關系，Google 還做了另一手準備。

昨天發在 Android 開發者博客上的一篇文章中，Google 明確提出：公司還在開發一個 UI 自動化的框架，讓 AI 助手和第三方應用模仿人類，直接打開 App 一步步操作。

——這，就是翻版的「豆包手機」了。

不過，盡管 Google 說以后 UI 自動化會承擔真正的「重活」，在這次的 Galaxy 26 系列當中，UI 自動化只是一個「早期預覽版」。

▲ 豆包手機幫我種草比價洗發水

如果說 AppFunctions 需要 App 開發者進行額外的適配工作，那么 UI 自動化框架則是把工作量都留給 AI 智能體，無需任何額外適配，但效果非常取決 AI 智能體的能力，優勢就在于一上線就能覆蓋大量應用。

現在你可以看到，在 Google 的 Android Gemini 智能體計劃中，AppFunctions 和 UI 自動化是兩條路線，互為補充：通過規范化、可追溯的接口方式來確保最大限度的兼容性，同時為真正代表未來的讀屏交互模式打好基礎。

Google 還表示，這不會只是 Gemini 的專屬功能，而是 Android 系統的特性。

這也意味著，未來不管是手機廠商自己內置的 AI 助手，還是 ChatGPT 等第三方應用，都能調用 AppFunctions 執行任務，或者「讀懂」手機 UI 進行自動操作。

值得一提的是，在國行用不了 Gemini 的情況下，三星 Galaxy S26 的 Bixby 助手也能實現點外賣、叫車、電商比價的功能。我們可以合理推斷，三星在國內也找到了一家模型供應商來替代 Gemini 的身份，至于這些大模型小龍當中具體是誰，可能就取決于過去一年里誰在手機智能體上成績更突出了。

AI 手機的道路，不會只有「孤勇者」

去年「豆包手機」驚艷亮相，又因為令人遺憾的情況而「早夭」。在深感遺憾的同時，也讓我們不禁去思考，AI 自動化的模式，就是 AI 手機的理想模式嗎？

這個問題，沒有個三五年也得不出答案。至少，豆包手機不是單打獨斗，手握 Android 系統的 Google，同樣選擇了這個路線，而且話語權大得多。

其實當豆包手機火到海外之后，就有網友開始暢想，如果 Google 在 Pixel 以及 Android 手機上推廣這個技術，那前景將會非常廣闊。

雖然我覺得，Google 對于怎么回答「AI 手機」這個命題，其實也沒有一個非常清晰的答案，更像是因為手上同時有 AI、系統和硬件，每個方向都嘗試一下，說不定就有一條路跑通了。

但至少，Google 已經為 Android 打好了「系統級自動化」的樣板，接下來不少新機，都有了化身「豆包手機」的潛力。

這個浪潮或許還不止于 Android 陣營。別忘了，蘋果已經和 Google 達成合作，Gemini 將成為 Siri 的技術支持。而 App Intents 和 AppFunctions 又非常相似……

▲ AI Siri 的演示

再往前看一點：Gemini 智能體甚至不只局限于 AI 手機。在 Sammer Samat 設想中，未來智能眼鏡、AI 吊墜，甚至是汽車，只要有 Gemini，就能用它來完成復雜的任務——當然，這樣的場景距離落地還有距離。

不過，Google 也只是在技術層面跑通了 AI 自動化的路線，而范式成立，不代表問題消失。豆包手機當時遇到的種種矛盾，也會成為后來者不得不面對的挑戰。

首先當然是隱私和安全問題。Google 的餅畫得很大，未來調用、操作手機 App 的將不僅限于 Gemini，一些第三方 AI 應用能更深入用戶的數據核心，如果有偽裝的惡意應用利用了這些接口，也會造成更大的損失。

▲ 圖源：9To5Google

更激烈的矛盾，是手機硬件廠商、模型/智能體能力提供商、大平臺應用這三者之間，圍繞 AI 時代新「入口」的爭奪。這也是原版的豆包手機，一度最難逾越的高墻。

畢竟，用 Gemini 叫車，可能意味著用戶不用再看到 Uber 的會員促銷、廣告推薦，甚至不再形成品牌黏性，直接損害到應用服務商/廣告行業的收益。

中國有互聯網/AI 巨頭，海外何嘗不是如此？像 Meta、Amazon 這樣的老對手，本身還擁有強勢的平臺與生態，它們未必心甘情愿對 Google 開放，讓 Gemini 來自動化一切。無論是以隱私、安全，還是平臺規則為由，設置限制、提高接入門檻，博弈必然發生，爭斗將進一步白熱化。

至少 Google 對未來很有信心。Sammer Samat 認為，AI 技術已經進入了「正在進行時」，開發者與其絞盡腦汁對抗，還不如去思考一個合適的方式擁抱它。

新與舊的對抗不可避免，最終的勝利者，只會是那些在變革前夜，就已經在勇敢追逐的玩家。

參考資料：
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.