原本以為,三星 Galaxy S26 系列早已被曝光,發(fā)布會也就走個流程。沒想到三星和 Google 還藏了一手。
兩家公司共同展示了 S26 搭載的全新 Gemini 智能體能力:口頭吩咐一句話,Gemini 就能在 Uber 幫你打車,或者 DoorDash 上點外賣。
![]()
圖源:Android Central
這個功能目前還處于早期預(yù)覽階段,僅在美國和韓國提供。
你可以理解為,Google 和三星一起聯(lián)手,做了一個全球版的「豆包手機(jī)」(準(zhǔn)確來說叫豆包手機(jī)助手)。
Galaxy S26 系列只是開始,這些能力后續(xù)會推送到 Google Pixel 10 手機(jī),以及更多 Android 17 設(shè)備上。
在看過、用過許多個手機(jī)/電腦系統(tǒng)級 AI 智能體,也深度使用過「豆包手機(jī)」之后,再看這次的 Gemini 智能體,我覺得關(guān)于它的討論不該止于一個「新功能」。
誠然,這不是 Android 操作系統(tǒng)的底層框架首次為了容納智能體而被深度定制——包括 OPPO、榮耀、華為等在內(nèi)的許多廠商都已經(jīng)做了相當(dāng)多的早期的嘗試。
但這可是 Google,是 Android 操作系統(tǒng)的絕對擁有者。
如果說字節(jié)跳動作為一個「外人」,做的嘗試對國民級 app 犯了「大不敬」——Google 來做這件事情,意義就完全不一樣了。
不過別急,我們還是先看看,這次 Google 和三星做的「豆包手機(jī)」,到底怎么一回事。
三星「豆包手機(jī)」,用起來怎么樣?
三星和 Google 這次展現(xiàn)的「Gemini 自動任務(wù)」能力,能夠模仿人類操作手機(jī),從而實現(xiàn)任務(wù)的自動化。背后的實現(xiàn)思路,是 AI 讀屏理解 + 系統(tǒng)底層/應(yīng)用層 API 的雙重路徑。
需要注意的是,字節(jié)和努比亞共同開發(fā)的「豆包手機(jī)」,重度使用系統(tǒng)級權(quán)限的能力,以及讀屏,而非 API。你可以理解為,豆包手機(jī)主要走的是「沒跟應(yīng)用開發(fā)者打好招呼」的(至少主流國民級 app 沒有),「硬來」的實現(xiàn)思路,也為國民級 app 對其封殺抵制留下了把柄。
而三星和 Google 這次在 Galaxy S26 系列上做的 Gemini 智能體,可以說兩者兼?zhèn)洹8鶕?jù)三星方面透露的信息,其應(yīng)用商城排名前 200 的應(yīng)用都能支持(但僅限特定應(yīng)用的使用效果可以保證,后面詳述)——說明三星、Google 至少大體上這些應(yīng)用開發(fā)者打好了招呼。
![]()
我們來看《連線》雜志的體驗效果:直接呼出 Gemini,告訴它自己要去機(jī)場,Gemini 應(yīng)用本身會打開一個「虛擬窗口」中打開 Uber,并在后臺開始執(zhí)行這個動作,用戶可以隨時點擊進(jìn)入查看 Gemini 的執(zhí)行進(jìn)程。
由于當(dāng)?shù)赜袔讉€不同的機(jī)場,Gemini 很快又提醒用戶選擇合適的目的地;下單時,Gemini 也會把界面推到用戶面前,方便用戶選擇合適的車輛并支付。
Gemini 的「虛擬窗口」,可以理解為一個沙箱化的「虛擬機(jī)」,是 Google 對用戶隱私保護(hù)的一種考量。
過去的 Gemini 運行在 Android 系統(tǒng)中,但這次的新 Gemini 智能體操作應(yīng)用時,僅限在這個沙箱內(nèi)工作,并不會觸及設(shè)備的其他部分。
再多提一嘴:如果大家用過 Manus、 月暗的 Kimi computer、智譜 AutoGLM 等,具備云電腦/云手機(jī)能力的智能體產(chǎn)品,應(yīng)該就很容易理解這個 Gemini 虛擬機(jī)的邏輯了。
![]()
圖源:9To5Google
這算是相當(dāng)簡單的任務(wù),不少國產(chǎn) AI 手機(jī)助手在一年前都已經(jīng)攻克了這種場景。
而 Gemini 更加殺手級的能力,是和此前已經(jīng)長線布局的讀屏、抓信息特性相結(jié)合。
比如,當(dāng)用戶和朋友聊到聚會要訂披薩,用戶可以直接叫出 Gemini,吩咐一句「弄清楚訂單」,Gemini 就能直接抓取聊天中提到的披薩店,甚至特定的披薩種類,整理好每個人的需求。
![]()
隨后,用戶可以直接讓 Gemini 在外賣平臺 Grubhub 上點外賣,AI 會按照剛梳理完成的訂單需求,在后臺自動化把所有食物添加到購物車,交付給用戶確認(rèn)和下單。
![]()
有時,訂餐的情況會沒那么順利,Gemini 也會嘗試自己先去解決突發(fā)狀況,并給用戶提供解決方案。有一次,披薩店在繁忙時段限制了大號披薩的下單量,Gemini 就會詢問能不能點兩個中號代替。
還有一個例子:用 Google Keep 筆記列舉了燒烤派對的出席名單,并標(biāo)注了素食主義者。Gemini 可以先計算好整個派對總共需要多少熱狗和面包,然后再讓它去采購食材,幾分鐘后商品全部被安放在了 DoorDash 平臺的購物車?yán)铩?/p>
Google Android 生態(tài)系統(tǒng)總裁 Sammer Samat 透露,Gemini 并非提前「記住」了這些平臺操作的步驟和線路,而是真的在利用推理能力,模仿人類查看屏幕并進(jìn)行下一步操作,這意味著 Gemini 未來能在更多場景發(fā)揮潛力。
這里你能看到,Gemini 首批主打訂餐、叫車場景,這一點倒是更像春節(jié)前千問所做的事情。
![]()
圖源:Wired
又一個「豆包手機(jī)」,來自 Android 官方
對比真正「全能」,連微信收藏都能幫忙找的豆包手機(jī)助手(至少在被抵制之前),Gemini 目前的能力還相當(dāng)局限,聚焦在打車、外賣、雜貨這些日常場景,雖說底層技術(shù)能力更強(qiáng),但用戶的實機(jī)使用效果,跟鴻蒙的小藝、榮耀的 YOYO 等國產(chǎn)手機(jī) AI 助手并無太大不同。
不過正如文章一開頭提到,Google 手握一整個 Android 生態(tài),有著絕對的號召力和掌控力。
隨著 Gemini 自動化能力的發(fā)布,Google 也詳細(xì)公開了背后 Android 系統(tǒng)的底層布局和未來計劃——有兩個方向,簡單來說,就是既「蘋果」又「豆包」。
首先,Google 去年發(fā)布了一個名叫「AppFunctions」的框架,允許開發(fā)者公開應(yīng)用特定的功能和特性入口,以便 AI 助手調(diào)用。
Google 將 AppFunctions 類比為 Android 的「模型上下文協(xié)議」(MCP),可以簡單理解為一個對話標(biāo)準(zhǔn),幫助第三方的 App 應(yīng)用和 AI 模型進(jìn)行對接。
![]()
這個框架類似蘋果的 App Intents。在蘋果的構(gòu)思中,用戶可以使喚 Siri 來操作各種 app 來實現(xiàn)功能,而底層實現(xiàn)方式就是通過 App Intents ——新一代 Siri 遲遲不能落地的前提下,App Intents 足以提供不錯的效果。
Google 的 AppFunctions 也是同理。
比如用戶下達(dá)指令,希望能從好友的電子郵件中找到一個食譜,并將相關(guān)配料加入購物清單中。AI 接到命令,首先調(diào)用郵件 App「搜索」的功能入口,檢索并提取出相關(guān)內(nèi)容,然后調(diào)用備忘錄的「購物清單」入口,把數(shù)據(jù)填入整理。
一些 AppFunction 功能已經(jīng)在三星 Galaxy S26 和 One UI 8.5 系統(tǒng)中落地。比如,用戶可以對 Gemini 下達(dá)指令,找出相冊中的特定照片,并用短信發(fā)送給朋友。
需要注意的是,整個過程中,Gemini 不需要打開相冊和短信 App,甚至沒離開 Gemini App,而是通過 AppFunctions,把對應(yīng)入口抓取到 Gemini 之中執(zhí)行操作,效率更高。
本質(zhì)上,基于 AppFunctions 的實現(xiàn)方式,和過去的 API 路徑邏輯相同。這是一種「打好了招呼」的解題思路。
![]()
但是,并非所有 App 都做好了相關(guān)的適配。沒關(guān)系,Google 還做了另一手準(zhǔn)備。
昨天發(fā)在 Android 開發(fā)者博客上的一篇文章中,Google 明確提出:公司還在開發(fā)一個 UI 自動化的框架,讓 AI 助手和第三方應(yīng)用模仿人類,直接打開 App 一步步操作。
![]()
——這,就是翻版的「豆包手機(jī)」了。
不過,盡管 Google 說以后 UI 自動化會承擔(dān)真正的「重活」,在這次的 Galaxy 26 系列當(dāng)中,UI 自動化只是一個「早期預(yù)覽版」。
![]()
▲ 豆包手機(jī)幫我種草比價洗發(fā)水
如果說 AppFunctions 需要 App 開發(fā)者進(jìn)行額外的適配工作,那么 UI 自動化框架則是把工作量都留給 AI 智能體,無需任何額外適配,但效果非常取決 AI 智能體的能力,優(yōu)勢就在于一上線就能覆蓋大量應(yīng)用。
現(xiàn)在你可以看到,在 Google 的 Android Gemini 智能體計劃中,AppFunctions 和 UI 自動化是兩條路線,互為補(bǔ)充:通過規(guī)范化、可追溯的接口方式來確保最大限度的兼容性,同時為真正代表未來的讀屏交互模式打好基礎(chǔ)。
Google 還表示,這不會只是 Gemini 的專屬功能,而是 Android 系統(tǒng)的特性。
這也意味著,未來不管是手機(jī)廠商自己內(nèi)置的 AI 助手,還是 ChatGPT 等第三方應(yīng)用,都能調(diào)用 AppFunctions 執(zhí)行任務(wù),或者「讀懂」手機(jī) UI 進(jìn)行自動操作。
值得一提的是,在國行用不了 Gemini 的情況下,三星 Galaxy S26 的 Bixby 助手也能實現(xiàn)點外賣、叫車、電商比價的功能。
我們可以合理推斷,三星在國內(nèi)也找到了一家模型供應(yīng)商來替代 Gemini 的身份,至于這些大模型小龍當(dāng)中具體是誰,可能就取決于過去一年里誰在手機(jī)智能體上成績更突出了。
![]()
AI 手機(jī)的道路,不會只有「孤勇者」
去年「豆包手機(jī)」驚艷亮相,又因為令人遺憾的情況而「早夭」。在深感遺憾的同時,也讓我們不禁去思考,AI 自動化的模式,就是 AI 手機(jī)的理想模式嗎?
這個問題,沒有個三五年也得不出答案。至少,豆包手機(jī)不是單打獨斗,手握 Android 系統(tǒng)的 Google,同樣選擇了這個路線,而且話語權(quán)大得多。
![]()
其實當(dāng)豆包手機(jī)火到海外之后,就有網(wǎng)友開始暢想,如果 Google 在 Pixel 以及 Android 手機(jī)上推廣這個技術(shù),那前景將會非常廣闊。
雖然我覺得,Google 對于怎么回答「AI 手機(jī)」這個命題,其實也沒有一個非常清晰的答案,更像是因為手上同時有 AI、系統(tǒng)和硬件,每個方向都嘗試一下,說不定就有一條路跑通了。
但至少,Google 已經(jīng)為 Android 打好了「系統(tǒng)級自動化」的樣板,接下來不少新機(jī),都有了化身「豆包手機(jī)」的潛力。
這個浪潮或許還不止于 Android 陣營。別忘了,蘋果已經(jīng)和 Google 達(dá)成合作,Gemini 將成為 Siri 的技術(shù)支持。而 App Intents 和 AppFunctions 又非常相似……
![]()
AI Siri 的演示
再往前看一點:Gemini 智能體甚至不只局限于 AI 手機(jī)。在 Sammer Samat 設(shè)想中,未來智能眼鏡、AI 吊墜,甚至是汽車,只要有 Gemini,就能用它來完成復(fù)雜的任務(wù)——當(dāng)然,這樣的場景距離落地還有距離。
不過,Google 也只是在技術(shù)層面跑通了 AI 自動化的路線,而范式成立,不代表問題消失。豆包手機(jī)當(dāng)時遇到的種種矛盾,也會成為后來者不得不面對的挑戰(zhàn)。
首先當(dāng)然是隱私和安全問題。Google 的餅畫得很大,未來調(diào)用、操作手機(jī) App 的將不僅限于 Gemini,一些第三方 AI 應(yīng)用能更深入用戶的數(shù)據(jù)核心,如果有偽裝的惡意應(yīng)用利用了這些接口,也會造成更大的損失。
![]()
圖源:9To5Google
更激烈的矛盾,是手機(jī)硬件廠商、模型/智能體能力提供商、大平臺應(yīng)用這三者之間,圍繞 AI 時代新「入口」的爭奪。這也是原版的豆包手機(jī),一度最難逾越的高墻。
畢竟,用 Gemini 叫車,可能意味著用戶不用再看到 Uber 的會員促銷、廣告推薦,甚至不再形成品牌黏性,直接損害到應(yīng)用服務(wù)商/廣告行業(yè)的收益。
中國有互聯(lián)網(wǎng)/AI 巨頭,海外何嘗不是如此?像 Meta、Amazon 這樣的老對手,本身還擁有強(qiáng)勢的平臺與生態(tài),它們未必心甘情愿對 Google 開放,讓 Gemini 來自動化一切。
無論是以隱私、安全,還是平臺規(guī)則為由,設(shè)置限制、提高接入門檻,博弈必然發(fā)生,爭斗將進(jìn)一步白熱化。
至少 Google 對未來很有信心。Sammer Samat 認(rèn)為,AI 技術(shù)已經(jīng)進(jìn)入了「正在進(jìn)行時」,開發(fā)者與其絞盡腦汁對抗 ,還不如去思考一個合適的方式擁抱它。
新與舊的對抗不可避免,即便是用戶量再大的國民級應(yīng)用也不會永遠(yuǎn)獨善其身。最終的勝利者,多半可能是那些在變革前夜,就已經(jīng)在勇敢追逐的玩家。
參考資料:
https://android-developers.googleblog.com/2026/02/the-intelligent-os-making-ai-agents.html
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.