財聯社2月27日訊(記者 付靜)昨日舉行的三星年度旗艦手機發布會上,三星聯手谷歌首次公開展示三星Galaxy S26新品上的Gemini手機智能體。這一新品或成為Apple Intelligence(蘋果智能,蘋果公司發布的個人智能系統)后續升級的一次預演,因而受到產業關注。
財聯社記者觀察到,這場發布會以手機智能體為重點,這也正是當下AI手機領域的重要發展趨勢。更為值得關注的是技術路線,此前部分廠商的手機智能體GUI能力仍存在爭議,AI手機入口之爭形成,此次谷歌Gemini智能體則采取了更為穩妥的雙技術路線。
“谷歌的手機智能體技術方案有機會成為一種標準方案,它可以實現AI的自動操作,又能大幅降低App的抵觸心態。在二者之間找到一個平衡,從而緩解入口之爭的沖突。”艾媒咨詢CEO張毅在接受財聯社記者采訪時表示。
手機智能體加速普及
據悉,三星S26系列三款機型均搭載Gemini智能體,同時保留Perplexity網絡查詢引擎及三星自研大模型驅動的設備端助理Bixby。Gemini智能體可自主完成點外賣、叫車等跨應用操作。
此次Gemini手機智能體對三星Galaxy S26的加持,事實上亦是接下來Apple Intelligence升級的一次預演。
今年初,蘋果、谷歌宣布達成多年期深度合作協議,蘋果下一代基礎模型(Apple Foundation Models)將基于谷歌的Gemini模型及云技術構建,為Apple Intelligence功能及今年推出的個性化Siri提供核心技術支持。
與此同時,谷歌安卓生態系統總裁Sameer Samat表示,此類自動化功能將作為安卓17系統升級重點于今年晚些時候推送,當前僅適配優步、Grubhub和DoorDash等少數應用,原生支持依賴開發者接入MCP協議或安卓應用功能框架。
近兩年,華為、榮耀、OPPO、vivo等廠商紛紛在旗艦機型里注入AI能力,做出AI手機智能體的嘗試,去年底發布的豆包手機助手也一度火爆。可以預見,手機智能體將保持加速普及。
具體到技術層面,承擔著幫助Android操作系統和Apple Intelligence在AI時代實現能力飛躍重任的谷歌,采取了何種方案?
財聯社記者查閱安卓官網相關開發者文檔了解到,Gemini要在手機端實現“自動跨應用操作”,主要有Android AppFunctions、UI automation(讀屏自動化)兩條路徑。
開發者文檔顯示,Android AppFunctions“模仿MCP云服務器聲明后端功能的方式,為Android應用提供了設備上的解決方案。與WebMCP非常相似,它在設備上本地執行這些功能,而不是在服務器上。”
同時,針對UI automation,安卓方面表示“我們也在開發一套UI自動化框架,以便智能體能夠智能地在應用程序上執行通用任務。Gemini使用應用程序中已有的上下文來幫助完成任務,不需要任何開發人員的工作。”據悉,UI automation內置了用戶透明度和控制權機制。對于任何自動化操作,用戶可監控任務進度,并在任何時候切換到手動控制進行接管。
有App開發者向財聯社記者分析,Gemini手機智能體的技術方案采用了系統底層/應用層API、AI讀屏并行的方式,且兩種方式需要用戶和App雙重授權。在邏輯上,API方式優先,不直接采用讀屏方式。
其認為,谷歌蹚出了GUI路線需要遵循的基本原則,如亮明執行主體、限定執行環境和執行范圍等。
張毅告訴財聯社記者,“我理解這是API優先、讀屏兜底的技術路線。對App開發者來說,愿意開放接口就走安全的API,部分不愿意適配的就用讀屏方式。這更合規、更安全,對于App的主權來講,也是更尊重的一種體現。”
生態沖突有望緩解?
財聯社記者此前報道,雖然AI技術為用戶帶來諸多便利,但從此前國內的產業發展情況看,不少廠商將“AI Agent高權限能力”作為技術賣點,手機廠商、AI解決方案提供方與App開發者之間已經形成了入口之爭。
去年12月初,淘寶、微信、農業銀行、建設銀行等多款App就先后出現了針對AI手機屏幕共享監測以及風控的措施。上述措施曾被網友解讀為App對AI手機助手憑借底層權限、實現跨應用操作所引發隱私擔憂的側面回應。
值得關注的是,Sameer Samat還在三星發布會上談到了獲得App生態支持的重要性:“對于把安卓從手機操作系統轉變為智能系統,最大的障礙依然是App開發者。目前,這項任務自動化功能僅限于優步、外賣平臺Grubhub和DoorDash等少數App。希望今年晚些時候能有更多的App支持智能體操作。”
上述開發者文檔也強調了跟App生態合作的重要性:“我們目前正與一小部分App開發者合作,致力于打造高質量的用戶體驗,并隨著生態系統的發展不斷優化。”
為何最大的障礙來自開發者?張毅分析,“因為沒有統一的標準、沒有明確的收益,那開發者如何為AI開放API呢?這顯然是沒有道理的。”
“前述沖突,本質上是入口控制權和數據安全以及利益分配之間的平衡之爭。它根本不是技術問題,而是生態主導權的問題。長期來看,如何去平衡入口控制權、數據安全、利益分配,這就成為一門互相博弈的藝術。”張毅表示。
值得注意的是,豆包今日發布的一則聲明顯示:“屏幕視覺理解與自動化操作能力,是當前全球AI終端領域的前沿技術創新方向,谷歌近期發布的新款手機也搭載了與豆包手機助手同類技術驅動的自動操作功能。”
不過有媒體報道稱,Gemini手機智能體與豆包手機助手的GUI方案并不完全相同。
此前,一位國產手機廠商AI技術研發人士對財聯社記者表示,豆包手機助手的發布對于整個手機行業、生態發展帶來了積極促進作用,但可能并非是AI手機最終形態。“從技術方案來說,GUI是中間形態,最終廠商還是要共建生態為用戶提供服務,大概率還是會通過agent to agent(A2A,智能體互聯)的形式。”
張毅認為,如果能夠實現API標準化,并且能夠分級進行授權,最終實現整個生態的共贏,應該是一個重要方向。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.