網易首頁 > 網易號 > 正文申請入駐

保守的谷歌，激進的豆包

2025-12-05 18:44:53　來源: 略大參考

北京舉報

分享至

技術創新必須以尊重用戶權益和遵守監管要求為前提。

作者|高　進

編輯|楊知潮

時至今日，用戶仍然不能使用谷歌自家的AI助手，調用谷歌郵箱發一封郵件。

和不久前發布的豆包手機助手相比，谷歌的AI功能實在太過“落后”。畢竟在之前的用戶實測里，它已經可以繞開APP界面，直接幫用戶下單，還能自動回復微信消息。

但這不意味著谷歌的技術不如豆包，畢竟AI背后不止有技術，還有用戶的安全和企業的責任。過于激進的方案，往往難以推進。

12月5日，在經歷微信、支付寶、淘寶、農業銀行等多家APP的“拒絕登陸”之后，豆包手機助手發布關于調整AI操作手機能力的說明。

說明指出：

為了讓技術發展、行業接受度和用戶體驗多方都能形成良性適配，我們計劃在接下來的一段時間，在部分場景，對AI操作手機的能力做一些規范化調整。具體包括，但不限于進一步限制金融類應用的使用：銀行、互聯網支付等金融場景，直接關聯用戶的資金安全，雖然手機助手在敏感操作時都需要用戶授權，但審慎起見，豆包手機助手也將暫時下線操作這類APP的能力。我們也會積極與相關廠商溝通，希望共同制定清晰、安全的AI操作行為準則。

和前兩天更為強硬的辯駁聲明相比，這份聲明在姿態上已經柔軟很多，聲明主要說兩點：一、我們對于有些限制類應用還是保持敬畏；二、我們愿意和大伙兒溝通，找到一個各方都能接受的行為標準。

總之，豆包降低了方案的激進程度。畢竟，此前的方案或許在一定程度上突破了技術邊界，但也同時突破了傳統的用戶安全體系、監管體系、廠商合作模式的邊界。

01 豆包的遭遇不是創新者困局？

全球AI Agent的發展如火如荼。自2023年AutoGPT開啟智能體序幕以來，從個人助手到企業級解決方案，AI Agent展現出前所未有的活力。微軟、谷歌、亞馬遜等科技巨頭紛紛布局AI/Agent平臺，在基礎設施、多模態能力等方面各有優勢。

豆包的方案術屬于GUI Agent的技術路線，本身并不新奇。GUI Agent是一種基于多模態視覺模型驅動的人工智能系統，能夠自動推理并執行圖形用戶界面（GUI）交互，模擬人類用戶的操作如點擊、輸入、拖拽等，以完成工作任務。

無獨有偶，豆包手機助手發布兩天前，大模型獨角獸階躍星辰開源了跟豆包手機助手同類型的GUI Agent技術——名為GELab-Zero的套組。

在全球范圍內，GUI Agent技術的應用一直較為謹慎。以蘋果的Siri和谷歌的Google Assistant為例，這些主流的智能助手雖然能夠通過語音指令完成部分操作，但它們嚴格遵循API（應用程序編程接口）調用的方式，避免直接觸碰應用程序的核心功能。這種做法既保證了用戶隱私和數據安全，也避免了與應用程序開發者或監管機構的潛在沖突。

在國內，GUI Agent技術的落地同樣面臨著嚴格的考驗。百度、華為等廠商在推出各自的智能助手時，也選擇了與應用程序開發者合作，通過API接口實現功能對接。這種方式雖然需要更多的溝通和協調，但能夠確保技術的應用符合行業規范和監管要求。

然而，豆包手機助手卻選擇更為激進的路徑，繞過微信、支付寶等主流App的安全體系，豆包試圖通過用戶授權直接操作這些應用程序的界面。這種激進的方案不僅引發了應用開發者和用戶的不滿，也暴露了GUI Agent技術在實際應用中可能存在的合規性和安全性問題。

02 為什么說豆包的方案是激進的

豆包的方案，不止是對互聯網合作關系的挑戰，它還忽視了現有的成熟互聯網賬號安全體系。

經過幾十年的發展，互聯網公司的賬戶安全體系設計可謂環環相扣、層層設防。以登錄驗證為例，有傳統的密碼驗證，也有更為安全的雙重驗證，如短信驗證碼、指紋、面部識別等。還有權限控制機制，嚴格限制不同用戶對數據的訪問權限，防止未經授權的訪問。反欺詐檢測系統則能實時監測異常登錄行為，如異地登錄、頻繁登錄失敗等，及時采取凍結賬戶等措施。

這些安全機制如果被繞開，存在風險。比如：如果繞過登錄驗證，攻擊者就能獲取用戶賬號，進而竊取用戶隱私信息，如社交賬號中的聊天記錄、聯系人信息，支付賬戶中的資金、交易記錄等。繞開權限控制，可能導致數據被隨意篡改或泄露，破壞數據的完整性與保密性。而跳過反欺詐檢測，異常行為將難以被及時發現和處理。一旦發生安全問題，豆包將面臨用戶信任危機，甚至可能承擔法律責任，畢竟用戶是基于對豆包的信任才授權其操作。

豆包的方案之所以引發爭議，核心還在于其忽略了互聯網行業在賬號安全和監管方面的“防護欄”。微信、支付寶等App早已建立了嚴格的安全防護機制，防止第三方程序繞過其官方授權，直接操作用戶的賬號和數據。在金融支付領域，監管機構對數據安全和用戶隱私的要求尤為嚴格。金融支付App通常需要通過多重身份驗證和安全協議，確保用戶操作的安全性。豆包試圖通過用戶授權直接跳過這些安全機制，這種做法不僅可能威脅到用戶的賬號安全，還可能違反相關法律法規。

此外，豆包的方案還涉及到一個關鍵問題：它是否能夠接過所有App的平臺責任，并滿足監管需求？金融支付類App涉及用戶的財產安全，一旦出現數據泄露或操作失誤，責任歸屬將變得極其復雜。豆包作為第三方平臺，是否具備足夠的技術和能力來承擔這些責任？就像自動駕駛機構，能否承擔車輛行駛的全部安全責任？

如果答案存疑，豆包的方案就如同在現階段推出L5全自動駕駛一樣——還沒有成熟的條件。

從全球范圍來看，任何試圖繞過應用開發者和監管機構的方案都難以獲得廣泛支持。過于激進的GUI Agent方案不僅可能威脅到用戶的隱私和安全，還可能引發監管部門的審查和處罰。

03 走得穩一點

技術創新必須以尊重用戶權益和遵守監管要求為前提。這不是保守，而是對用戶的責任體現。

如何在維持目前的互聯網安全體系基礎上，手機智能助手等智能體之間可實現不同賬戶體系之間的互通，為用戶帶來更大價值？

谷歌早就做了示范：作為安卓系統中樞的谷歌助手（或Gemini），在用戶首次調用第三方應用時，會清晰列出它需要訪問的用戶數據和權限。用戶必須主動登錄 Google 賬號并點擊授權才能繼續。

在涉及到用戶隱私的應用，如郵箱時，谷歌表現得非?？酥?，Gemini只有在用戶請求時才會調用相關數據，且不會進行發布郵件等敏感行為。

圖注：作為谷歌自家的AI助手，Gemini發郵件沒有任何技術門檻，但有些行為，是出于對用戶的責任感。

國內廠商里，OPPO和支付寶的合作也提供了參考。2025年10月17日，在以“AI，更近一步”為主題的2024 OPPO開發者大會上，支付寶發布了AHA（Agent Hub Access）智能體互聯協同解決方案。這一方案旨在通過安全可控的方式，實現智能助手與應用程序之間的高效協作。

AHA解決方案的核心在于構建了一個智能體互聯的樞紐。它能夠將手機操作系統、手機廠商自研的AI大模型以及各類第三方應用服務緊密連接起來。在這一樞紐的作用下，AI助手不再是孤立的個體，而是能夠與各種應用進行智能交互的協同伙伴。比如用戶想要訂餐，不需要再單獨打開外賣App，只需向AI助手發出指令，助手就能通過AHA解決方案與外賣App進行交互，快速完成訂餐流程。

AHA解決方案在保障安全方面也下足了功夫。它遵循嚴格的安全標準和協議，確保用戶數據在傳輸和存儲過程中的安全性。在用戶授權方面，采用了透明且明確的授權機制，讓用戶清楚地知道自己的數據將被用于哪些服務，充分尊重用戶的知情權和選擇權。

這一方案還具備很強的開放性和兼容性。它能夠接入不同廠商的AI助手和各類應用，為整個AI助手行業提供了一個標準化的互聯互通平臺。這不僅有助于推動行業技術的創新發展，還能讓更多的開發者參與到生態建設中。

今年工信部、信通院等機構也在積極推進國家多智能體互聯的標準，工信部牽頭的《人工智能智能體互聯》系列標準也已發布，螞蟻集團做為核心參編方牽頭編寫，AHA作為重要業界實踐參考。

不可否認的是，未來，GUI Agent技術將持續發展，豆包的方案不是第一個也不是最后一個方案，無論如何，AI必須建立在對用戶隱私、數據安全和行業監管的尊重之上。只有通過合規與合作的方式，才能真正實現技術的價值，為用戶提供更優質的智能服務。

頭圖來源|AI制圖

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.