![]()
技術創新必須以尊重用戶權益和遵守監管要求為前提。
作者|高 進
編輯|楊知潮
時至今日,用戶仍然不能使用谷歌自家的AI助手,調用谷歌郵箱發一封郵件。
![]()
和不久前發布的豆包手機助手相比,谷歌的AI功能實在太過“落后”。畢竟在之前的用戶實測里,它已經可以繞開APP界面,直接幫用戶下單,還能自動回復微信消息。
但這不意味著谷歌的技術不如豆包,畢竟AI背后不止有技術,還有用戶的安全和企業的責任。過于激進的方案,往往難以推進。
12月5日,在經歷微信、支付寶、淘寶、農業銀行等多家APP的“拒絕登陸”之后,豆包手機助手發布關于調整AI操作手機能力的說明。
說明指出:
為了讓技術發展、行業接受度和用戶體驗多方都能形成良性適配,我們計劃在接下來的一段時間,在部分場景,對AI操作手機的能力做一些規范化調整。具體包括,但不限于進一步限制金融類應用的使用:銀行、互聯網支付等金融場景,直接關聯用戶的資金安全,雖然手機助手在敏感操作時都需要用戶授權,但審慎起見,豆包手機助手也將暫時下線操作這類APP的能力。我們也會積極與相關廠商溝通,希望共同制定清晰、安全的AI操作行為準則。
和前兩天更為強硬的辯駁聲明相比,這份聲明在姿態上已經柔軟很多,聲明主要說兩點:一、我們對于有些限制類應用還是保持敬畏;二、我們愿意和大伙兒溝通,找到一個各方都能接受的行為標準。
總之,豆包降低了方案的激進程度。畢竟,此前的方案或許在一定程度上突破了技術邊界,但也同時突破了傳統的用戶安全體系、監管體系、廠商合作模式的邊界。
01 豆包的遭遇不是創新者困局?
全球AI Agent的發展如火如荼。自2023年AutoGPT開啟智能體序幕以來,從個人助手到企業級解決方案,AI Agent展現出前所未有的活力。微軟、谷歌、亞馬遜等科技巨頭紛紛布局AI/Agent平臺,在基礎設施、多模態能力等方面各有優勢。
豆包的方案術屬于GUI Agent的技術路線,本身并不新奇。GUI Agent是一種基于多模態視覺模型驅動的人工智能系統,能夠自動推理并執行圖形用戶界面(GUI)交互,模擬人類用戶的操作如點擊、輸入、拖拽等,以完成工作任務。
無獨有偶,豆包手機助手發布兩天前,大模型獨角獸階躍星辰開源了跟豆包手機助手同類型的GUI Agent技術——名為GELab-Zero的套組。
在全球范圍內,GUI Agent技術的應用一直較為謹慎。以蘋果的Siri和谷歌的Google Assistant為例,這些主流的智能助手雖然能夠通過語音指令完成部分操作,但它們嚴格遵循API(應用程序編程接口)調用的方式,避免直接觸碰應用程序的核心功能。這種做法既保證了用戶隱私和數據安全,也避免了與應用程序開發者或監管機構的潛在沖突。
在國內,GUI Agent技術的落地同樣面臨著嚴格的考驗。百度、華為等廠商在推出各自的智能助手時,也選擇了與應用程序開發者合作,通過API接口實現功能對接。這種方式雖然需要更多的溝通和協調,但能夠確保技術的應用符合行業規范和監管要求。
然而,豆包手機助手卻選擇更為激進的路徑,繞過微信、支付寶等主流App的安全體系,豆包試圖通過用戶授權直接操作這些應用程序的界面。這種激進的方案不僅引發了應用開發者和用戶的不滿,也暴露了GUI Agent技術在實際應用中可能存在的合規性和安全性問題。
02 為什么說豆包的方案是激進的
豆包的方案,不止是對互聯網合作關系的挑戰,它還忽視了現有的成熟互聯網賬號安全體系。
經過幾十年的發展,互聯網公司的賬戶安全體系設計可謂環環相扣、層層設防。以登錄驗證為例,有傳統的密碼驗證,也有更為安全的雙重驗證,如短信驗證碼、指紋、面部識別等。還有權限控制機制,嚴格限制不同用戶對數據的訪問權限,防止未經授權的訪問。反欺詐檢測系統則能實時監測異常登錄行為,如異地登錄、頻繁登錄失敗等,及時采取凍結賬戶等措施。
這些安全機制如果被繞開,存在風險。比如:如果繞過登錄驗證,攻擊者就能獲取用戶賬號,進而竊取用戶隱私信息,如社交賬號中的聊天記錄、聯系人信息,支付賬戶中的資金、交易記錄等。繞開權限控制,可能導致數據被隨意篡改或泄露,破壞數據的完整性與保密性。而跳過反欺詐檢測,異常行為將難以被及時發現和處理。一旦發生安全問題,豆包將面臨用戶信任危機,甚至可能承擔法律責任,畢竟用戶是基于對豆包的信任才授權其操作。
豆包的方案之所以引發爭議,核心還在于其忽略了互聯網行業在賬號安全和監管方面的“防護欄”。微信、支付寶等App早已建立了嚴格的安全防護機制,防止第三方程序繞過其官方授權,直接操作用戶的賬號和數據。在金融支付領域,監管機構對數據安全和用戶隱私的要求尤為嚴格。金融支付App通常需要通過多重身份驗證和安全協議,確保用戶操作的安全性。豆包試圖通過用戶授權直接跳過這些安全機制,這種做法不僅可能威脅到用戶的賬號安全,還可能違反相關法律法規。
此外,豆包的方案還涉及到一個關鍵問題:它是否能夠接過所有App的平臺責任,并滿足監管需求?金融支付類App涉及用戶的財產安全,一旦出現數據泄露或操作失誤,責任歸屬將變得極其復雜。豆包作為第三方平臺,是否具備足夠的技術和能力來承擔這些責任?就像自動駕駛機構,能否承擔車輛行駛的全部安全責任?
如果答案存疑,豆包的方案就如同在現階段推出L5全自動駕駛一樣——還沒有成熟的條件。
從全球范圍來看,任何試圖繞過應用開發者和監管機構的方案都難以獲得廣泛支持。過于激進的GUI Agent方案不僅可能威脅到用戶的隱私和安全,還可能引發監管部門的審查和處罰。
03 走得穩一點
技術創新必須以尊重用戶權益和遵守監管要求為前提。這不是保守,而是對用戶的責任體現。
如何在維持目前的互聯網安全體系基礎上,手機智能助手等智能體之間可實現不同賬戶體系之間的互通,為用戶帶來更大價值?
谷歌早就做了示范:作為安卓系統中樞的谷歌助手(或Gemini),在用戶首次調用第三方應用時,會清晰列出它需要訪問的用戶數據和權限。用戶必須主動登錄 Google 賬號并點擊授權才能繼續。
在涉及到用戶隱私的應用,如郵箱時,谷歌表現得非常克制,Gemini只有在用戶請求時才會調用相關數據,且不會進行發布郵件等敏感行為。
![]()
圖注:作為谷歌自家的AI助手,Gemini發郵件沒有任何技術門檻,但有些行為,是出于對用戶的責任感。
國內廠商里,OPPO和支付寶的合作也提供了參考。2025年10月17日,在以“AI,更近一步”為主題的2024 OPPO開發者大會上,支付寶發布了AHA(Agent Hub Access)智能體互聯協同解決方案。這一方案旨在通過安全可控的方式,實現智能助手與應用程序之間的高效協作。
AHA解決方案的核心在于構建了一個智能體互聯的樞紐。它能夠將手機操作系統、手機廠商自研的AI大模型以及各類第三方應用服務緊密連接起來。在這一樞紐的作用下,AI助手不再是孤立的個體,而是能夠與各種應用進行智能交互的協同伙伴。比如用戶想要訂餐,不需要再單獨打開外賣App,只需向AI助手發出指令,助手就能通過AHA解決方案與外賣App進行交互,快速完成訂餐流程。
AHA解決方案在保障安全方面也下足了功夫。它遵循嚴格的安全標準和協議,確保用戶數據在傳輸和存儲過程中的安全性。在用戶授權方面,采用了透明且明確的授權機制,讓用戶清楚地知道自己的數據將被用于哪些服務,充分尊重用戶的知情權和選擇權。
這一方案還具備很強的開放性和兼容性。它能夠接入不同廠商的AI助手和各類應用,為整個AI助手行業提供了一個標準化的互聯互通平臺。這不僅有助于推動行業技術的創新發展,還能讓更多的開發者參與到生態建設中。
今年工信部、信通院等機構也在積極推進國家多智能體互聯的標準,工信部牽頭的《人工智能 智能體互聯》系列標準也已發布,螞蟻集團做為核心參編方牽頭編寫,AHA作為重要業界實踐參考。
不可否認的是,未來,GUI Agent技術將持續發展,豆包的方案不是第一個也不是最后一個方案,無論如何,AI必須建立在對用戶隱私、數據安全和行業監管的尊重之上。只有通過合規與合作的方式,才能真正實現技術的價值,為用戶提供更優質的智能服務。
頭圖來源|AI制圖
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.