今天,千問開了發(fā)布會,臺上指令:「幫我點 40 杯霸王茶姬的伯牙絕弦」,然后千問調(diào)用開始選商家、生成訂單、完成支付
![]()
以及,本文不聊千問的東西(虛晃一槍
只是順著這個場景往下想,我看到的是一個更底層的問題:支付
現(xiàn)代商業(yè)有三條流:信息流、商品流、資金流(沒想到吧,我還干過電商
在這里,信息流和資金流在線上,商品流在線下
過去兩年 AI 的進(jìn)展,本質(zhì)上是在革新信息流。大模型生成內(nèi)容,各種協(xié)議解決 Agent 和工具的交互,RAG 解決知識獲取。這些都是信息層面的事
但如果我們希望 AI 真正改變更多事情,讓 Agent 從「能聊天」變成「能辦事」,資金流的革命是綁不開的
![]()
為什么支付是關(guān)鍵杠桿
Agent 能幫你查資料、寫代碼、做 PPT、分析數(shù)據(jù)。這些能力已經(jīng)很強(qiáng)了,但有個共同特點:不涉及花錢
一旦任務(wù)變成「幫我買東西」「幫我訂機(jī)票」「幫我點外賣」,復(fù)雜度立刻上了一個臺階
傳統(tǒng)支付系統(tǒng)是給人設(shè)計的。整個流程假設(shè)有一個人類用戶全程在場:你打開 App,你選商品,你點支付,你驗證身份,你確認(rèn)交易。每一步都是你自己操作,出了問題你自己負(fù)責(zé)
![]()
Agent 的使用場景不一樣
你可能說「幫我監(jiān)控上海到北京的機(jī)票,低于 800 塊自動下單」,然后去睡覺了。Agent 在凌晨三點發(fā)現(xiàn)有票,需要替你做決定、替你付錢
這時候一系列問題就浮出水面:
Agent 怎么證明這筆交易是你授權(quán)的?如果你明天醒來說「我沒讓它買這個」,誰來判定?
你的支付憑證存在哪里?Agent 能不能直接接觸你的銀行卡號、支付密碼?如果能,安全怎么保證?如果不能,它怎么完成支付?
商家怎么知道對面這個 Agent 是真正代表用戶的購物助手,還是一個惡意爬蟲?傳統(tǒng)風(fēng)控模型是針對人類行為設(shè)計的,Agent 的行為模式完全不同
交易出了糾紛,責(zé)任怎么劃分?是用戶的責(zé)任、Agent 開發(fā)者的責(zé)任、還是平臺的責(zé)任?
![]()
這些問題不解決,Agent 購物就只能停留在「幫你挑商品、比價格」的階段。最后一步付款,還得把你叫回來
支付,是 Agent 商業(yè)閉環(huán)的最后一公里,這一公里不通,前面做得再好也打了折扣
全球 AI 支付的格局
過去一年,幾家頭部 AI 公司都在這個方向上有動作
OpenAI 走得最快
去年 9 月底推出 ChatGPT Instant Checkout,能在對話界面里直接完成購買。技術(shù)上和 Stripe 深度綁定,用的是一種叫 SPT(Shared Payment Token)的機(jī)制,把用戶的支付信息加密成一個令牌,只對特定金額和特定商戶有效
![]()
首發(fā)合作方是 Etsy,后來 Shopify 的 100 多萬商戶接入,再后來是 Walmart、Target、Instacart。PayPal 也談好了,今年計劃把數(shù)千萬商戶目錄接進(jìn)來
同一天還發(fā)了一份 ACP 協(xié)議(Agentic Commerce Protocol),和 Stripe 聯(lián)合搞的,Apache 2.0 開源,定義 AI Agent、商戶、支付服務(wù)商之間的交互標(biāo)準(zhǔn)
Google 走的是開放聯(lián)盟路線
今年 1 月 11 日在 NRF 大會上發(fā)布 Checkout in Gemini,和 Walmart 深度合作。用戶連接賬戶后能獲得個性化推薦,商品可以直接加到 Walmart 購物車,支持 3 小時內(nèi)送達(dá)
![]()
協(xié)議層面有兩個:UCP(Universal Commerce Protocol)解決商業(yè)交互,覆蓋從發(fā)現(xiàn)、購買到售后的全流程;AP2(Agent Payments Protocol)解決支付授權(quán),核心概念是 Mandate,一種數(shù)字簽名的授權(quán)聲明,精確定義 Agent 能執(zhí)行什么操作
AP2 的參與方陣容很豪華,60 多家組織,包括 Visa、Mastercard、American Express、Adyen、Stripe、Coinbase。Google 的策略是不追求單一平臺鎖定,要當(dāng)「基礎(chǔ)設(shè)施提供者」
Anthropic 選擇不直接下場
Claude 沒有原生支付功能,也沒有公開這方面的開發(fā)計劃。MCP 協(xié)議(Model Context Protocol)專注于 Agent 和工具的交互標(biāo)準(zhǔn),去年底已經(jīng)捐給了 Linux Foundation
![]()
如果要讓 Claude 具備支付能力,需要接 Stripe 的 MCP Server。但這只是「工具調(diào)用」,不是「交易閉環(huán)」。用戶發(fā)起支付后,還是得跳轉(zhuǎn)到支付鏈接去完成
三家的路徑選擇反映了不同的戰(zhàn)略判斷。OpenAI 要快速占領(lǐng)交易入口,Google 要構(gòu)建開放生態(tài),Anthropic 專注模型能力和安全,支付不是優(yōu)先級
![]()
不同的選擇 中國的情況
國內(nèi) AI 支付的進(jìn)展...主流賽道上,似乎目前只有支付寶在搞
去年 4 月發(fā)布了支付 MCP Server,是國內(nèi)首個。去年 9 月外灘大會上正式推出「AI 付」,首個落地場景是瑞幸的 AI 點單助手
千問這次接入的支付能力,底層就是支付寶提供的
微信支付的 MCP 去年 7 月上線,目前還是體驗版本,功能相對弱一些。京東有「AI 購」在內(nèi)測,美團(tuán)的「小美」去年 9 月公測,都在往這個方向走。但從協(xié)議層面的完整度來看,支付寶做得更系統(tǒng)
不過吧...雖然千問沒說,但...我知道是這個: ACT 協(xié)議文檔(Agentic Commerce Trust Protocols,智能體商業(yè)信任協(xié)議)
![]()
https://aipay.alipay.com/act
寫這篇文章的時候,為了防止出錯,又讀了一遍
ACT 協(xié)議的架構(gòu)
ACT 把智能體商業(yè)的需求拆成四個域
委托授權(quán)域
解決的核心問題是:怎么把用戶的自然語言指令,變成機(jī)器能理解、能執(zhí)行、事后能追溯的東西
![]()
協(xié)議里定義了一套結(jié)構(gòu)化表達(dá),字段很細(xì)。意圖基礎(chǔ)信息、授權(quán)有效期、支付方式約束、品類約束、商戶白名單和黑名單、單筆金額上限、日累計上限、周期累計上限、價格容限、超限時的處理策略(暫停并通知 / 自動取消 / 自動繼續(xù))、設(shè)備信息、地理位置、憑證簽名,加起來 30 多個字段
舉個例子,用戶說「幫我買一臺 4000 塊左右的筆記本電腦,今天之內(nèi)」。這句話會被解析成:品類是筆記本電腦,單筆金額上限 4500(留了容限),授權(quán)失效時間是今天 23:59:59,支付方式是支付寶,然后整體做數(shù)字簽名
有了這個結(jié)構(gòu)化表達(dá),后續(xù)的意圖澄清、憑證簽發(fā)、一致性校驗、糾紛追溯都有據(jù)可依
商業(yè)交互域
Agent 怎么和商家系統(tǒng)對話。包括商品元數(shù)據(jù)接口、意圖上下文傳遞、多 Agent 協(xié)作等
![]()
這里重點說一下意圖上下文傳遞。用戶說「幫我給爸媽買臺掃地機(jī)器人」,Agent 需要把這個意圖傳給電商平臺。平臺拿到之后,能推理出「防纏繞、高溫殺菌」這些老年人關(guān)注的功能點,然后篩選出合適的商品
為了更有效的傳遞信息,協(xié)議里定義了結(jié)構(gòu)化的表達(dá)格式,包括顯式意圖、隱式意圖、約束條件、用戶偏好等多個維度
支付服務(wù)域
核心設(shè)計思路是 不讓 Agent 碰敏感信息
![]()
用戶的支付賬戶會生成一個 Token。Agent 拿著這個 Token 去發(fā)起支付請求,但它不知道用戶的真實賬號。Token 本身可以限定使用范圍:只能在特定商戶用、只能特定 Agent 用、有金額上限、有時間窗口
文檔里有句話我印象比較深:「整體支付流程與原有流程基本保持一致,主要是發(fā)起支付的角色從用戶替換成智能體」
這個思路很務(wù)實。不是另起爐灶搞一套新東西,而是在現(xiàn)有支付體系上做最小改動。兼容性好,落地阻力小
信任服務(wù)域
這是 ACT 協(xié)議比較獨特的一塊
包括 Agent 身份管理(Know Your Agent)、交易風(fēng)控、聲譽(yù)評價、行為存證。解決的問題是:商家怎么區(qū)分「正常的購物 Agent」和「惡意爬蟲」?出了糾紛怎么有據(jù)可查?
![]()
傳統(tǒng)風(fēng)控模型是針對人類行為設(shè)計的。人類的點擊軌跡、瀏覽時長、下單頻率有一定規(guī)律。Agent 的行為模式完全不同,可能瞬間查詢幾十個商品、幾秒內(nèi)完成下單,這在傳統(tǒng)模型里會被判定為高風(fēng)險
信任服務(wù)域要解決的就是這個問題:建立一套針對 Agent 的風(fēng)控體系和身份認(rèn)證機(jī)制
和海外協(xié)議的對比
把各家協(xié)議放一起看,不是誰全面領(lǐng)先的問題,是各有側(cè)重
![]()
這里,還可以展開,幾個觀察:
協(xié)議完整度和落地速度是兩回事
ACT 在紙面上覆蓋最全,四個域都涉及,委托授權(quán)的字段定義也最細(xì)。但 OpenAI 的 Instant Checkout 去年 9 月就上線了,已經(jīng)接了 Etsy、100 多萬 Shopify 商戶、Walmart、Target、Instacart,實際交易在發(fā)生
協(xié)議設(shè)計得再完整,不如先跑起來迭代。這方面 OpenAI 走得最快
生態(tài)開放性上,Google 更有優(yōu)勢
AP2 拉上了 Visa、Mastercard、American Express 這些傳統(tǒng)支付網(wǎng)絡(luò)巨頭,還有 Adyen、Stripe、Worldpay 這些支付處理商。60 多家組織參與,陣容很豪華
![]()
這意味著 AP2 未來可能直接走銀行卡通道,不依賴單一支付服務(wù)商。相比之下,OpenAI 的 ACP 則是和 Stripe 深度綁定
MCP 成了某種公共基礎(chǔ)設(shè)施
Anthropic 沒有做原生支付,但 MCP 協(xié)議被各家采納:OpenAI 支持,Google 的協(xié)議設(shè)計了互操作,支付寶的 MCP Server 也上線了。去年底 MCP 捐給了 Linux Foundation,成了行業(yè)共治的開放標(biāo)準(zhǔn)
![]()
不下場做支付,反而在協(xié)議層獲得了最廣泛的認(rèn)可。這是個有意思的策略選擇
信任服務(wù)域、跨終端互操作是 ACT 獨有的
「怎么識別惡意 Agent」「怎么給 Agent 建立信用評價」這些問題,海外協(xié)議基本沒涉及。可能和市場環(huán)境有關(guān),中國的羊毛黨、爬蟲問題更突出,對這塊的需求更強(qiáng)
![]()
對于手機(jī)、眼鏡、汽車、音箱上的支付體驗怎么保持一致?不同終端的身份驗證能力怎么協(xié)商?這塊海外協(xié)議沒怎么涉及。中國的 IoT 設(shè)備多樣化程度更高,可能是這個設(shè)計出現(xiàn)的背景
為什么會有這些差異
簡單來說:環(huán)境不同
支付基礎(chǔ)設(shè)施不同
中國移動支付滲透率極高。支付寶和微信支付處理了絕大部分線上線下交易,已經(jīng)是基礎(chǔ)設(shè)施級別的存在。在這個基礎(chǔ)上疊加 Agent 能力,改動相對小
美國的支付鏈條更長更分散。信用卡體系涉及發(fā)卡行、收單行、卡組織等多方。OpenAI 要和 Stripe 合作,Google 要拉上 Visa、Mastercard、Shopify。每多一個參與方,協(xié)調(diào)成本就多一層
![]()
生態(tài)結(jié)構(gòu)不同
千問背后是阿里生態(tài)的系統(tǒng)級打通:淘寶的商品庫、支付寶的支付能力、高德的位置服務(wù)、飛豬的票務(wù)系統(tǒng)。Agent 調(diào)用這些能力,鏈路短、摩擦小
海外是開放生態(tài),各家獨立運營。AI 公司需要和電商平臺、支付網(wǎng)絡(luò)、物流服務(wù)商分別對接。這也是為什么 Google 要搞 UCP 和 AP2 這樣的開放協(xié)議,試圖用標(biāo)準(zhǔn)來降低協(xié)調(diào)成本
監(jiān)管環(huán)境不同
中國的支付監(jiān)管相對集中,支付寶和微信支付已經(jīng)有成熟的合規(guī)框架。Agent 支付可以在這個框架內(nèi)演進(jìn)
美國涉及聯(lián)邦和各州的多層監(jiān)管,金融服務(wù)的合規(guī)要求復(fù)雜。這可能也是 Anthropic 選擇不直接做支付的原因之一
正因為這些原因,AI 支付領(lǐng)域,海外雖然做得早,但國內(nèi)可能會落得快
兩種場景
ACT v1.0 重點支持兩種場景:即時確認(rèn)和委托授權(quán)
用戶即時確認(rèn)支付
用戶實時和 Agent 對話,Agent 推薦商品,用戶在場確認(rèn),然后發(fā)起支付、驗證身份、完成交易。整個過程用戶全程參與
![]()
這個場景相對簡單,和傳統(tǒng)電商的差別主要是交互方式變了。風(fēng)險可控
用戶委托授權(quán)支付
用戶預(yù)先表述意圖,明確授權(quán)范圍,生成意圖授權(quán)憑證。Agent 拿著這個憑證,可以在用戶不在場的時候自主執(zhí)行交易
![]()
比如「幫我監(jiān)控這趟火車票,有票就買」。用戶睡著了,凌晨放票,Agent 檢測到符合條件的票,自動下單、自動支付,第二天早上用戶醒來收到通知
這個場景復(fù)雜得多。意圖怎么精確表達(dá)?授權(quán)邊界怎么界定?憑證怎么防偽?超出授權(quán)范圍怎么處理?這些問題在協(xié)議里都有對應(yīng)的設(shè)計
當(dāng)然,螞蟻數(shù)字支付 CTO 朱林在外灘大會上還提過一個「AI 支付三階段」:第一階段 Agent 能收付款,第二階段支付體驗沉浸化不中斷流程,第三階段根據(jù)用戶意圖自動完成支付
千問目前到了第二階段,部分場景觸及第三階段
協(xié)議競爭的走向
目前的格局是:
? OpenAI 和 Stripe 綁定推 ACP
? Google 拉聯(lián)盟推 UCP 和 AP2
? Anthropic 專注 MCP 做工具協(xié)議
? 支付寶在中國推 ACT
有意思的是,MCP 現(xiàn)在成了某種程度上的公共標(biāo)準(zhǔn)。OpenAI 宣布支持 MCP,Google 的協(xié)議也設(shè)計了和 MCP 的互操作,支付寶的 MCP Server 去年就上線了
協(xié)議層面有合作空間。各家都不想讓協(xié)議碎片化導(dǎo)致生態(tài)割裂
競爭集中在應(yīng)用層。誰能讓用戶習(xí)慣在自己的入口完成購物,誰就占住了這個位置。OpenAI 有 ChatGPT 的用戶基礎(chǔ),Google 有搜索和 Android,支付寶有中國的支付入口
接下來看什么
這個領(lǐng)域還在早期,幾個方向值得關(guān)注:
異步執(zhí)行場景的成熟度
「監(jiān)控價格自動下單」這類場景,用戶不在場,風(fēng)險更高,對意圖表達(dá)和授權(quán)機(jī)制的要求也更高。這塊的體驗和風(fēng)控還有很多工作要做
跨平臺互操作
現(xiàn)在各家 Agent 基本只能在自家生態(tài)內(nèi)完成交易。如果用戶想讓 Agent 同時比較淘寶、京東、拼多多的價格然后下單,目前做不到。這需要協(xié)議層面的打通
監(jiān)管框架的演進(jìn)
Agent 代替用戶做支付決策,出了問題責(zé)任怎么認(rèn)定?現(xiàn)有的消費者保護(hù)法規(guī)是假設(shè)人類用戶在操作。這塊需要新的規(guī)則
信任體系的建立
怎么給 Agent 建立身份認(rèn)證和信用評價?怎么讓商家區(qū)分好的 Agent 和壞的 Agent?這個問題不解決,商家對 Agent 流量的態(tài)度會很矛盾
收尾
千問發(fā)布會演示的那杯奶茶,背后是一整套基礎(chǔ)設(shè)施在支撐
Agent 要從「能聊天」變成「能辦事」,信息流的問題大模型解決了,商品流有電商和物流體系,資金流是最后要啃的硬骨頭
全球幾家頭部公司都在這個方向上投入,路徑選擇不同,進(jìn)度不同,但方向一致
中國的環(huán)境,有獨特優(yōu)勢
支付基礎(chǔ)設(shè)施成熟,超級 App 生態(tài)完整,協(xié)調(diào)成本低。支付寶的 ACT 協(xié)議在覆蓋范圍和細(xì)節(jié)顆粒度上做得比較系統(tǒng)。這是千問能做到「對話里直接買東西」的底層原因
至于最終會形成什么格局,現(xiàn)在判斷太早。協(xié)議標(biāo)準(zhǔn)還在演進(jìn),各家產(chǎn)品還在迭代,監(jiān)管框架還沒成型
![]()
但有一點,是清楚的:
誰能讓 Agent 順暢地完成支付,誰就拿到了 AI 時代商業(yè)閉環(huán)的關(guān)鍵鑰匙
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.