![]()
智東西
作者 李水青
編輯 云鵬
智東西3月19日報道,3月17日,阿里推出全球首個AI原生企業級Agent平臺——悟空,引起產業人士的廣泛關注。
這不僅是阿里成立CEO吳泳銘親自掛帥的ATH事業群后的首秀,也是其繼千問之后打造的又一AI Agent重要入口,或將影響全國2000萬釘釘企業客戶及近8億用戶,實際體驗如何?
智東西第一時間獲得了悟空內測碼并對此進行了體驗。進入悟空,我們能看到這是一個類似于OpenClaw對話框的界面,算力消耗按“算粒”來計算,每日更新100個免費算粒,大概可以執行4-8個中等復雜任務。
![]()
▲悟空體驗界面
實測下來,悟空在三方面的表現可圈可點,但也有明顯邊界:
在基礎認知與任務拆解方面,給它“新開咖啡館要引流”,兩分鐘后,它既給出了完整的活動方案,也搭好了可直接預約的落地頁。模糊指令到可準確執行輸出,銜接流暢。
在企業級系統與工具調用方面,讓它去1688篩選符合條件的三家貨源,它能自主登錄、檢索、糾錯,最后生成一張包含商品信息、店鋪評分、溝通記錄的釘釘表格。復雜多步驟任務完成度不錯。但涉及通訊錄權限時其也顯出局限,讓它定時給好友發消息,它啟動了任務,消息卻發給了我自己。
在創意內容生成與精準控制方面,讓它做24節氣視頻,詩句和節氣能一一對應,飄落花瓣粒子效果也能呈現;讓它用“動畫大師”做GDP排行榜,數據準確,還能根據“左邊有點空”的反饋迭代修改。但在動態插畫、地圖輪廓這類細節上,生成精度還有差距。
總體來看,悟空在處理開放性任務、打通多平臺操作上已經展現出實用價值,但權限邊界和細節控制在當前版本仍有進步空間。
一、基礎認知、任務拆解和執行:腦子好用手速快
按慣例,我們首先看看悟空的基礎認知與任務拆解能力如何,這是完成更復雜任務的基礎。
提示詞:悟空,我是一家未來科技城新開的咖啡館,下周開業,幫我策劃一個線上引流活動,目標是讓附近3公里的白領都知道我們。
這一題是為了測試悟空是否能準確理解模糊指令,并將其拆解為可執行的、邏輯連貫的子任務。
可以看到,當悟空接到任務,一邊為我創建一個活動營銷頁面,用于推廣開業活動,給出了應用創建過程鏈接;一邊為我完善整個線上引流活動的策劃方案,直接在對話框里呈現內容。
![]()
▲悟空將需求拆解為兩個任務進行執行
大概2分鐘之后,線上引流活動的策劃方案首先輸出,給出了開業首周優惠、 社交裂變傳播、會員鎖定策略等核心活動設計,以及精準地域投放、寫字樓滲透、社群運營等推廣渠道策略。整體消耗4.6個算粒。
![]()
▲悟空生成的線上引流活動的策劃方案
下圖是悟空隨后給出的營銷落地頁面,包括客戶端和手機端兩個版本,預約入口點進去可操作,頁面風格與咖啡店調性契合,落地頁內容覆蓋了前面提及的各種營銷措施和基本的時間地點信息,幾乎不需要修改,就能直接應用。
![]()
▲悟空生成的營銷落地頁面
可以看到,盡管我的需求比較模糊,悟空能夠理解“線上引流”的內涵和玩法,給出了比較具體的方案,還給出了明確可執行的活動時間節點,以及比較符合咖啡店行情的預算建議和效果預期。
接下來,我通過一個域名查詢的題目,來考察悟空的信息檢索與執行。
提示詞:悟空,幫我查一下example.com域名是否被占用,如果可用,多少錢能買?
僅僅花了30秒,消耗0.7個算粒,悟空就自動查詢了域名注冊信息,反饋這個域名是已經被占用的狀態,展示出比較敏捷的信息檢索能力。
![]()
▲悟空回復內容截圖
二、企業級系統與工具調用升級:復雜的活也能干,一些權限管得嚴
接下來,我們將體驗升級,把悟空放到更復雜的企業工作環境中進行測試。
提示詞:悟空,1688上找一下“露營折疊椅”的高性價比貨源,要求供應商必須有牛頭標(誠信通),且最近一周評價量大于100。篩選出3家,把溝通記錄和樣品申請狀態同步更新到一個鋪貨表格里。
這一題是為了測試悟空打通企業權限、操作第三方軟件、讀寫數據的能力,這是企業級Agent的核心。悟空大概耗時5分鐘,消耗了34.7算粒,最終給出了一份準確的表格統計。
在輸入提示詞的同時,我勾選了“1688選品”這個Skill,緊接著悟空就開始執行我的命令。它首先打開了1688官網,首次訪問需要我手動登錄賬號。在我登錄之后,悟空就開始自動檢索搜集。
![]()
▲悟空自動在1688進行檢索
在這個過程中,悟空出現了2次搜索出0個結果的情況,但它立刻找到了是“類別選錯”等問題,于是自行進行了糾正并搜索出正確結果。
緊接著悟空就開始進行統計信息,不同于人類用戶需要依次點開頁面的動作,悟空的1688界面停在了搜索結果總覽,聊天界面上直接輸出了我需要的統計結果,大概2-3分鐘后,其給出了一個可點擊的表格鏈接。
![]()
▲悟空輸出的答案
點開鏈接可見釘釘文檔的界面,這是悟空內置的表格功能支持,可見三家店鋪對應商品ID、商品標題、商品鏈接、主圖URL、價格、近期成交件數、店鋪名稱、店鋪鏈接、誠信通年限、回頭率、綜合評分、服務標簽、溝通記錄和樣品申請狀態等維度都詳細出現在表格中。
![]()
![]()
▲悟空生成的表格頁面截圖
點擊某家的商品鏈接,可見與商品對應準確,悟空交付了最終的正確結果,整體花了5分鐘,消耗了34.7個算粒。
![]()
▲點開鏈接可以看到正確的商品頁
悟空的一大特征是,其也內置在釘釘App中,用戶可以在手機釘釘App通過與悟空對話,完成與客戶端一樣的操控。于是我嘗試用手機釘釘發送了一個小任務。
提示詞:每到整點給小白發消息,提醒他喝水,站起來走走。
悟空在接到任務后,沒有發現專門用于定時發送消息的技能,但它使用use_cron 來創建定時任務,結合釘釘工作空間技能來發送消息,并告訴我任務已啟用。
![]()
▲用手機釘釘App對話可以操控悟空
但當我以為設置成功的時候,我的朋友小白并沒有在整點收到消息,而是我和悟空的對話框中,我自己收到了這條消息。
![]()
▲悟空的任務執行頁面截圖
智東西猜想,背后是釘釘并沒有給悟空單獨給通訊錄好友發消息的權限,這也可以理解,如果這個口子放開,可能我們的對話框里會充斥各種AI定時發送的廣告轟炸,也可能我們的悟空會被別人通過對話操控,對釘釘用戶的體驗帶來損傷。
不過,悟空在這一任務中的問題是,應該明確說明問題,而不是啟動一個不太準確呈現提示詞需求的類似任務。
提示詞:幫我發郵件給xxx,邀請他來參加我們4月21-22日舉辦的2026中國生成式AI大會(北京站),在北京富力萬麗酒店舉行。
可以看到,悟空不到一分鐘就為我準備好了郵件草稿,但由于我的釘釘郵箱無法直接發送到這個外部郵箱,它僅為你創建了一封HTML格式邀請郵件,沒有替我操作郵件。
![]()
▲悟空生成的郵件內容參考
總的來說,阿里悟空目前在通訊錄等方面仍設置了權限邊界,一方面限制了悟空的管理權限,讓悟空看起來不如龍蝦那么全能,另一方面其也帶來了更多安全感,避免造成企業級的信息泄露、業務中斷等問題。
三、創意內容生成與精準控制:文化理解和數據提取準確,動態效果仍待提升
最后,我比較關注多模態與創作能力的結合,體驗了悟空的創意執行與確定性輸出能力。
提示詞:幫我做一個動畫視頻,以24節氣為主題,每個節氣搭配一句古詩和動態插畫,運用“水墨溶解轉場”與“飄落花瓣粒子”效果。
這個題目圍繞“節氣詩會”主題,主要考驗悟空能否理解中國24節氣文化,以及對特定動態效果的生成情況。
大概花了10分鐘,悟空生成了以下1分36秒的視頻,可見其完整準確地依次按順序生成了二十四節氣,并且配上了與該節氣契合的詩句;在動效上,飄落花瓣粒子呈現比較準確和水墨溶解轉場基本呈現,動態插畫則沒有加入。整體畫風比較簡潔。
![]()
▲悟空生成的視頻部分截圖
于是我進一步加大難度,想要考察悟空的數據檢索,以及精確控制動畫每一幀,區別于普通AI視頻的隨意性的能力。
提示詞:悟空,通過動畫大師幫我做一個中國城市GDP排行榜動畫視頻,榜單展示前十名,用Lightmo風格。
如下圖所示,悟空自動調用了“動畫大師”這一Skill,為我制作了一個關于中國2025年GDP十大城市的動效視頻,符合 Lightmo風格(輕盈現代風格)。
從數據上來看,悟空思考過程顯示,其一開始找到了官方的純GPD總量排名以及華頓經濟研究院綜合排行榜,最后選用了更符合需求的第一個版本數據。可以看到,視頻載入數據與官方實際公布數據吻合,沒有出現錯誤。
![]()
▲悟空生成的視頻部分截圖
從動畫效果來看,雖然呈現了需求,但我認為視頻左邊畫面比較空,于是再次輸入提示詞要求悟空進一步修改完善視頻。
提示詞:視頻的左邊有點空,可以以中國地圖為背景,地圖上依次出現前十名城市所在位置的標記點。
可以看到,悟空確實生成了一些相對位置的標記點,但是中國地圖的輪廓卻看不出來。整體花費了近15分鐘,近60個算粒。
![]()
▲悟空生成的視頻部分截圖
最后,我還讓悟空幫我做了電商主圖優化,主要考察悟空分析主圖問題、自動調整設計能力。
提示詞:悟空,這個商品主圖點擊率低,幫我優化一下,目標人群是4歲女童。
如下圖所示,上圖是優化前的圖片,下圖是優化后的圖片,下圖相比左圖在背景顏色、圖案上進行了調整,變得更具備可愛風的特點。
![]()
![]()
時間有限,智東西本次只是針對對一小部分場景對悟空進行了體驗。在悟空“技能中心”,我們還能看到近百種推薦Skill可供直接添加使用,從開源平臺獲取的Skill也可以在悟空中進行應用。悟空更全面的實測效果如何,還有待更深入的體驗。
結語:AI Agent時代,企業軟件交互方式正被重構
作為阿里布局AI Agent的重要落子,悟空展現了企業級智能體從“對話”走向“執行”的跨越。其在任務拆解、跨系統操作與多模態生成上表現出的連貫性,已初步驗證了“AI即服務”的產品范式。尤其在釘釘生態內,悟空具備成為千萬級企業智能入口的潛力,但其權限邊界與執行透明度仍需進一步厘清。
從產業視角看,悟空的亮相標志著AI Agent正式進入“可交付、可控制、可迭代”的新階段。未來,隨著token經濟、技能市場與權限體系的完善,企業軟件的交互方式將被重構。誰能在開放能力與安全邊界之間找到最優解,誰就能在這場AI代理革命中占據先機。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.