英偉達CEO黃仁勛在2025年GTC大會上,把OpenClaw與當年iPhone多點觸控相提并論。一款還沒正式發布的產品,憑什么讓芯片巨頭掌門人站臺?
黃仁勛的「多點觸控時刻」
![]()
「OpenClaw將重新定義人機交互。」黃仁勛原話如此。他把2007年iPhone的 pinch-to-zoom(雙指縮放)當作參照——那是一次交互范式的躍遷,讓智能手機從商務工具變成大眾消費品。
黃仁勛的判斷邏輯很清晰:當前AI交互仍困在對話框里,用戶用自然語言「描述」需求,AI返回文本或圖片。這種交互是間接的、抽象的。OpenClaw試圖讓AI直接「操作」數字世界——點擊、拖拽、填寫表單,像人類一樣使用軟件。
這不是概念演示。英偉達內部團隊已用OpenClaw自動化處理采購訂單、生成財報摘要、跨系統遷移數據。黃仁勛透露,原本需要3小時的財務對賬,現在15分鐘完成,人工復核即可。
為什么是「爪子」而非「大腦」
OpenClaw的命名暴露產品定位:它不做推理,只做執行。底層調用GPT-4或Claude等大模型理解意圖,但核心能力是把意圖轉化為精確的UI操作序列——識別按鈕位置、判斷加載狀態、處理彈窗干擾。
這個分工有現實考量。大模型的「幻覺」問題尚未根治,讓它直接操作企業系統風險極高。OpenClaw的策略是「人在回路」:AI規劃步驟,人類一鍵確認,或設置「無需確認」的白名單操作。
技術路徑上,OpenClaw走了計算機視覺+強化學習的混合路線。團隊采集了超過200萬小時的屏幕操作錄像,訓練模型識別跨平臺、跨分辨率的界面元素。這比傳統RPA(機器人流程自動化)的硬編碼腳本靈活得多——軟件更新后無需重新配置。
英偉達的算盤:從賣鏟人到造流水線
![]()
黃仁勛的站臺不只是產品背書。OpenClaw運行在英偉達的AI Enterprise套件上,每執行一次自動化任務,都消耗GPU算力。這是英偉達從「訓練基礎設施」向「推理基礎設施」延伸的關鍵落子。
更深層的是生態綁定。OpenClaw優先支持CUDA加速的應用程序,無形中鞏固了英偉達在圖形和計算領域的標準地位。當AI代理成為新的應用層,控制代理的「手」比控制「腦」更具排他性。
競爭對手并非沒有察覺。微軟的Copilot也在測試「計算機使用」功能,Anthropic的Claude 3.5已能操作桌面環境。但黃仁勛的賭注在于:企業客戶更愿意為「可審計、可回滾、有SLA保障」的自動化買單,而非消費級AI的酷炫演示。
一個待驗證的假設
OpenClaw的真正考驗不在技術,在組織。讓AI接管業務流程,意味著重新定義崗位邊界、重建風控體系、重寫合規文檔。黃仁勛口中的「15分鐘對賬」,背后是財務部門對「機器操作留痕」的反復磋商。
如果OpenClaw能跨過大企業的采購委員會,它可能成為AI落地的「最后一公里」基礎設施;如果卡在安全審計環節,就只是又一個被POC(概念驗證)困住的企業工具。
黃仁勛把OpenClaw比作多點觸控,但別忘了:iPhone 2007年發布,企業級移動辦公真正普及是2015年之后。交互革命的周期,往往比技術樂觀者預期的更長。
如果你在做B端產品,現在該問的不是「我的功能夠不夠AI」,而是「我的客戶敢不敢把權限交給AI」。OpenClaw的進展,會是最好的風向標。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.