網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

GPT-5.4「原生操控電腦」實(shí)測(cè)封神！OpenClaw天選模型來了

2026-03-06 10:35:47　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：定慧

【新智元導(dǎo)讀】OpenAI深夜發(fā)布GPT-5.4，首次實(shí)現(xiàn)原生電腦操控能力，實(shí)測(cè)驚艷，幾乎可以操作電腦上所有應(yīng)用！

凌晨?jī)牲c(diǎn)，OpenAI毫無預(yù)兆地丟出了GPT-5.4。

這個(gè)模型，即將改變2026年整個(gè)AIAgent格局！

這一次，最核心的能力終于呼之欲出：原生操控電腦。

Agent能力是2026年AI進(jìn)化的主線任務(wù)，在實(shí)測(cè)后，一個(gè)深刻的感受：

GPT-5.4可能是2026年目前為止，最適合跑OpenClaw的模型。

或許沒有之一。

一手實(shí)測(cè)GPT-5.4

打工人真的懸了

目前GPT-5.4已經(jīng)在網(wǎng)頁版和Codex中上線，在實(shí)測(cè)多種場(chǎng)景后，真的只有一個(gè)感受：打工人真的懸了。

這個(gè)模型幾乎可以操作電腦上的一切：文件、程序、檔案、終端等等，只要是打工人能做，它都可以做。

以Macbook為例，讓GPT-5.4操作日歷來定制提醒。

GPT-5.4直接調(diào)起對(duì)應(yīng)應(yīng)用，并要求系統(tǒng)給予對(duì)應(yīng)的權(quán)限。

然后日歷中就出現(xiàn)了對(duì)應(yīng)的提醒。

你還可以用GPT-5.4來操作電腦打開APP，比如要求打開小宇宙 APP。

GPT-5.4不僅可以找到APP，還能播放對(duì)應(yīng)的節(jié)目。

你甚至可以要求GPT-5.4直接操作計(jì)算器APP，而且是在計(jì)算器 APP內(nèi)部來計(jì)算。

幾乎你電腦上任何APP，都可以被GPT-5.4所調(diào)用，比如打開微信讀書。

這是真正的「原生電腦操控能力」。

你可以要求GPT-5.4更換電腦壁紙。

甚至，你可以要求GPT-5.4操作終端來打開claude code。

我們都知道OpenClaw這只「龍蝦」能夠爆火，核心就是其Agent能力太過強(qiáng)大。

一個(gè)部署在Macmini上的OpenClaw幾乎擁有和人類一樣的操作能力和操作權(quán)限。

而這一次，GPT-5.4直接在模型層面實(shí)現(xiàn)「原生操控電腦」能力。

OpenClaw之父Peter評(píng)價(jià)GPT-5.4在編程能力提升不小外，在其他能力方面更加統(tǒng)一、更加智能。

HyperWriteAI、OthersideAI首席執(zhí)行官M(fèi)att Shumer認(rèn)為GPT-5.4是目前世界上最好的模型，遠(yuǎn)超其他。

他對(duì)GPT-5.4的評(píng)價(jià)是：不可思議、超乎想象。

即便是標(biāo)準(zhǔn)模式下，GPT-5.4 的表現(xiàn)也超越了以往專業(yè)版的模型……這簡(jiǎn)直不可思議！

編程能力更是驚人……近乎完美無瑕。

在Codex內(nèi)部，它的可靠性達(dá)到了極致。

編程問題基本上已被攻克。關(guān)于這點(diǎn)無需多言，它的優(yōu)秀程度就是如此超乎想象。

OpenAI的杰出科學(xué)家Sebastien Bubeck用一幅梗圖來形容GPT-5.4編程能力提升。

Mercor AI首席執(zhí)行官Brenda則認(rèn)為GPT-5.4即將超越頂尖咨詢公司、頂尖投行和頂尖律所的專業(yè)能力。

也就是人類精英金領(lǐng)的所有工作，它都能做，甚至做的更好。

原生電腦操控能力

這是真正的分水嶺

實(shí)測(cè)后，讓我們來仔細(xì)想想，GPT-5.4到底強(qiáng)在哪里？

GPT-5.4是OpenAI發(fā)布的第一個(gè)具備「原生電腦使用能力」的通用模型。

它不需要借助外部框架或者專門的適配層，就能直接通過截圖識(shí)別屏幕內(nèi)容，發(fā)出鼠標(biāo)點(diǎn)擊和鍵盤輸入指令，像人類一樣在桌面環(huán)境中操作軟件。

在OSWorld-Verified基準(zhǔn)測(cè)試中（這個(gè)測(cè)試衡量AI在真實(shí)桌面環(huán)境中的導(dǎo)航能力），GPT-5.4拿到了75.0%的成功率。

作為對(duì)比，GPT-5.2只有47.3%，而人類基準(zhǔn)線是72.4%。

也就是說，GPT-5.4操控電腦的能力，已經(jīng)超過了普通人類用戶的平均水平。

這是第一次有通用AI模型做到這一點(diǎn)。

AI操控電腦，第一次比人類自己操控得更好。

天作之合：GPT-5.4精準(zhǔn)命中OpenClaw每一個(gè)痛點(diǎn)

再說回OpenClaw，為什么說GPT-5.4是OpenClaw的天選模型？

終于來到了最讓人興奮的部分。

如果你在今年年初關(guān)注過科技圈，你不可能不知道OpenClaw。

這個(gè)由PSPDFKit創(chuàng)始人Peter Steinberger開發(fā)的開源個(gè)人AI助手項(xiàng)目，在2026年1月以72小時(shí)狂攬6萬GitHub Star的速度一夜爆紅，如今Star數(shù)已經(jīng)突破25萬，甚至一度帶動(dòng)Mac Mini全球賣斷貨、樹莓派股價(jià)翻倍。

OpenClaw的核心理念只有一句話：TheAIthat actually does things。

不只是聊天，而是真的幫你干活。

它運(yùn)行在你自己的電腦上，擁有對(duì)Shell、文件系統(tǒng)、瀏覽器的完整訪問權(quán)限。

你通過WhatsApp、Telegram、飛書、釘釘發(fā)一條消息，它就能在后臺(tái)幫你執(zhí)行終端命令、編寫腳本、管理郵件、抓取網(wǎng)頁數(shù)據(jù)，甚至安裝和調(diào)試軟件。

它有持久記憶，能通過不斷擴(kuò)展技能變得越來越強(qiáng)大。

但是，OpenClaw有一個(gè)公開的秘密：模型就是產(chǎn)品。

OpenClaw創(chuàng)始人Peter Steinberger自己說過，推薦使用最強(qiáng)的最新一代模型。

社區(qū)的結(jié)論也一針見血：模型即產(chǎn)品，框架只是包裝。

社區(qū)里廣泛流傳的經(jīng)驗(yàn)是，如果你用的模型不夠強(qiáng)，OpenClaw的魔法就會(huì)消失。

有開發(fā)者做過詳細(xì)測(cè)試，用低端模型運(yùn)行OpenClaw和用Claude Opus 4.5運(yùn)行，體驗(yàn)差距可以到40%到95%。

OpenClaw的創(chuàng)始人Peter推薦將OpenClaw的版本升級(jí)到5.4之后，再配合GPT-5.4。

模型的推理能力、工具調(diào)用準(zhǔn)確度、長(zhǎng)程任務(wù)的上下文保持能力，直接決定了OpenClaw到底是賽博秘書還是昂貴的自動(dòng)補(bǔ)全。

而GPT-5.4恰恰在OpenClaw最需要的每一個(gè)維度上，都踩中了甜蜜點(diǎn)。

原生電腦操控——完美匹配。

OpenClaw的核心價(jià)值就是讓AI操作你的電腦。GPT-5.4是第一個(gè)原生具備這一能力的通用模型，OSWorld測(cè)試超越人類水平。這意味著接入GPT-5.4的OpenClaw，不再需要通過復(fù)雜的適配和Hack來實(shí)現(xiàn)桌面自動(dòng)化，而是像給賽車換上了渦輪發(fā)動(dòng)機(jī)——從底層就是為這個(gè)場(chǎng)景而生。

100萬Token上下文——續(xù)航無憂。

OpenClaw是一個(gè)持續(xù)運(yùn)行的Agent，需要維持長(zhǎng)對(duì)話、記住復(fù)雜指令鏈、處理大量文件內(nèi)容。以前用其他模型，跑著跑著就忘了前面的任務(wù)。100萬Token的上下文窗口，意味著OpenClaw終于有了足夠大的工作臺(tái)來鋪開所有材料。

Tool Search——Agent的效率革命。

OpenClaw的強(qiáng)大之處在于它可以接入數(shù)十種Skills和工具。但工具越多，每次調(diào)用消耗的Token就越多，成本飆升。GPT-5.4的Tool Search機(jī)制天然解決了這個(gè)問題——不用把所有工具定義都塞進(jìn)上下文，按需取用，Token消耗直降47%。對(duì)于7×24小時(shí)運(yùn)行的OpenClaw來說，這可能意味著每月節(jié)省幾十甚至上百美元的API費(fèi)用。

推理能力躍升——告別高級(jí)自動(dòng)補(bǔ)全。

之前用低端模型運(yùn)行OpenClaw，遇到稍微復(fù)雜的任務(wù)就卡殼。GPT-5.4在專業(yè)工作任務(wù)中超過83%的人類專家表現(xiàn)，配合其在數(shù)學(xué)、編程、文檔處理等領(lǐng)域的全面提升，意味著OpenClaw可以勝任更復(fù)雜、更高價(jià)值的工作場(chǎng)景。從幫你寫代碼調(diào)Bug，到幫你做財(cái)務(wù)分析寫投資備忘錄，想象空間瞬間拉滿。

事實(shí)上，OpenClaw的官方文檔已經(jīng)提供了GPT-5.4的接入配置方案，OpenAI的Responses API也已全面支持。

社區(qū)里第一批吃螃蟹的人應(yīng)該已經(jīng)在配置了。

新時(shí)代的起點(diǎn)

讓我們把視野拉遠(yuǎn)一點(diǎn)。

GPT-5.4的發(fā)布，不僅是模型參數(shù)的又一次刷新，更標(biāo)志著AI行業(yè)正在經(jīng)歷一次底層邏輯的切換：從對(duì)話式AI到智能體AI的跨越。

過去幾年，我們一直在討論AI有多聰明、能寫什么、能回答什么。

但從GPT-5.4開始，話題變了——AI能做什么、能完成什么、能替代什么。

當(dāng)一個(gè)模型能獨(dú)立操控電腦比普通人更熟練，能在83%的專業(yè)場(chǎng)景中匹敵行業(yè)專家——這不是量變，這是質(zhì)變。

而OpenClaw這樣的開源Agent框架，正是把這種能力轉(zhuǎn)化為實(shí)際生產(chǎn)力的橋梁。

GPT-5.4+OpenClaw的組合，讓我們第一次清晰地看到了個(gè)人AI員工從概念變?yōu)楝F(xiàn)實(shí)的路徑。

對(duì)于一些人來說，奇點(diǎn)已經(jīng)到了。

你，準(zhǔn)備好了嗎？

參考資料：

https://chatgpt.com/codex

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.