![]()
新智元報(bào)道
編輯:定慧
【新智元導(dǎo)讀】OpenAI深夜發(fā)布GPT-5.4,首次實(shí)現(xiàn)原生電腦操控能力,實(shí)測(cè)驚艷,幾乎可以操作電腦上所有應(yīng)用!
凌晨?jī)牲c(diǎn),OpenAI毫無預(yù)兆地丟出了GPT-5.4。
這個(gè)模型,即將改變2026年整個(gè)AIAgent格局!
這一次,最核心的能力終于呼之欲出:原生操控電腦。
Agent能力是2026年AI進(jìn)化的主線任務(wù),在實(shí)測(cè)后,一個(gè)深刻的感受:
GPT-5.4可能是2026年目前為止,最適合跑OpenClaw的模型。
或許沒有之一。

一手實(shí)測(cè)GPT-5.4
打工人真的懸了
目前GPT-5.4已經(jīng)在網(wǎng)頁版和Codex中上線,在實(shí)測(cè)多種場(chǎng)景后,真的只有一個(gè)感受:打工人真的懸了。
這個(gè)模型幾乎可以操作電腦上的一切:文件、程序、檔案、終端等等,只要是打工人能做,它都可以做。
![]()
以Macbook為例,讓GPT-5.4操作日歷來定制提醒。
GPT-5.4直接調(diào)起對(duì)應(yīng)應(yīng)用,并要求系統(tǒng)給予對(duì)應(yīng)的權(quán)限。

然后日歷中就出現(xiàn)了對(duì)應(yīng)的提醒。
![]()
你還可以用GPT-5.4來操作電腦打開APP,比如要求打開小宇宙 APP。
GPT-5.4不僅可以找到APP,還能播放對(duì)應(yīng)的節(jié)目。

你甚至可以要求GPT-5.4直接操作計(jì)算器APP,而且是在計(jì)算器 APP內(nèi)部來計(jì)算。

幾乎你電腦上任何APP,都可以被GPT-5.4所調(diào)用,比如打開微信讀書。
這是真正的「原生電腦操控能力」。

你可以要求GPT-5.4更換電腦壁紙。

甚至,你可以要求GPT-5.4操作終端來打開claude code。


我們都知道OpenClaw這只「龍蝦」能夠爆火,核心就是其Agent能力太過強(qiáng)大。
一個(gè)部署在Macmini上的OpenClaw幾乎擁有和人類一樣的操作能力和操作權(quán)限。
而這一次,GPT-5.4直接在模型層面實(shí)現(xiàn)「原生操控電腦」能力。
![]()
OpenClaw之父Peter評(píng)價(jià)GPT-5.4在編程能力提升不小外,在其他能力方面更加統(tǒng)一、更加智能。
![]()
HyperWriteAI、OthersideAI首席執(zhí)行官M(fèi)att Shumer認(rèn)為GPT-5.4是目前世界上最好的模型,遠(yuǎn)超其他。
他對(duì)GPT-5.4的評(píng)價(jià)是:不可思議、超乎想象。
即便是標(biāo)準(zhǔn)模式下,GPT-5.4 的表現(xiàn)也超越了以往專業(yè)版的模型……這簡(jiǎn)直不可思議!
編程能力更是驚人……近乎完美無瑕。
在Codex內(nèi)部,它的可靠性達(dá)到了極致。
編程問題基本上已被攻克。關(guān)于這點(diǎn)無需多言,它的優(yōu)秀程度就是如此超乎想象。
![]()
OpenAI的杰出科學(xué)家Sebastien Bubeck用一幅梗圖來形容GPT-5.4編程能力提升。
![]()
Mercor AI首席執(zhí)行官Brenda則認(rèn)為GPT-5.4即將超越頂尖咨詢公司、頂尖投行和頂尖律所的專業(yè)能力。
也就是人類精英金領(lǐng)的所有工作,它都能做,甚至做的更好。
![]()
原生電腦操控能力
這是真正的分水嶺
實(shí)測(cè)后,讓我們來仔細(xì)想想,GPT-5.4到底強(qiáng)在哪里?
GPT-5.4是OpenAI發(fā)布的第一個(gè)具備「原生電腦使用能力」的通用模型。
它不需要借助外部框架或者專門的適配層,就能直接通過截圖識(shí)別屏幕內(nèi)容,發(fā)出鼠標(biāo)點(diǎn)擊和鍵盤輸入指令,像人類一樣在桌面環(huán)境中操作軟件。
在OSWorld-Verified基準(zhǔn)測(cè)試中(這個(gè)測(cè)試衡量AI在真實(shí)桌面環(huán)境中的導(dǎo)航能力),GPT-5.4拿到了75.0%的成功率。
![]()
作為對(duì)比,GPT-5.2只有47.3%,而人類基準(zhǔn)線是72.4%。
也就是說,GPT-5.4操控電腦的能力,已經(jīng)超過了普通人類用戶的平均水平。
這是第一次有通用AI模型做到這一點(diǎn)。
AI操控電腦,第一次比人類自己操控得更好。
天作之合:GPT-5.4精準(zhǔn)命中OpenClaw每一個(gè)痛點(diǎn)
再說回OpenClaw,為什么說GPT-5.4是OpenClaw的天選模型?
終于來到了最讓人興奮的部分。
如果你在今年年初關(guān)注過科技圈,你不可能不知道OpenClaw。
這個(gè)由PSPDFKit創(chuàng)始人Peter Steinberger開發(fā)的開源個(gè)人AI助手項(xiàng)目,在2026年1月以72小時(shí)狂攬6萬GitHub Star的速度一夜爆紅,如今Star數(shù)已經(jīng)突破25萬,甚至一度帶動(dòng)Mac Mini全球賣斷貨、樹莓派股價(jià)翻倍。
![]()
OpenClaw的核心理念只有一句話:TheAIthat actually does things。
不只是聊天,而是真的幫你干活。
它運(yùn)行在你自己的電腦上,擁有對(duì)Shell、文件系統(tǒng)、瀏覽器的完整訪問權(quán)限。
你通過WhatsApp、Telegram、飛書、釘釘發(fā)一條消息,它就能在后臺(tái)幫你執(zhí)行終端命令、編寫腳本、管理郵件、抓取網(wǎng)頁數(shù)據(jù),甚至安裝和調(diào)試軟件。
它有持久記憶,能通過不斷擴(kuò)展技能變得越來越強(qiáng)大。
但是,OpenClaw有一個(gè)公開的秘密:模型就是產(chǎn)品。
OpenClaw創(chuàng)始人Peter Steinberger自己說過,推薦使用最強(qiáng)的最新一代模型。
社區(qū)的結(jié)論也一針見血:模型即產(chǎn)品,框架只是包裝。
社區(qū)里廣泛流傳的經(jīng)驗(yàn)是,如果你用的模型不夠強(qiáng),OpenClaw的魔法就會(huì)消失。
有開發(fā)者做過詳細(xì)測(cè)試,用低端模型運(yùn)行OpenClaw和用Claude Opus 4.5運(yùn)行,體驗(yàn)差距可以到40%到95%。
OpenClaw的創(chuàng)始人Peter推薦將OpenClaw的版本升級(jí)到5.4之后,再配合GPT-5.4。
![]()
模型的推理能力、工具調(diào)用準(zhǔn)確度、長(zhǎng)程任務(wù)的上下文保持能力,直接決定了OpenClaw到底是賽博秘書還是昂貴的自動(dòng)補(bǔ)全。
而GPT-5.4恰恰在OpenClaw最需要的每一個(gè)維度上,都踩中了甜蜜點(diǎn)。
原生電腦操控——完美匹配。
OpenClaw的核心價(jià)值就是讓AI操作你的電腦。GPT-5.4是第一個(gè)原生具備這一能力的通用模型,OSWorld測(cè)試超越人類水平。這意味著接入GPT-5.4的OpenClaw,不再需要通過復(fù)雜的適配和Hack來實(shí)現(xiàn)桌面自動(dòng)化,而是像給賽車換上了渦輪發(fā)動(dòng)機(jī)——從底層就是為這個(gè)場(chǎng)景而生。
100萬Token上下文——續(xù)航無憂。
OpenClaw是一個(gè)持續(xù)運(yùn)行的Agent,需要維持長(zhǎng)對(duì)話、記住復(fù)雜指令鏈、處理大量文件內(nèi)容。以前用其他模型,跑著跑著就忘了前面的任務(wù)。100萬Token的上下文窗口,意味著OpenClaw終于有了足夠大的工作臺(tái)來鋪開所有材料。
Tool Search——Agent的效率革命。
OpenClaw的強(qiáng)大之處在于它可以接入數(shù)十種Skills和工具。但工具越多,每次調(diào)用消耗的Token就越多,成本飆升。GPT-5.4的Tool Search機(jī)制天然解決了這個(gè)問題——不用把所有工具定義都塞進(jìn)上下文,按需取用,Token消耗直降47%。對(duì)于7×24小時(shí)運(yùn)行的OpenClaw來說,這可能意味著每月節(jié)省幾十甚至上百美元的API費(fèi)用。
推理能力躍升——告別高級(jí)自動(dòng)補(bǔ)全。
之前用低端模型運(yùn)行OpenClaw,遇到稍微復(fù)雜的任務(wù)就卡殼。GPT-5.4在專業(yè)工作任務(wù)中超過83%的人類專家表現(xiàn),配合其在數(shù)學(xué)、編程、文檔處理等領(lǐng)域的全面提升,意味著OpenClaw可以勝任更復(fù)雜、更高價(jià)值的工作場(chǎng)景。從幫你寫代碼調(diào)Bug,到幫你做財(cái)務(wù)分析寫投資備忘錄,想象空間瞬間拉滿。
事實(shí)上,OpenClaw的官方文檔已經(jīng)提供了GPT-5.4的接入配置方案,OpenAI的Responses API也已全面支持。
社區(qū)里第一批吃螃蟹的人應(yīng)該已經(jīng)在配置了。
新時(shí)代的起點(diǎn)
讓我們把視野拉遠(yuǎn)一點(diǎn)。
GPT-5.4的發(fā)布,不僅是模型參數(shù)的又一次刷新,更標(biāo)志著AI行業(yè)正在經(jīng)歷一次底層邏輯的切換:從對(duì)話式AI到智能體AI的跨越。
過去幾年,我們一直在討論AI有多聰明、能寫什么、能回答什么。
但從GPT-5.4開始,話題變了——AI能做什么、能完成什么、能替代什么。
當(dāng)一個(gè)模型能獨(dú)立操控電腦比普通人更熟練,能在83%的專業(yè)場(chǎng)景中匹敵行業(yè)專家——這不是量變,這是質(zhì)變。
而OpenClaw這樣的開源Agent框架,正是把這種能力轉(zhuǎn)化為實(shí)際生產(chǎn)力的橋梁。
GPT-5.4+OpenClaw的組合,讓我們第一次清晰地看到了個(gè)人AI員工從概念變?yōu)楝F(xiàn)實(shí)的路徑。
對(duì)于一些人來說,奇點(diǎn)已經(jīng)到了。
你,準(zhǔn)備好了嗎?
參考資料:
https://chatgpt.com/codex
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.