「豆包 AI 手機(jī)」的電腦版,被 OpenAI 做出來(lái)了。
盡管在版本號(hào)上,GPT-5.4 只比去年年底發(fā)布的 GPT-5.2 多了0.2,但在功能上,GPT-5.4 的升級(jí)可以說(shuō)「顛覆」了整個(gè) PC AI 領(lǐng)域。簡(jiǎn)單來(lái)說(shuō),GPT-5.4 打包了GPT-5.3-Codex、高級(jí)推理能力和 100 萬(wàn) Token 的上下文窗口大小,同時(shí)還支持原生電腦操作支持(Computer Use)。用更直白的話來(lái)說(shuō),全新的 GPT-5.4,把豆包 AI 手機(jī)那種全自動(dòng)的 AI 操作,帶到了電腦上。
![]()
我們先來(lái)看看大家最關(guān)心的原生電腦操作支持。從技術(shù)路線上講,GPT-5.4 和手機(jī)領(lǐng)域的 GUI-Agent 類似,利用視覺(jué)識(shí)別來(lái)看懂屏幕畫(huà)面上的元素和組件,而非簡(jiǎn)單讀取文字標(biāo)簽。推理、確認(rèn)操作路徑后,GPT-5.4 會(huì)基于屏幕顯示元素的坐標(biāo),生成快速、連續(xù)的光標(biāo)指令,并通過(guò) Windows 或 Linux 的系統(tǒng)端口執(zhí)行。
由于這種 GUI-Agent 能真正理解屏幕內(nèi)容,GPT-5.4 這套原生電腦操作可以兼容不同的應(yīng)用和場(chǎng)景。對(duì)于并不熟悉 MCP 協(xié)議的小白用戶來(lái)說(shuō),GPT-5.4 這套方案的體驗(yàn)顯然要友好得多。
![]()
在新聞稿中,OpenAI 也演示了 GPT-5.4 操作用戶電腦的流程。雖然GPT-5.4 理解屏幕內(nèi)容時(shí)消耗了不少時(shí)間,但即便任務(wù)鏈特別長(zhǎng),GPT-5.4 也能準(zhǔn)確執(zhí)行。可以肯定的是,隨著 OpenAI 通用視覺(jué)感知能力的提升,這套流程將越來(lái)越順。
既然提到了長(zhǎng)任務(wù)鏈,那就不得不提 GPT-5.4 的另一個(gè)重點(diǎn):GPT-5.4 系列模型支持高達(dá) 100 萬(wàn) Tokens 的上下文窗口。上下文窗口越大,AI 的「長(zhǎng)期記憶」能力就越強(qiáng),不會(huì)出現(xiàn)「看了后面忘了前面」的情況。
![]()
而 100 萬(wàn) Token 的上下文窗口,意味著開(kāi)發(fā)者現(xiàn)在可以把整個(gè)代碼倉(cāng)庫(kù)打包丟給 GPT-5.4,顯著提升「Vibe-Coding」的效率;分析師也可以直接把企業(yè)好幾年的財(cái)務(wù)數(shù)據(jù)喂給 GPT-5.4,讓 AI 來(lái)找出其中的異常征兆。對(duì)中小企業(yè)來(lái)說(shuō),更大的窗口大小也意味著不再需要另外做 RAG,避免數(shù)據(jù)切片帶來(lái)的信息遺漏。
更大的窗口大小、更準(zhǔn)確的推理能力,再加上原生電腦交互,這些底層能力的提升讓 GPT-5.4 的綜合能力全面進(jìn)化。根據(jù) OpenAI 給出的對(duì)比成績(jī),GPT-5.4 的各項(xiàng)性能較 GPT-5.2 均有明顯提升;甚至在做投行金融報(bào)表時(shí),GPT-5.4 也因「審美提升」獲得了更高的分?jǐn)?shù)。
![]()
在 AI 領(lǐng)域,模型性能通常與價(jià)格掛鉤,GPT-5.4 自然也不例外。定價(jià)方面,GPT-5.4 的 Token 價(jià)格會(huì)高于 GPT-5.2。2026 年 3 月 6 日,GPT-5.4 Thinking 已向 ChatGPT 各級(jí)付費(fèi)用戶開(kāi)放。
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.