網易首頁 > 網易號 > 正文申請入駐

OpenAI又發力了，端上適合“養蝦”新模型，便宜好用！

2026-03-18 11:17:22　來源: AI前線

北京舉報

分享至

不僅狂卷性價比，而且能力幾乎不縮水。

凌晨，GPT-5.4 mini和nano版本直接上線。

其中GPT-5.4 mini，針對代碼編寫、推理、多模態理解，和subagent（Agent系統中被調用的“執行單元”）進行了優化，運行速度較GPT?5 mini 有顯著提升提升了兩倍以上，接近完整版GPT-5.4的性能：

??讀代碼和在真實項目里的修bug能力，在SWE-bench Pro這項基準測試上，完整版GPT-5.4是57.7%，而GPT-5.4 mini已能達到54.4%。
??計算機操作能力（Terminal-Bench 2.0），完整版GPT-5.4得分75%，mini得分59%。
??博士級別高難度推理能力（ GPQA Diamond），完整版GPT-5.4得分93%，mini得分85%。
??真實世界完成復雜任務能力（OSWorld），完整版GPT-5.4得分75%，mini得分70%。

而且價格直接“打骨折”：

GPT-5.4 mini擁有400k超大上下文，輸入0.75美元/百萬 token，輸出4.5美元，輸出價格僅為GPT-5.4的1/3。nano更狠，輸入0.2美元、輸出1.25美元；輸出價格更是直接干到GPT-5.4的1/12。

也就是說，在高頻調用、并發執行的場景下，GPT-5.4單位成本能處理更多任務。

有網友犀利地指出，既然GPT-5.4 mini如此便宜、能打、還跑得快，那么它天然適合拿去做OpenClaw的主力模型！

還有人分享了使用后感受，他表示在寫東西、找引用這些任務里，GPT-5.4 mini可以和Claude Haiku掰手腕兒，價格還低一大截。更離譜的是，這個小模型整體完成任務的成功率甚至比GPT-5.4 還高，還能把信息來源標得更清楚，不太容易胡說八道。

在TBPN的最新訪談，奧特曼也描繪了Codex的未來形態：Codex 的終點，不是寫代碼，而是逐步演變為一個可以直接“操控計算機”的通用Agent。

在這一設想里，用戶只需通過手機發起任務，剩下的交給AI完成。

理想狀態下，每個人都將擁有一個基于統一后端的個人AI。它能夠調用你的數據、理解你的想法與偏好，在不同設備之間自由切換，持續替你執行任務。

面對一眾強有力的競爭對手，OpenAI最近確實挺急的，過去幾周，他們的產品節奏幾乎是“連環發車”：

??3月3日剛推出GPT-5.3 Instant，更順滑，但不一定更準；
??3月5日上線期間模型GPT-5.4 Thinking，主打深度推理、專業任務；
??3月17日，再補上mini和nano，更快、更便宜。

不過話說回來，在OpenAI聯創兼總裁Greg Brockman的這條新帖評論區里，依然有不少網友高呼：“還我們4o！”——一個又快又自然、很有“活人感”模型版本。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.