不僅狂卷性價比,而且能力幾乎不縮水。
凌晨,GPT-5.4 mini和nano版本直接上線。
其中GPT-5.4 mini,針對代碼編寫、推理、多模態理解,和subagent(Agent系統中被調用的“執行單元”)進行了優化,運行速度較GPT?5 mini 有顯著提升提升了兩倍以上,接近完整版GPT-5.4的性能:
??讀代碼和在真實項目里的修bug能力,在SWE-bench Pro這項基準測試上,完整版GPT-5.4是57.7%,而GPT-5.4 mini已能達到54.4%。
??計算機操作能力(Terminal-Bench 2.0),完整版GPT-5.4得分75%,mini得分59%。
??博士級別高難度推理能力( GPQA Diamond),完整版GPT-5.4得分93%,mini得分85%。
??真實世界完成復雜任務能力(OSWorld),完整版GPT-5.4得分75%,mini得分70%。
而且價格直接“打骨折”:
GPT-5.4 mini擁有400k超大上下文,輸入0.75美元/百萬 token,輸出4.5美元,輸出價格僅為GPT-5.4的1/3。nano更狠,輸入0.2美元、輸出1.25美元;輸出價格更是直接干到GPT-5.4的1/12。
也就是說,在高頻調用、并發執行的場景下,GPT-5.4單位成本能處理更多任務。
有網友犀利地指出,既然GPT-5.4 mini如此便宜、能打、還跑得快,那么它天然適合拿去做OpenClaw的主力模型!
還有人分享了使用后感受,他表示在寫東西、找引用這些任務里,GPT-5.4 mini可以和Claude Haiku掰手腕兒,價格還低一大截。更離譜的是,這個小模型整體完成任務的成功率甚至比GPT-5.4 還高,還能把信息來源標得更清楚,不太容易胡說八道。
在TBPN的最新訪談,奧特曼也描繪了Codex的未來形態:Codex 的終點,不是寫代碼,而是逐步演變為一個可以直接“操控計算機”的通用Agent。
在這一設想里,用戶只需通過手機發起任務,剩下的交給AI完成。
理想狀態下,每個人都將擁有一個基于統一后端的個人AI。它能夠調用你的數據、理解你的想法與偏好,在不同設備之間自由切換,持續替你執行任務。
面對一眾強有力的競爭對手,OpenAI最近確實挺急的,過去幾周,他們的產品節奏幾乎是“連環發車”:
??3月3日剛推出GPT-5.3 Instant,更順滑,但不一定更準;
??3月5日上線期間模型GPT-5.4 Thinking,主打深度推理、專業任務;
??3月17日,再補上mini和nano,更快、更便宜。
不過話說回來,在OpenAI聯創兼總裁Greg Brockman的這條新帖評論區里,依然有不少網友高呼:“還我們4o!”——一個又快又自然、很有“活人感”模型版本。
![]()
![]()
![]()
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.