AIPress.com.cn報道
在一篇吐槽Anthropic定價策略的推文里,有用戶評論:“OpenAI在周四發布GPT-5.5或GPT-6就會立即訂閱”,奧特曼回復了一個“敬禮”的表情。
![]()
現在,他來兌現諾言了。
今天,OpenAI正式官宣GPT-5.5。在官方曬出各項測評結果中可以看到,GPT-5.5拳打Claude Opus 4.7,腳踢前代GPT-5.4,整體實力更是甩了Gemini 3.1 Pro八條大馬路。
![]()
通常來講,更強大的模型會在運行速度上會更慢,但GPT-5.5在實際體驗上的單token延遲與GPT-5.4相當,卻比GPT-5.4更聰明。
在解決同類問題時,它能以更少的token消耗、更少的重試次數,輸出更高質量的結果。
例如在Artificial Analysis的Coding Index中,GPT-5.5以約一半成本就實現了前沿模型水平的性能。
![]()
全流程托管
編程效率暴增
在Terminal-Bench 2.0測試中,GPT-5.5準確率達到82.7%,而GPT-5.4是75.1%,對家Anthropic的Claude Opus 4.7是69.4%。
也就是說,在執行復雜命令行工作流時,GPT-5.5把當今大模型的完成率又拉高了7%。
![]()
在Codex中,它可以承擔從代碼實現、重構,到調試、測試與驗證的全流程工程任務。
用戶不用再拆解任務,測試每一個步驟,只需要把需求扔給GPT-5.5,它就能一口氣完成所有任務。
日常工作全流程提效
85%的OpenAI員工都在用
支撐GPT-5.5在編程領域表現優異的核心能力,同樣適用于各類知識工作場景。它能自然貫穿知識工作全流程,信息獲取、重點提煉、工具調用、結果驗證。
在44種職業知識工作能力評測GDPval中,GPT-5.5得分高達84.9%。
![]()
在Codex上可以利用GPT-5.5生成高質量的電子表格、PPT和文檔。
來看這個財務建模。
![]()
OpenAI自己超過85%的員工,每周都在用Codex干活。
在公關部門,團隊利用 在Codex 利用 GPT-5.5 分析了六個月的演講請求數據,構建了評分和風險評估框架,實現了低風險請求自動處理。
在財務部門,Codex 審核了 24,771 份 K-1 稅表,比人工手搓快了兩周。
在市場推廣部門,有員工用GPT-5.5自動生成周報,每周省出 5-10 小時。
而在ChatGPT中,GPT-5.5 Thinking能快速處理復雜問題,輸出更智能、簡潔的答案,在插件支持下,效果還能更好。
11分鐘生成數學應用
下一個數學家可能是AI
在科研領域,也已經有科學家用上了GPT-5.5。
OpenAI內部版本的GPT-5.5幫助數學教授 Bartosz Naskr?cki 構建了一個代數幾何應用程序,這個程序將二次曲面的交點可視化,還成功將生成的曲線轉換為 Weierstrass 模型,全程只用了11分鐘。
此外它還幫著發現了Ramsey數的新證明,這是組合數學里的核心問題,而且這個證明已經通過了Lean驗證。這說明它不只是能寫代碼、做解釋,還能提出有研究價值的數學論證,實力很能打。
![]()
推理系統全面優化
智能和速度可以兼得
前面我們也提到過,一般模型變“聰明”了,隨之而來的就是卡頓問題。但GPT-5.5在推理系統層面做了全面優化,還和NVIDIA的GB200、GB300 NVL72系統協同設計、部署,既能保持和GPT-5.4差不多的延遲,又能提升性能,魚和熊掌可以兼得。
![]()
比較有意思的是,Codex和GPT-5.5自己也參與到了優化過程中。通過分析生產流量模式,編寫負載均衡和分區算法,讓自己的token生成速度提升了20%以上。
目前,GPT-5.5已經在ChatGPT和Codex中,向Plus、Pro、Business、Enterprise用戶開放;GPT-5.5 Pro則面向Pro、Business、Enterprise這些高階用戶。API版本還在籌備中,很快就會上線。
在Codex中,GPT-5.5支持最高40萬token的上下文窗口,還提供Fast模式,速度提升了1.5倍,但成本是普通模式的2.5倍。
總的來說,從官方給出的數據看,GPT-5.5在對復雜工作流的處理上有了質的飛躍,不用再拆細分指令,更智能的同時也沒有降低體驗感。
前有Anthropic改套餐定價策略“送人頭”,不知道OpenAI這次能不能抓住機會靠GPT-5.5“逆風翻盤”。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.