北京時間2026年4月24日,OpenAI正式發布了其迄今為止最智能、最直觀的AI模型——GPT-5.5。這款新模型不僅標志著AI能力的一次重大飛躍,更在運算效率和成本控制上實現了顯著突破,旨在徹底改變用戶使用計算機完成工作的方式。
![]()
核心突破:從對話工具到自主智能體
GPT-5.5的核心升級在于其強大的Agent(智能體)能力。與以往需要用戶精細指導每一步的模型不同,GPT-5.5能夠理解用戶模糊、復雜的多部分指令,并自主進行任務規劃、調用工具、檢查結果并持續推進,直至完成。
OpenAI總裁格雷格·布羅克曼(Greg Brockman)強調,這意味著用戶無需再事無巨細地管理每個步驟,只需將復雜任務交給GPT-5.5,它便能像一個真正的“研究伙伴”或“初級工程師”一樣獨立工作。
性能與效率:更快、更強、更經濟
盡管模型能力大幅增強,GPT-5.5在性能與效率上卻實現了“魚與熊掌兼得”的優化:
- 運算速度更快:通過與英偉達(NVIDIA)的深度合作,GPT-5.5針對GB200/GB300 NVL72系統進行了聯合設計。在實際服務中,其每個Token的延遲與GPT-5.4持平,但通過模型自身優化的負載均衡算法,Token生成速度反而提升了超過20%。
- Token成本大降:這是GPT-5.5的一大亮點。由于模型邏輯更精準,完成相同任務所需的Token數量顯著減少。在與英偉達的合作中,基于GB200 NVL72系統運行,百萬Token的成本降低至前代系統的三十五分之一,每兆瓦的Token輸出量更是提升了50倍。
- 智能水平更高:在多個權威基準測試中,GPT-5.5均展現出超越前代及競品的智能水平。例如,在衡量復雜終端操作的Terminal-Bench 2.0測試中,其準確率高達82.7%(GPT-5.4為75.1%);在評估GitHub問題解決的SWE-Bench Pro中達到58.6%。
應用場景:賦能科研、編程與知識工作
GPT-5.5的強大能力已在多個專業領域得到驗證:
- 編程領域:在Artificial Analysis的Coding Index中,它以競爭模型一半的成本提供了最先進的智能水平。早期測試者反饋,該模型在理解系統架構、定位故障及預測審查需求方面能力顯著增強,能將原本耗時數天的調試周期縮短至數小時。
- 科學研究:在生物信息學基準測試BixBench中,GPT-5.5取得了80.5%的領先成績。更令人矚目的是,一個內部版本的模型甚至協助發現了關于組合數學中“拉姆齊數”(Ramsey Numbers)的新證明,并通過了形式化驗證工具Lean的確認,展現了其在純數學前沿領域的原創貢獻潛力。
- 知識工作:OpenAI內部財務團隊已利用該模型審核了超過7萬頁稅務文件,效率提升顯著。
參與內測的用戶給予了極高評價。一位英偉達工程師甚至表示,失去GPT-5.5的訪問權限,“感覺就像肢體被截肢了一樣”。
目前,GPT-5.5已逐步向ChatGPT Plus、Pro、Business和Enterprise用戶開放。其API版本也即將上線,定價如下:
模型版本
輸入定價 (每百萬Token)
輸出定價 (每百萬Token)
GPT-5.5
5美元
30美元
GPT-5.5 Pro
30美元
180美元
GPT-5.5的發布,不僅是OpenAI自身技術的一次重大迭代,也預示著AI正從單純的對話交互,加速邁向能夠獨立完成復雜工作的實用化智能體時代。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.