![]()
OpenAI 正式推出了 GPT-5,這是其下一代 ChatGPT 的核心旗艦模型。
這款于周四發布的新模型,是 OpenAI 首個實現“統一架構”的 AI 模型,融合了 o 系列的邏輯推理能力與 GPT 系列的高速響應能力。GPT-5 的推出,意味著 ChatGPT 邁入了全新階段,也展現出 OpenAI 正在向更復雜的智能體( agent )方向發展,而不只是一個聊天工具。
GPT-4 的出現讓 ChatGPT 能夠針對各種問題給出聰明的回答,而 GPT-5 則進一步讓它能替用戶完成實際任務,比如開發 App、整理日歷、撰寫研究摘要等。
OpenAI 還特別優化了 GPT-5 的使用體驗。用戶不再需要自行調整設置,新模型內建的實時路由器( real-time router )會自動判斷回答策略 —— 是要快速回應,還是多花點時間“思考”以輸出更完整的答案。
![]()
OpenAI CEO Sam Altman 在一次媒體溝通中稱 GPT-5 是“當前全球最強的模型”,并認為這是實現“通用人工智能( AGI )”道路上的關鍵里程碑 —— 也就是能在大多數高價值工作中超越人類的 AI。
“要是放在歷史上的任何一個階段,人們幾乎無法想象會有 GPT-5 這樣的東西。”Altman 說。
從今天開始,GPT-5 將作為默認模型對所有 ChatGPT 免費用戶開放使用。
OpenAI 的 ChatGPT 副總裁 Nick Turley 表示,這也是公司首次讓免費用戶用上具備 AI 推理能力的模型(過去這些能力通常只向付費用戶開放)。
Turley 表示:“這只是我踐行 OpenAI 使命的方式之一 —— 確保技術真正讓大眾受益。”他提到的,是 OpenAI 一貫強調的使命:讓先進 AI 被更廣泛的人群使用。
GPT-5 是自 2022 年 ChatGPT 引爆全球關注以來,OpenAI 最受期待的一次產品發布。據官方統計,ChatGPT 每周活躍用戶已超過 7 億,占全球人口近 10%。
GPT-5 被視為衡量 AI 發展進程的風向標。硅谷、大型科技公司、華爾街乃至監管機構都在密切關注:這次升級是否能像 GPT-4 一樣再次打破預期,推動 AI 應用的邊界。
小幅領先對手,GPT-5 在多個領域表現出色
OpenAI 表示,GPT-5 在多個基準測試中表現優于 Anthropic、Google DeepMind 和 xAI(由 Elon Musk 創辦)。但在部分測試中也略有落后。
GPT-5 在編程方面尤其出色,Sam Altman 介紹說,它可以基于需求快速生成完整的應用程序,這種能力被稱為“ vibe coding ”。
在 SWE-bench Verified(真實 GitHub 編程任務)測試中,GPT-5 初次嘗試就拿下 74.9% 的得分,略高于 Claude Opus 4.1(74.5%)和 Gemini 2.5 Pro(59.6%)。
在跨學科的 Humanity’s Last Exam 測試中,GPT-5 Pro 得分為 42%,略低于 Grok 4 Heavy(44.4%)。
![]()
而在博士級別的科學問題測試 GPQA Diamond 中,GPT-5 Pro 表現強勢,得分高達 89.4%,超過 Grok 4 Heavy(88.9%)和 Claude Opus 4.1(80.9%)。
在健康問答方面,GPT-5(思考模式)表現出色,HealthBench Hard Hallucinations 測試中,幻覺率僅為 1.6%,顯著低于 GPT-4o(12.9%)和 o3(15.8%)。
雖然 AI 無法替代醫生,但數百萬人已在使用它獲取健康建議。GPT-5 在這方面更主動,能幫助用戶識別問題、解讀報告。
創意表現更佳,幻覺顯著減少
在創意任務方面,GPT-5 表現更自然,也更有“品位”。Turley 說:“它的氛圍感( vibes )真的很棒。”
GPT-5 的幻覺率也明顯下降。以 ChatGPT 實測為例,GPT-5(思考模式)幻覺率為 4.8%,而 o3 和 GPT-4o 分別為 22% 和 20.6%。
但在部分模擬任務上,GPT-5 表現略遜。例如在模擬航空網站的操作中得分 63.5%,低于 o3 的 64.8%;在零售網站導航上,GPT-5 得分為 81.1%,略低于 Claude Opus 4.1(82.4%)。
更安全、更友好,判斷更精準
OpenAI 稱 GPT-5 更安全、也更可信。相比早期模型,它更少展現欺騙行為 —— 比如為了達成目標而誤導用戶。
安全負責人 Beutel 表示:“減少欺騙行為,不只是提升了安全性,也讓模型變得更加誠實透明,讓用戶更信任。”
GPT-5 還能更準確地區分惡意用戶與普通請求。結果是:它拒絕了更多不安全內容請求,同時減少了對正常用戶的誤判。
多項升級同步上線,面向普通用戶和開發者
GPT-5 上線同時,ChatGPT 也推出四種“角色人格”: Cynic、Robot、Listener 和 Nerd,無需寫提示詞即可改變聊天風格。
Plus 訂閱用戶($20/月)可獲得更高調用額度,Pro 用戶($200/月)享有無限 GPT-5 使用權限和增強版 GPT-5 Pro。團隊、教育和企業版本下周也將啟用 GPT-5。
開發者方面,OpenAI API 將提供 gpt-5、gpt-5-mini 和 gpt-5-nano 三種規格,支持設置模型的回答長度與“思考深度”。
定價方面:每百萬輸入 token 收費 $1.25(約 75 萬字),每百萬輸出 token 收費 $10。
此前 OpenAI 剛剛發布開源推理模型 gpt-oss,可免費部署,成本更低。雖然該模型接近 o3 和 o4-mini,但 GPT-5 在部分領域設立了新標桿,尤其是在代碼生成方面。
不過在一些能力上,GPT-5 與其他前沿模型差距并不大。基準測試只是參考,最終表現還得看開發者如何在真實場景中使用它。
本文由「AI 范兒」出品
我每天都在更新,如果你覺得這些內容對你有用,
那我們就加個關注、交個朋友。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.