網易首頁 > 網易號 > 正文申請入駐

OpenAI 的 GPT-5 來了！

2025-08-08 09:20:32　來源: AI范兒

上海舉報

分享至

OpenAI 正式推出了 GPT-5，這是其下一代 ChatGPT 的核心旗艦模型。

這款于周四發布的新模型，是 OpenAI 首個實現“統一架構”的 AI 模型，融合了 o 系列的邏輯推理能力與 GPT 系列的高速響應能力。GPT-5 的推出，意味著 ChatGPT 邁入了全新階段，也展現出 OpenAI 正在向更復雜的智能體（ agent ）方向發展，而不只是一個聊天工具。

GPT-4 的出現讓 ChatGPT 能夠針對各種問題給出聰明的回答，而 GPT-5 則進一步讓它能替用戶完成實際任務，比如開發 App、整理日歷、撰寫研究摘要等。

OpenAI 還特別優化了 GPT-5 的使用體驗。用戶不再需要自行調整設置，新模型內建的實時路由器（ real-time router ）會自動判斷回答策略 —— 是要快速回應，還是多花點時間“思考”以輸出更完整的答案。

OpenAI CEO Sam Altman 在一次媒體溝通中稱 GPT-5 是“當前全球最強的模型”，并認為這是實現“通用人工智能（ AGI ）”道路上的關鍵里程碑 —— 也就是能在大多數高價值工作中超越人類的 AI。

“要是放在歷史上的任何一個階段，人們幾乎無法想象會有 GPT-5 這樣的東西。”Altman 說。

從今天開始，GPT-5 將作為默認模型對所有 ChatGPT 免費用戶開放使用。

OpenAI 的 ChatGPT 副總裁 Nick Turley 表示，這也是公司首次讓免費用戶用上具備 AI 推理能力的模型（過去這些能力通常只向付費用戶開放）。

Turley 表示：“這只是我踐行 OpenAI 使命的方式之一 —— 確保技術真正讓大眾受益。”他提到的，是 OpenAI 一貫強調的使命：讓先進 AI 被更廣泛的人群使用。

GPT-5 是自 2022 年 ChatGPT 引爆全球關注以來，OpenAI 最受期待的一次產品發布。據官方統計，ChatGPT 每周活躍用戶已超過 7 億，占全球人口近 10%。

GPT-5 被視為衡量 AI 發展進程的風向標。硅谷、大型科技公司、華爾街乃至監管機構都在密切關注：這次升級是否能像 GPT-4 一樣再次打破預期，推動 AI 應用的邊界。

小幅領先對手，GPT-5 在多個領域表現出色

OpenAI 表示，GPT-5 在多個基準測試中表現優于 Anthropic、Google DeepMind 和 xAI（由 Elon Musk 創辦）。但在部分測試中也略有落后。

GPT-5 在編程方面尤其出色，Sam Altman 介紹說，它可以基于需求快速生成完整的應用程序，這種能力被稱為“ vibe coding ”。

在 SWE-bench Verified（真實 GitHub 編程任務）測試中，GPT-5 初次嘗試就拿下 74.9% 的得分，略高于 Claude Opus 4.1（74.5%）和 Gemini 2.5 Pro（59.6%）。

在跨學科的 Humanity’s Last Exam 測試中，GPT-5 Pro 得分為 42%，略低于 Grok 4 Heavy（44.4%）。

而在博士級別的科學問題測試 GPQA Diamond 中，GPT-5 Pro 表現強勢，得分高達 89.4%，超過 Grok 4 Heavy（88.9%）和 Claude Opus 4.1（80.9%）。

在健康問答方面，GPT-5（思考模式）表現出色，HealthBench Hard Hallucinations 測試中，幻覺率僅為 1.6%，顯著低于 GPT-4o（12.9%）和 o3（15.8%）。

雖然 AI 無法替代醫生，但數百萬人已在使用它獲取健康建議。GPT-5 在這方面更主動，能幫助用戶識別問題、解讀報告。

創意表現更佳，幻覺顯著減少

在創意任務方面，GPT-5 表現更自然，也更有“品位”。Turley 說：“它的氛圍感（ vibes ）真的很棒。”

GPT-5 的幻覺率也明顯下降。以 ChatGPT 實測為例，GPT-5（思考模式）幻覺率為 4.8%，而 o3 和 GPT-4o 分別為 22% 和 20.6%。

但在部分模擬任務上，GPT-5 表現略遜。例如在模擬航空網站的操作中得分 63.5%，低于 o3 的 64.8%；在零售網站導航上，GPT-5 得分為 81.1%，略低于 Claude Opus 4.1（82.4%）。

更安全、更友好，判斷更精準

OpenAI 稱 GPT-5 更安全、也更可信。相比早期模型，它更少展現欺騙行為 —— 比如為了達成目標而誤導用戶。

安全負責人 Beutel 表示：“減少欺騙行為，不只是提升了安全性，也讓模型變得更加誠實透明，讓用戶更信任。”

GPT-5 還能更準確地區分惡意用戶與普通請求。結果是：它拒絕了更多不安全內容請求，同時減少了對正常用戶的誤判。

多項升級同步上線，面向普通用戶和開發者

GPT-5 上線同時，ChatGPT 也推出四種“角色人格”： Cynic、Robot、Listener 和 Nerd，無需寫提示詞即可改變聊天風格。

Plus 訂閱用戶（$20/月）可獲得更高調用額度，Pro 用戶（$200/月）享有無限 GPT-5 使用權限和增強版 GPT-5 Pro。團隊、教育和企業版本下周也將啟用 GPT-5。

開發者方面，OpenAI API 將提供 gpt-5、gpt-5-mini 和 gpt-5-nano 三種規格，支持設置模型的回答長度與“思考深度”。

定價方面：每百萬輸入 token 收費 $1.25（約 75 萬字），每百萬輸出 token 收費 $10。

此前 OpenAI 剛剛發布開源推理模型 gpt-oss，可免費部署，成本更低。雖然該模型接近 o3 和 o4-mini，但 GPT-5 在部分領域設立了新標桿，尤其是在代碼生成方面。

不過在一些能力上，GPT-5 與其他前沿模型差距并不大。基準測試只是參考，最終表現還得看開發者如何在真實場景中使用它。

本文由「AI 范兒」出品

我每天都在更新，如果你覺得這些內容對你有用，

那我們就加個關注、交個朋友。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

OpenAI頭號叛徒，竟然是自學的AI?

量子位 2025-08-22 16:06:15
0 跟貼 0
英偉達4B小模型擊敗GPT-5 Pro！成本僅1/36

量子位 2025-12-08 14:31:05
0 跟貼 0

格斗冠軍機器人突然發瘋！嚇呆研究人員

量子位 2025-07-25 09:10:58
6 跟貼 6

DeepMind讓AI當「上帝」，導演一場只有AI演員的「西部世界」

機器之心Pro 2025-07-16 13:55:45
0 跟貼 0
GPT-5.2要來了？通信ETF（515880）大漲超5%，光模塊占比超50%

每日經濟新聞 2025-12-08 10:22:06
0 跟貼 0

波士頓機器狗練成“輕功”！連續七個后空翻

量子位 2025-09-07 01:03:18
11 跟貼 11

華為新架構砍了Transformer大動脈！任意模型推理能力原地飆升

量子位 2025-12-06 21:41:29
0 跟貼 0
宇樹科技王興興：為什么要把機器人做得像人？老百姓喜歡，更愿意買單！

上觀新聞 2025-12-08 10:42:07
132 跟貼 132

國產AI路由系統開源逆襲！僅用19%成本達到Gemini-2.5-Pro同性能

量子位 2025-08-20 15:41:20
69 跟貼 69
大模型也會賭博上癮！理智出走！

量子位 2025-11-03 07:06:08
0 跟貼 0
80%初創企業在用中國AI，網友：其他地區豈不是百分百？

量子位 2025-12-05 21:31:47
0 跟貼 0
AI重塑人機交互方式，下一代終端如何變革？

量子位 2025-09-24 20:17:01
0 跟貼 0
全球唯一達到國際物理奧賽金牌線的開源AI來自上海AILab

量子位 2025-12-06 22:21:55
0 跟貼 0
昆蟲機器人裝了個AI大腦，11秒連翻10個跟頭

DeepTech深科技 2025-12-08 15:08:37
0 跟貼 0
OpenAI推動大模型自我檢舉機制，讓AI主動坦承錯誤與作弊

DeepTech深科技 2025-12-08 15:05:21
0 跟貼 0
未來醫生摘得全球第一，臨床安全有效性評估新基準

量子位 2025-11-19 11:14:03
0 跟貼 0
李飛飛發起機器人家務挑戰賽，老黃第一時間批錢贊助

量子位 2025-10-13 09:30:54
0 跟貼 0
機器人管家Figure 03來了，承包一切家務！

量子位 2025-10-11 10:13:00
0 跟貼 0
一個叫高斯的AI，只用了三周完成強素數定理

量子位 2025-09-20 00:57:38
0 跟貼 0
機器人終于有自己的真機評測大考了

量子位 2025-10-15 20:05:44
0 跟貼 0
機器狗跳千手觀音，波士頓動力達人秀炸場

量子位 2025-06-13 15:55:52
0 跟貼 0
機器狗被鋸腿也能繼續走，Skild Brain估值45億美元

量子位 2025-09-27 17:49:32
0 跟貼 0
ChatGPT智能體來了：自己操作電腦干活，接管你的電腦，自動執行各種任務

量子位 2025-07-18 18:08:35
0 跟貼 0
五八智能四足機器人平臺Q20A 不止跑跳整活還能維護公共安全

量子位 2025-09-30 10:01:00
0 跟貼 0
機器人疊衣，靈巧手抓萬物，超實用機器人組合來了

量子位 2025-07-29 03:31:41
0 跟貼 0
五八智能四足機器人平臺Q20A，適用于千行百業

量子位 2025-09-30 15:35:41
0 跟貼 0
學術圈最強AI工具：6.9億專業文獻，“搜讀創編”全程輔助

量子位 2025-09-11 18:42:26
0 跟貼 0
IJCAI 2026每篇投稿收100美元，學術圈卻評價頗高

機器之心Pro 2025-12-08 14:46:05
0 跟貼 0
讓大模型學會「心靈感應」：基于思維溝通的多智能體合作范式來了

機器之心Pro 2025-11-18 10:12:54
0 跟貼 0
螞蟻想押寶更多“王興興”

華爾街見聞官方 2025-12-08 16:07:57
0 跟貼 0
兩個LLM互相對線，推理起飛：康奈爾團隊發布大模型版類GAN訓練法

機器之心Pro 2025-12-08 16:16:12
0 跟貼 0
MIT用人工肌腱升級生物混合機器人，活體肌肉輸出力量提升30倍

DeepTech深科技 2025-12-08 14:57:26
0 跟貼 0
DeepSeek、Gemini誰更能提供情感支持？趣丸×北大來了波動態評估

機器之心Pro 2025-12-08 16:08:38
0 跟貼 0
美團開源LongCat-Image模型！科創人工智能ETF華夏(589010) 震蕩攀升漲1.57%，寒武紀領漲

每日經濟新聞 2025-12-08 14:14:26
0 跟貼 0
黃仁勛：中國的AI市場無論有沒有英偉達都會進步與華為是競爭對手不是敵人

財聯社 2025-07-21 10:22:14
7 跟貼 7
英偉達巧用8B模型秒掉GPT-5，開源了

量子位 2025-12-06 14:07:18
7 跟貼 7
這是真的不把老板當人看啊！老板親身上陣體驗眾擎T800的實力！網友：看得出來旁邊的員工舉著手機笑得好

城市大眼睛 2025-12-07 12:40:35
1 跟貼 1
明朝最基層的治理體系縣衙的架構是怎樣的？

朝話熹史 2025-12-05 06:05:44
0 跟貼 0
馬斯克用Grok替代X員工，裁員90%

量子位 2025-11-29 16:58:47
0 跟貼 0
光入柜內要來，通信ETF能破前高么？——通信ETF（515880）大漲點評

每日經濟新聞 2025-12-08 16:10:05
0 跟貼 0

手機 / 數碼

房產 / 家居

OpenAI 的 GPT-5 來了！

外面有人挖，家里有人跑:蘋果亂成了一鍋粥

40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

40歲北京本地獨生女想結婚被網暴:樂于生育和相夫教子

一位大學美術生，如何用4年成為頂級跑者？

郭麒麟也救不了的德云社了？

重磅！政治局會議定調明年經濟工作

純電全尺寸大六座 凱迪拉克"小凱雷德"申報圖曝光

態度原創

有限無界 打破慣有思維

《節奏醫生》IGN9分！Steam好評如潮：音游天花板

碧桂園，開始甩賣海口家底！

甲狀腺結節到這個程度，該穿刺了！

父母永遠不要與孩子分享的8件事，關系再好也別說

純電全尺寸大六座凱迪拉克"小凱雷德"申報圖曝光

有限無界打破慣有思維