作者|子川
來源|AI先鋒官
時隔兩年半,萬眾期待的GPT-5,終于來了!
![]()
根據OpenAI官方介紹:GPT-5是其迄今為止最強的模型,在編碼、數學、寫作、健康、視覺感知等多個維度都達到了頂尖水準。
值得關注的是,這次GPT-5最大的亮點之一是其“統一智能系統”。
你不再需要手動切換模型,它能根據你的問題,自動判斷是該秒速響應,還是啟動深度思考模式。
當然,你也可以在提示詞里加上一句“think hard about this”來強制開啟深度推理。
此外,OpenAI還推出了四種官方預設性格:憤世嫉俗者 (Cynic)、機器人 (Robot)、傾聽者 (Listener) 和書呆子 (Nerd)。
你可以隨時切換,讓AI的溝通風格更合你心意。
![]()
更重要的是,和此前奧特曼透露的消息一致,GPT-5 將作為 ChatGPT 的默認模型,面向包括免費用戶在內的所有人陸續開放!
Pro 用戶:可以無限量使用GPT-5,并且能獨家訪問最強的 GPT-5 Pro 版本(專為解決最復雜問題設計,性能更強)。
Plus 用戶:使用額度遠高于免費用戶,日常使用完全夠用。
免費用戶:同樣能體驗完整的GPT-5,在用量達到上限后,會自動切換到 GPT-5 mini 模型。
在性能數據方面,OpenAI也公布了一大堆跑分,我們挑幾個最經典的來看看。
在著名的編程測試 SWE-bench 上,GPT-5的得分為74.9%,以微弱優勢超過了 Claude Opus 4.1 的 74.5%。(就多一點點)。
![]()
同時,它的“幻覺”問題也得到了大幅改善,“GPT-5 思考模式”的幻覺率比 o3 減少約六倍。
![]()
不僅是幻覺減少了,一本正經地胡說八道的概率也顯著下降。
在一個測試中,研究人員刪掉了所有圖片再向模型提問,老模型有86.7%的概率會“腦補”出根本不存在的畫面,而GPT-5的這一比例,驟降到了9%!
![]()
同時GPT-5 在人類最后一次考試中的得分再創新高,其中Pro模型得分更是達到了42%,低于Grok 4 Heavy的44.4%。
![]()
另外,之前有用戶反饋GPT-4o的回答過度附和。
GPT-5專門治了這個毛病,大幅減少了“諂媚”(sycophancy)回復,官方數據顯示,特定場景下的諂媚回復率從14.5%直接砍到了6%以下。
此次OpenAI一共放出4個版本,分別是:GPT-5、GPT-5 mini、GPT-5 nano 以及 Chat 專用版。
價格相比此前的模型更便宜,GPT-5的輸入為1.25$/M,輸出為10$/M。
![]()
最后,再看看OpenAI官方放出的幾個實測案例,一起感受一下GPT-5的性能。
使用GPT-5制作的滾球闖關小游戲,可以控制小球跳跳跳進行闖關。
可以進行寫作的像素格子游戲。
架子鼓小游戲,可以用鼠標或鍵盤敲擊并發出不同的聲音。
以及一個可視化工具,并且支持隨意切換顏色。
大家非常熟悉的行星運行模擬也有。
接水果小游戲。
精美的留言網站。
這是一個可以跳轉的二維碼生成器。
用戶@Ethan Mollick使用GPT-5搞一個程序化粗野主義建筑生成器,讓我能拖拽、花式編輯樓體。
用戶@黃赟用 GPT 4.1, kimi-k2, GPT 5, claude 4.1 opus, gemini 2.5 pro做了一組F1賽車動畫進行對比。
并表示GPT-5 超領先第二名 Claude 1分鐘左右,且對 f1 賽車理解最到位,有明顯的被超車,加速,猛超車的動作。
用戶@justin用GPT-5和Claude Opus 4.1同時制作了“3d 水豚寵物動物園”
GPT-5:![]()
Claude Opus 4.1:
![]()
最后給大家分享一個直播小插曲,如果大家細看直播,會發現下面這張圖,52.8>69.1(笑鼠)。
![]()
面對GPT-5的發布,馬斯克表示:不服!!!
曬出了Grok 4在ARC-AGI上擊敗了GPT-5的榜單,同時表示今年年底將推出Grok 5。
![]()
寫到最后,不禁想到GPT-5的誕生就是一部活脫脫的難產史。
從2023 年 12 月,OpenAI 內部代號為 Orion 的項目爆出,被定為 GPT-5。
再到今天的發布,整整20個月,它終于是誕生了,也慶幸它生出來了。
一個更智能、更強大、幻覺更少的模型。
掃碼邀請進群,我們帶你一起來玩轉ChatGPT、GPT-4、文心一言、通義千問、訊飛星火等AI大模型,順便學一些AI搞錢技能。
往期文章回顧
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.