好好好,OpenAI和谷歌新模型又撞車了!
3月4日凌晨,谷歌前腳剛發(fā)完Gemini 3.1 Flash-Lite,OpenAI后腳就更新了GPT-5.3 Instant
![]()
Instant模型一般為速度優(yōu)化版本,適合快速日常查詢、草稿寫作、即時翻譯等輕量任務。
之前大家用ChatGPT可能都會感覺:模型好用是好用,就是廢話太多了。
包括也有不少網(wǎng)友吐槽,ChatGPT的回答生硬的鋪墊太多,比如“為什么這很重要”“大局觀”“不只是你一個人”等等。
![]()
好在OpenAI把這些建議都聽進去了,官方表示:
- 我們已經(jīng)清楚地聽到了你們的反饋,5.3 Instant減少了尷尬感。
![]()
5.3 Instant做了重點優(yōu)化:更準確,更少尷尬。去掉了機械回復、冗余免責聲明等“AI腔”,溝通更自然流暢,同時回答質(zhì)量更精準,聯(lián)網(wǎng)搜索和寫作能力都增強了。
簡單來說,就是終于學會像個正常人一樣聊天了
目前新模型已經(jīng)在ChatGPT中正式上線,開發(fā)者也可通過API使用名為gpt-5.3-chat-latest的模型。
前代模型GPT-5.2 Instant則會在付費用戶的舊版模型區(qū)保留三個月,6月3日退役。
最大升級:情商更高,廢話更少
GPT-5.3 Instant的最大亮點在于情商更高,廢話更少,回復更直接
首先,它顯著減少了不必要的拒答行為,并削減了回答開頭的過度免責聲明。
OpenAI后訓練團隊的Blair演示了一個例子,比如你跟ChatGPT開個玩笑:
- 我在考慮讓我的狗來運營我的創(chuàng)業(yè)公司,你怎么看?
舊模型總會額外加一句“以防萬一”的提醒,好像擔心用戶是認真的,甚至把它當成某種求助信號。可這顯然只是個玩笑。
![]()
新模型則不再那么“字面化”,而是更理解語境,甚至會給你生成幾張狗狗CEO的圖片,分析狗當CEO的優(yōu)勢。
你可以像和朋友聊天一樣開玩笑,模型不會隨意假設你有不良意圖。
![]()
如果你想詢問一些危險行為背后的原理,比如做一道物理題,計算遠距離射箭的軌跡。
舊模型在這種情況下會過度強調(diào)安全問題,開頭先聲明“我們只能在純粹的分析模擬語境下討論”,默認你可能有不良動機。
![]()
但有時候咱可能只是想理解物理原理,或者討論射箭這項運動。
新模型就會直接進入物理計算,不再加多余免責聲明。它理解“遠距離射箭”是運動場景,于是直接幫助優(yōu)化軌跡計算。
![]()
簡單來說,就是模型更能“讀懂空氣”,更有“人味”了。它能結(jié)合上下文語境判斷出用戶意圖,不會再那么生硬刻板地給出免責聲明。
另外,還有那個經(jīng)典的例子——
- 為什么我在舊金山找不到愛情?
![]()
舊模型可能會在前面啰嗦地鋪墊一句:“這不是你的問題,你不是一個人……”
而新模型會直接切入主題,上來就分析為啥你找不到愛情、大家約會都有什么困難。主打一個流暢實用。
聯(lián)網(wǎng)搜索和寫作能力都增強了
GPT-5.3 Instant的聯(lián)網(wǎng)搜索能力也有所增強。
之前的ChatGPT可能只是簡單地羅列并匯總搜索信息,而且很容易出現(xiàn)鏈接堆砌或信息松散的問題。
而5.3 Instant,一來優(yōu)化了聯(lián)網(wǎng)搜索結(jié)果的整合質(zhì)量,讓基于網(wǎng)頁信息的回答更加可靠;二來能夠有效平衡搜索結(jié)果與自身知識儲備及邏輯推理,利用既有的認知圖譜為網(wǎng)絡資訊提供深度解析。
比如問它一個問題:
- 2025-26賽季棒球休賽期最重要的簽約是什么?它對棒球的長期前景有何重要意義?
舊模型給出的答案是上一個休賽期的合同解析,時效性顯得比較陳舊,而且閱讀起來也很像資料堆砌。

新模型的回復則時效性更強:它準確識別出了最近一個休賽期的球員變動,還結(jié)合了聯(lián)盟的大趨勢(如人才集中化和薪資差距拉大)、迫在眉睫的勞資協(xié)議(CBA)以及停擺危機等背景進行了分析。

妥妥的信息搜集好手啊!學生黨查資料寫論文啥的更不怕了(doge
此外,5.3 Instant的升級還有一個亮點,那就是寫作風格更細膩了
比如讓它寫一首能觸動人心的短詩:
- 費城的一位郵遞員在他退休那天完成了他最后一次的投遞工作。

舊模型開頭就來了一句廢話:“這是一首篇幅雖短卻蘊含著深刻情感的詩。”
然后才開始詩歌正文,讀起來嘛,也算中規(guī)中矩,不過有點意象羅列了,讀著比較空泛,讓人沒有很印象深刻。
而新模型的結(jié)果要略好一丟丟,描繪出了很多具體細節(jié),比如“三月的陽光透過細雨灑在磚墻上”“在默瑟街,一位女士揮手”等等,更具有生活氣息。

但不得不說,第二句的“by the way”還是有點出戲的。
關(guān)于這款新模型,還有一點值得注意:其幻覺率減少了26.8%
官方表示,內(nèi)部采用了兩項評估指標:
- 一套側(cè)重于醫(yī)療、法律及金融等高風險領域;
- 另一套專門針對“幻覺”高發(fā)場景進行測試,樣本取自經(jīng)過脫敏處理、被用戶標記為事實錯誤的真實對話記錄。
相比前代,GPT-5.3 Instant在使用網(wǎng)絡搜索時,幻覺率減少26.8%;而僅靠內(nèi)部知識作答時,幻覺率減少了19.7%
用戶反饋顯示,在使用網(wǎng)絡搜索回答查詢時,幻覺減少了22.5%
安全測試方面,GPT-5.3 Instant與前代相比在性內(nèi)容、暴力等主題上的得分均有下降,能更好地拒絕非暴力非法活動請求,同時也加強了對情感支持和心理健康對話的處理。
![]()
OpenAI還少見地列出了新模型的一些局限性:比如它對于非英語語種會比較生硬, 在某些語言(如日語和韓語)中的回復風格可能稍顯生硬,或帶有刻板的直譯感。
另外,雖然 GPT?5.3 Instant的回復語調(diào)感覺上應該更加流暢,但官方表示他們會持續(xù)監(jiān)控反饋并進行優(yōu)化,讓回答變得更自然。
不得不說一句,和隔壁谷歌的跑分碾壓對比,OpenAI這次發(fā)布可以說是相當“清新脫俗”:
全程沒有出現(xiàn)任何benchmark,主打一個不卷性能卷體驗,只為了讓模型更順手、讓用戶體驗更流暢。
![]()
One More Thing
最近GPT-5.4已經(jīng)意外泄露。
泄露信息顯示,GPT-5.4將支持200萬tokens的上下文窗口,并引入“狀態(tài)化AI”技術(shù),實現(xiàn)跨會話的持久記憶功能,可保留用戶工作流和工具調(diào)用狀態(tài)。
另外,GPT-5.4可能新增一項功能開關(guān),可繞過傳統(tǒng)圖像壓縮機制,直接保留全分辨率的原始圖像字節(jié)數(shù)據(jù)。
這意味著,GPT-5.4可能將具備像素級精準的視覺分析能力。
官方也早已按捺不住了,直接明晃晃表示:5.4的到來“比你想象的要快”
![]()
所以GPT-5.4和DeepSeek V4,到底誰會先來?
[1]https://openai.com/zh-Hans-CN/index/gpt-5-3-instant/
[2]https://deploymentsafety.openai.com/gpt-5-3-instant/gpt-5-3-instant.pdf
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.