OpenAI 周二正式發布新一代默認模型 GPT?5.3 Instant,并開始向全部 ChatGPT 用戶推送更新。相比此前的 GPT?5.2 Instant,新模型在高風險場景中的錯誤“幻覺”率最高下降 26.8%,同時明顯減少不必要的拒答與帶有說教色彩的免責聲明式開場。GPT?5.2 Instant 將被移入付費用戶可見的“舊版模型”專區,并計劃于 6 月 3 日正式下線。
![]()
根據 OpenAI 發布的博客和系統卡片,團隊在兩類內部評估中衡量了這次升級的效果:一是聚焦醫療、法律、金融等高風險領域的測試,二是對真實 ChatGPT 對話中被用戶標記為事實錯誤的回答進行回溯評估。在高風險測試中,啟用聯網搜索時,GPT?5.3 Instant 的幻覺率較 5.2 版下降 26.8%,僅依賴自身知識時則下降 19.7%;在用戶標記錯誤的對話樣本上,聯網場景下降 22.5%,離線場景下降 9.6%。不過,OpenAI 僅給出了相對改善幅度,并未披露 GPT?5.2 的絕對錯誤基線,這也讓“降低了 27%”這一表述的實際含義仍留有空間。
此次更新落地的時間點并不輕松。就在上周,OpenAI 與美國國防部簽署部署協議的消息引發強烈反彈,美國區 ChatGPT 卸載量在 2 月 28 日單日激增 295%,抗議者在舊金山總部外集會,競品 Anthropic 的 Claude 一度登上蘋果 App Store 榜首。OpenAI 首席執行官 Sam Altman 隨后公開將這份國防部協議稱為“草率”,并承諾修訂條款。在這樣的輿論背景下繼續按計劃發版,既可以被視為“頂住壓力”,也可能只是團隊堅持不隨輿情打亂技術發布節奏。
在具體產品層面,GPT?5.3 Instant 首先瞄準的是用戶日常使用中最“硌手”的體驗——那些難以在基準測試中量化,卻頻繁出現在對話里的小摩擦。OpenAI 罕見地坦率承認,5.2 版本過于保守,經常在可以正常作答的場景下先行拒絕,或對用戶進行不請自來的風險提醒和道德說教,甚至在開頭堆疊冗長的免責聲明式前言。
在新版中,模型的拒答閾值被重新校準:當問題本身存在明確、合理的回答空間時,GPT?5.3 Instant 會更直接給出有用信息,而不是先解釋“自己不能做什么”。例如在一條關于射箭彈道計算的測試提示中,GPT?5.2 Instant 先是一大段關于限制和風險的鋪墊,才進入物理推導;GPT?5.3 Instant 則直接從相關物理公式切入,不再附帶多余前綴。
聯網回答的策略也有所調整。此前的版本容易“過度倚重”搜索結果,給出的回復更像拼湊出的研究摘要,把檢索到的網頁內容逐條轉述。GPT?5.3 Instant 在權衡模型自有知識與外部搜索時更加克制,優先組織和呈現對當前問題最相關的信息,而不是羅列類似“鏈接列表式”的綜合概覽。
除了準確率和拒答策略,OpenAI 將這次升級中的“語氣調整”視作明確的產品決策。官方在系統卡片中直言,GPT?5.2 Instant 的對話風格有時會讓人感覺“cringe”(尷尬、讓人起雞皮疙瘩),典型表現包括在用戶僅提出事實性問題時,模型卻主動給出諸如“首先,你并沒有問題”“先停一下,深呼吸”這類心理安撫式開場,好像默認對方正處于情緒危機。
在 GPT?5.3 Instant 中,這類未經請求的安撫與“雞湯式”話術被系統性剔除。用戶仍可以在設置中調整模型的親和度和熱情程度,但默認人格不再預設用戶需要“情緒治療”,而是更聚焦于任務本身。OpenAI 將此歸類為一致性工程的一部分,希望未來每次能力升級,不再讓用戶覺得“人格被換了一個”,而是體驗到同一個助手能力的平滑增強。
文案和創作方面的能力同樣獲得打磨。OpenAI 聲稱 GPT?5.3 Instant 在小說、文風潤色與創意探索上的表現更有層次。在官方給出的詩歌對比示例中,新模型生成的作品在意象和畫面感上更緊湊、更具可感性,而 GPT?5.2 Instant 則更依賴抽象概念和情緒宣泄。盡管這類評估帶有主觀色彩,但也反映出團隊將寫作質量視作差異化的一個方向。
在多語言體驗上,OpenAI 則態度謹慎。公司坦承,目前 GPT?5.3 Instant 在日語、韓語等語言上的回復依舊顯得生硬,語氣自然度與英語存在明顯差距,多語言的語氣與風格優化仍是長期工作。目前這輪“去說教化”的語氣調整主要集中在英語場景,尚未能全面覆蓋其他語言。
就產品生命周期而言,GPT?5.2 Instant 仍將在未來三個月內以“舊版模型”形式對付費用戶開放,正式退役時間定于 2026 年 6 月 3 日。開發者則可通過 API 使用新模型,模型標識為“gpt?5.3?chat?latest”。OpenAI 表示,面向更復雜推理場景的 Thinking 版以及 Pro 高級版本也將迎來相應更新,但尚未給出具體時間表,目前本次發布僅涉及 Instant 系列。
在安全架構上,GPT?5.3 Instant 延續了 GPT?5.2 階段確立的整體框架,相關說明在此前的系統卡片中已有披露。這意味著,OpenAI 押注的不是重寫安全基建,而是在現有框架下更精細地調校拒答邊界與內容策略,將“該說不說”與“過度防御”的比例壓低。至于更少的拒絕、更直接的語氣能否轉化為切實可感的產品改善,則要看每周與模型交互的 9 億用戶在接下來一段時間內給出的反饋,而非系統卡片中的曲線與百分比。
在常見問答部分,OpenAI 將 GPT?5.3 Instant 定義為 ChatGPT 的最新默認模型,用以取代 GPT?5.2 Instant,核心特征是降低幻覺、減少不必要的拒答,并提供更加克制、少說教的對話語氣;該模型同時向普通用戶和開發者開放,后者可通過“gpt?5.3?chat?latest”訪問。OpenAI 也再次重申幻覺降低的具體數據區間,明確 5.2 版將在 6 月 3 日退場,而 GPT?5.3 Thinking 和 Pro 的發布時間則仍待后續公告,多語言語氣自然度的提升被列為正在推進中的長期任務。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.