網易首頁 > 網易號 > 正文申請入駐

OpenAI 推出 GPT?5.3 Instant：幻覺率最高下降 26.8% 更少說教語氣

2026-03-04 03:59:12　來源: cnBeta.COM

浙江舉報

分享至

OpenAI 周二正式發布新一代默認模型 GPT?5.3 Instant，并開始向全部 ChatGPT 用戶推送更新。相比此前的 GPT?5.2 Instant，新模型在高風險場景中的錯誤“幻覺”率最高下降 26.8%，同時明顯減少不必要的拒答與帶有說教色彩的免責聲明式開場。GPT?5.2 Instant 將被移入付費用戶可見的“舊版模型”專區，并計劃于 6 月 3 日正式下線。

根據 OpenAI 發布的博客和系統卡片，團隊在兩類內部評估中衡量了這次升級的效果：一是聚焦醫療、法律、金融等高風險領域的測試，二是對真實 ChatGPT 對話中被用戶標記為事實錯誤的回答進行回溯評估。在高風險測試中，啟用聯網搜索時，GPT?5.3 Instant 的幻覺率較 5.2 版下降 26.8%，僅依賴自身知識時則下降 19.7%；在用戶標記錯誤的對話樣本上，聯網場景下降 22.5%，離線場景下降 9.6%。不過，OpenAI 僅給出了相對改善幅度，并未披露 GPT?5.2 的絕對錯誤基線，這也讓“降低了 27%”這一表述的實際含義仍留有空間。

此次更新落地的時間點并不輕松。就在上周，OpenAI 與美國國防部簽署部署協議的消息引發強烈反彈，美國區 ChatGPT 卸載量在 2 月 28 日單日激增 295%，抗議者在舊金山總部外集會，競品 Anthropic 的 Claude 一度登上蘋果 App Store 榜首。OpenAI 首席執行官 Sam Altman 隨后公開將這份國防部協議稱為“草率”，并承諾修訂條款。在這樣的輿論背景下繼續按計劃發版，既可以被視為“頂住壓力”，也可能只是團隊堅持不隨輿情打亂技術發布節奏。

在具體產品層面，GPT?5.3 Instant 首先瞄準的是用戶日常使用中最“硌手”的體驗——那些難以在基準測試中量化，卻頻繁出現在對話里的小摩擦。OpenAI 罕見地坦率承認，5.2 版本過于保守，經常在可以正常作答的場景下先行拒絕，或對用戶進行不請自來的風險提醒和道德說教，甚至在開頭堆疊冗長的免責聲明式前言。

在新版中，模型的拒答閾值被重新校準：當問題本身存在明確、合理的回答空間時，GPT?5.3 Instant 會更直接給出有用信息，而不是先解釋“自己不能做什么”。例如在一條關于射箭彈道計算的測試提示中，GPT?5.2 Instant 先是一大段關于限制和風險的鋪墊，才進入物理推導；GPT?5.3 Instant 則直接從相關物理公式切入，不再附帶多余前綴。

聯網回答的策略也有所調整。此前的版本容易“過度倚重”搜索結果，給出的回復更像拼湊出的研究摘要，把檢索到的網頁內容逐條轉述。GPT?5.3 Instant 在權衡模型自有知識與外部搜索時更加克制，優先組織和呈現對當前問題最相關的信息，而不是羅列類似“鏈接列表式”的綜合概覽。

除了準確率和拒答策略，OpenAI 將這次升級中的“語氣調整”視作明確的產品決策。官方在系統卡片中直言，GPT?5.2 Instant 的對話風格有時會讓人感覺“cringe”（尷尬、讓人起雞皮疙瘩），典型表現包括在用戶僅提出事實性問題時，模型卻主動給出諸如“首先，你并沒有問題”“先停一下，深呼吸”這類心理安撫式開場，好像默認對方正處于情緒危機。

在 GPT?5.3 Instant 中，這類未經請求的安撫與“雞湯式”話術被系統性剔除。用戶仍可以在設置中調整模型的親和度和熱情程度，但默認人格不再預設用戶需要“情緒治療”，而是更聚焦于任務本身。OpenAI 將此歸類為一致性工程的一部分，希望未來每次能力升級，不再讓用戶覺得“人格被換了一個”，而是體驗到同一個助手能力的平滑增強。

文案和創作方面的能力同樣獲得打磨。OpenAI 聲稱 GPT?5.3 Instant 在小說、文風潤色與創意探索上的表現更有層次。在官方給出的詩歌對比示例中，新模型生成的作品在意象和畫面感上更緊湊、更具可感性，而 GPT?5.2 Instant 則更依賴抽象概念和情緒宣泄。盡管這類評估帶有主觀色彩，但也反映出團隊將寫作質量視作差異化的一個方向。

在多語言體驗上，OpenAI 則態度謹慎。公司坦承，目前 GPT?5.3 Instant 在日語、韓語等語言上的回復依舊顯得生硬，語氣自然度與英語存在明顯差距，多語言的語氣與風格優化仍是長期工作。目前這輪“去說教化”的語氣調整主要集中在英語場景，尚未能全面覆蓋其他語言。

就產品生命周期而言，GPT?5.2 Instant 仍將在未來三個月內以“舊版模型”形式對付費用戶開放，正式退役時間定于 2026 年 6 月 3 日。開發者則可通過 API 使用新模型，模型標識為“gpt?5.3?chat?latest”。OpenAI 表示，面向更復雜推理場景的 Thinking 版以及 Pro 高級版本也將迎來相應更新，但尚未給出具體時間表，目前本次發布僅涉及 Instant 系列。

在安全架構上，GPT?5.3 Instant 延續了 GPT?5.2 階段確立的整體框架，相關說明在此前的系統卡片中已有披露。這意味著，OpenAI 押注的不是重寫安全基建，而是在現有框架下更精細地調校拒答邊界與內容策略，將“該說不說”與“過度防御”的比例壓低。至于更少的拒絕、更直接的語氣能否轉化為切實可感的產品改善，則要看每周與模型交互的 9 億用戶在接下來一段時間內給出的反饋，而非系統卡片中的曲線與百分比。

在常見問答部分，OpenAI 將 GPT?5.3 Instant 定義為 ChatGPT 的最新默認模型，用以取代 GPT?5.2 Instant，核心特征是降低幻覺、減少不必要的拒答，并提供更加克制、少說教的對話語氣；該模型同時向普通用戶和開發者開放，后者可通過“gpt?5.3?chat?latest”訪問。OpenAI 也再次重申幻覺降低的具體數據區間，明確 5.2 版將在 6 月 3 日退場，而 GPT?5.3 Thinking 和 Pro 的發布時間則仍待后續公告，多語言語氣自然度的提升被列為正在推進中的長期任務。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.