網(wǎng)易首頁 > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，GPT-5.3 新模型撞車 Gemini，OpenClaw：謝謝你們

2026-03-04 06:44:16　來源: 愛范兒

廣東舉報(bào)

分享至

在 AI 模型的命名玄學(xué)里，「Instant」和「Lite」這兩個(gè)后綴，長(zhǎng)期以來都帶著一股說不清道不明的廉價(jià)感。

不是沒有原因。過去這類模型給人留下的印象，基本就是：速度快、腦子慢，做做文本總結(jié)勉強(qiáng)夠用，一旦碰上稍微復(fù)雜的推理任務(wù)，就開始一本正經(jīng)地胡說八道。

久而久之，輕量模型幾乎成了「將就用」的代名詞。

就在剛剛，OpenAI 和 Google 又一次撞車，發(fā)布了各自的輕量模型，并試圖用硬實(shí)力來扭轉(zhuǎn)這個(gè)刻板印象。省流版如下：

GPT-5.3 Instant：更具「人味兒」的智能助理，大幅降低幻覺率、減少「AI 腔」以及強(qiáng)化細(xì)節(jié)寫作能力，溝通更自然精準(zhǔn)，適合對(duì)內(nèi)容質(zhì)量要求高的場(chǎng)景（寫作、專業(yè)問答、高風(fēng)險(xiǎn)領(lǐng)域）
Gemini 3.1 Flash-Lite：便宜、快、不拖泥帶水，還支持「思考等級(jí)」調(diào)節(jié)功能，在保持高吞吐量的基礎(chǔ)上兼顧了深層邏輯推理，適合大規(guī)模、高實(shí)時(shí)性的批量任務(wù)（內(nèi)容審核、UI 生成、NPC 對(duì)話）

GPT-5.3 Instant：終于學(xué)會(huì)像個(gè)正常人一樣聊天了

經(jīng)常用 ChatGPT 的人，大概都有過這種無奈：你只是隨口問個(gè)小問題，它非要先給你端上一段「作為一個(gè)人工智能，我需要提醒你……」的長(zhǎng)篇大論。

這種總想教人做事的「AI 腔」，確實(shí)挺招人煩的。好在，OpenAI 這次是真的聽進(jìn)去了。

新上線的 GPT-5.3 Instant 花了很大的力氣來解決這個(gè)「毛病」。它學(xué)會(huì)了直接給出答案，不再啰里啰嗦地鋪墊。

除了不愛說廢話，它也變得更靠譜了。舊版本搜完網(wǎng)頁之后，容易把一堆鏈接和不相關(guān)信息堆到你面前。

得益于搜索能力的提升，GPT-5.3 Instant 會(huì)主動(dòng)把網(wǎng)頁內(nèi)容和自身的背景知識(shí)結(jié)合起來，先想清楚你真正想問什么，再給出有重點(diǎn)的回答，而不是把搜索引擎的工作原封不動(dòng)地轉(zhuǎn)包給你。

OpenAI 公布的內(nèi)部評(píng)測(cè)顯示，在聯(lián)網(wǎng)狀態(tài)下幻覺率降低了 26.8%，僅靠?jī)?nèi)部知識(shí)時(shí)也降低了 19.7%。官方特別提到醫(yī)療、法律、金融等高風(fēng)險(xiǎn)領(lǐng)域，新模型在這些場(chǎng)景下的謹(jǐn)慎程度和準(zhǔn)確性都有明顯改善。

最令人驚喜的，其實(shí)是它在寫作上的變化。

OpenAI 用一首詩的對(duì)比做了說明：同樣寫一個(gè)費(fèi)城郵遞員退休最后一天，舊版本傾向于堆砌「把這座城市背在郵袋里」這類抒情句，新版本則會(huì)寫那根「掉漆的藍(lán)色欄桿」、那扇「總有狗在門口等著的柵門」。情緒不靠凹，就這樣自然而然流露出來。

語氣上的調(diào)整也是此次更新的核心目標(biāo)之一。

「停下。深呼吸。」這類會(huì)打斷對(duì)話節(jié)奏的句式被刻意減少，整體風(fēng)格更直接，少了一種不必要的「AI 腔」。用戶仍可在設(shè)置里自定義回復(fù)的溫暖程度與熱情度，調(diào)出自己習(xí)慣的交互風(fēng)格。

GPT-5.3 Instant 即日起向所有 ChatGPT 用戶開放，API 名稱為「gpt-5.3-chat-latest」。付費(fèi)用戶還可以在舊版模型里繼續(xù)用 GPT-5.2 Instant，但它將在今年 6 月 3 日正式退役。

▲ 彩蛋時(shí)間

Gemini 3.1 Flash-Lite：便宜、反應(yīng)快，還挺聰明

相比于 GPT-5.3 Instant 的好好說話，Gemini 3.1 Flash-Lite 走的是純粹的務(wù)實(shí)風(fēng)，目標(biāo)非常明確：就是要快，就是要便宜。

價(jià)格方面，Gemini 3.1 Flash-Lite 的輸入價(jià)格是 0.25 美元每百萬 tokens，輸出價(jià)格是 1.50 美元每百萬 tokens。

這是什么概念？如果你是一個(gè)開發(fā)者，這意味著你大概花不到 2 塊錢人民幣，就能讓 AI 閱讀相當(dāng)于 5 本《哈利·波特》全集的文字量。

覺得便宜沒好貨？格局小了。

根據(jù) Artificial Analysis 的基準(zhǔn)測(cè)試，，相比上一代的 Gemini 2.5 Flash，3.1 Flash-Lite 的首字響應(yīng)時(shí)間（TTFT）快了 2.5 倍，整體輸出速度提升了 45%。對(duì)于需要實(shí)時(shí)響應(yīng)的產(chǎn)品來說，這個(gè)延遲差距在用戶體驗(yàn)上會(huì)有肉眼可見的感受。

這意味著，當(dāng)你還在眨眼的時(shí)候，它的回答可能已經(jīng)生成了一半。對(duì)于那些需要實(shí)時(shí)反饋的應(yīng)用——比如即時(shí)翻譯、游戲內(nèi)的 NPC 對(duì)話、即時(shí) UI 生成——這種低延遲是決定性的。

除此之外，Gemini 3.1 Flash-Lite 還具備「思考」能力。

在 AI Studio 和 Vertex AI 中，Google 為這款 Lite 模型配備了「思考等級(jí)（Thinking Levels）」的選項(xiàng)。開發(fā)者可以根據(jù)任務(wù)的復(fù)雜程度，自主調(diào)節(jié)模型「想多深」。

簡(jiǎn)單的高吞吐量任務(wù)，比如批量?jī)?nèi)容翻譯和內(nèi)容審核，可以用最輕的配置快速跑完；遇到需要嚴(yán)格遵循指令的界面生成或仿真創(chuàng)建任務(wù)，則可以讓模型多花一點(diǎn)時(shí)間推理，把結(jié)果做扎實(shí)。

這種「既要又要」的能力，也因此收獲了相當(dāng)不錯(cuò)的成績(jī)單。在 Arena.ai 的排行榜中，它的 Elo 分?jǐn)?shù)達(dá)到了 1432，在 GPQA Diamond（研究生級(jí)別的問答）測(cè)試中拿到了 86.9% 的準(zhǔn)確率。

在學(xué)術(shù)評(píng)測(cè) GPQA Diamond 上得分 86.9%，多模態(tài)理解 MMMU Pro 上達(dá)到 76.8%。這兩個(gè)數(shù)字不只是「在同檔位里還不錯(cuò)」，而是直接超過了體量更大的 Gemini 2.5 Flash。

注意，這里對(duì)比的是 Gemini 2.5 Flash 而非 Gemini 3 Flash，顯然雞賊的 Google 對(duì)這款模型也并未抱有多大的信心。

目前，3.1 Flash-Lite 以預(yù)覽版形式通過 Google AI Studio 和 Gemini API 向開發(fā)者開放，企業(yè)用戶可通過 Vertex AI 接入。Latitude、Cartwheel、Whering 等早期合作伙伴已在生產(chǎn)環(huán)境中完成測(cè)試，普遍認(rèn)可它在大規(guī)模調(diào)用下的穩(wěn)定性和指令遵循能力。

把這兩個(gè)模型放在一起看，你會(huì)發(fā)現(xiàn)「Instant」和「Lite」，或許正在找到自己最合適的位置。

以最近大火的 OpenClaw 為例，其核心場(chǎng)景是幫用戶處理郵件、管理日程，本質(zhì)上是一個(gè)需要自主執(zhí)行任務(wù)的 Agent。

這類產(chǎn)品對(duì)模型的要求，和普通 chatbot 聊天工具完全不同：它不需要模型表演得多聰明，它需要模型說人話、不出錯(cuò)、還得扛得住高頻調(diào)用。

GPT-5.3 Instant 顯著降低幻覺率，意味著 Agent 在自主執(zhí)行任務(wù)時(shí)少犯錯(cuò)；「AI 腔」的消退，意味著生成的郵件、文檔讀起來更貼合真人的閱讀習(xí)慣。

Gemini 3.1 Flash-Lite 則更符合最為關(guān)鍵的第三個(gè)需求。Agent 在后臺(tái)狂奔時(shí)，往往需要并行處理海量的子任務(wù)，對(duì)響應(yīng)速度和 API 成本極度敏感。

Flash-Lite 極快的響應(yīng)速度和白菜價(jià)的成本，加上能靈活調(diào)配算力的「思考等級(jí)」，這種極具彈性的架構(gòu)對(duì)高并發(fā)的自動(dòng)化任務(wù)而言，無疑是久旱逢甘霖。

即便兩款模型的長(zhǎng)期穩(wěn)定性仍需觀察，但大方向已經(jīng)很明確：一個(gè)負(fù)責(zé)讓交互更像人，一個(gè)死磕更快更省錢。在未來人手一只「龍蝦」的情況下，輕量模型將成為更自然、務(wù)實(shí)的選擇。

附上參考地址：

https://openai.com/index/gpt-5-3-instant/

https://gemini.google.com/u/4/app/e0bea96b8f62bd1f

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.