Gemini 3 Flash閃電來襲：智力竟反超Pro！速度快3倍，全球免費(fèi)

2025-12-18 03:47:20　來源: 新智元

北京舉報(bào)

分享至

新智元報(bào)道

編輯：定慧好困

【新智元導(dǎo)讀】谷歌在2025年底甩出「王炸」：Gemini 3 Flash！這款模型徹底打破了「快就一定笨、強(qiáng)就一定貴」的定律，以3倍于前代的速度實(shí)現(xiàn)「零延遲」響應(yīng)，甚至在編程和邏輯推理上反超了Pro級大哥。

Gemini 3 Flash正式發(fā)布！

至此，Gemini 3家族成為完全體：Flash、Pro和Deep Think。

Flash模型已經(jīng)全面上線Gemini APP、AI Studio、Google Antigravity和Gemini CLI，用戶打開Gemini就是默認(rèn)Gemini 3 Flash版本，直接免費(fèi)使用！

左右滑動查看

如果說之前的AI模型是在模擬人類的思考，那么Gemini 3 Flash就是在模擬人類的「直覺」。

3倍于Gemini 2.5 Pro的速度，卻擁有超越Pro級的推理能力。

這不僅僅是一次升級，這是對現(xiàn)有AI交互體驗(yàn)的一次降維打擊！

實(shí)測Gemini 3 Flash之后，只有一個(gè)感受：快！簡直太快了。

速度快到「沒有加載條」，這種體驗(yàn)簡直是「零延遲」的魔法，剛敲完回車，答案就已經(jīng)在屏幕上渲染完畢。

它不僅快得離譜，更可怕的是，它的智力竟然在某些領(lǐng)域直接「背刺」了自家的Pro大哥。

通常「Flash」意味著「降智」，但這次不同。

Gemini 3 Flash在某些復(fù)雜的Agentic Coding（智能體編程）任務(wù)上，甚至直接超越了Gemini 3 Pro！

比如Flash在MMMU Pro（多模態(tài)理解和推理）上取得了81.2%，反超Gemini 3 Pro的81.0%，

要知道從API成本來看，相比Gemini 3 Pro，F(xiàn)lash成本直接砍到了四分之一。

更便宜，但是性能反而不降反升！

估計(jì)今夜谷歌又讓整個(gè)大模型行業(yè)「集體失眠」了。

拳打Claude，腳踢GPT

在Artificial Analysis的最新評估中，3 Flash相比上一代2.5 Flash直接來一次質(zhì)變飛躍，這應(yīng)該是2025年同個(gè)系列模型的最大跨度升級！

很難想象，一個(gè)Flash輕量級模型能夠超過Cladue的旗艦?zāi)Ｐ蚈pus 4.5。（估計(jì)相比OpenAI，Anthropic對一個(gè)坐不住了）。

其他指標(biāo)，F(xiàn)lash也達(dá)到了最頂級模型的水平。

Flash在GPQA Diamond（90.4%）和Humanity’s Last Exam（無工具條件下33.7%）等博士級推理和知識基準(zhǔn)測試中展現(xiàn)了前沿性能，足以媲美更大的前沿模型，并且在多項(xiàng)基準(zhǔn)測試中顯著優(yōu)于前代旗艦Gemini 2.5 Pro。

在ARC-AGI Semi-Private Eval上，Gemini 3 Flash的表現(xiàn)同樣極具競爭力，且成本大幅低于其他前沿模型。

ARC-AGI-1: 84.7%, $0.17/任務(wù)
ARC-AGI-2: 33.6%, $0.23/任務(wù)

在LMArena上，Gemini 3 Flash的文本能力直接躍升至第3！

Gemini 3 Flash證明了速度和規(guī)模并不一定要以犧牲智能為代價(jià)。

除了前沿級的推理和多模態(tài)能力外，Gemini 3 Flash專為高效而生，推動了質(zhì)量與成本、速度之間的帕累托前沿（Pareto frontier）。

在進(jìn)行最高層級的思維處理時(shí)，Gemini 3 Flash能夠調(diào)節(jié)其「思考量」。

對于更復(fù)雜的用例，它可能會思考更久，但在典型流量下，它平均比2.5 Pro少消耗30%的Token，卻能以更高的性能準(zhǔn)確完成日常任務(wù)。

Gemini 3 Flash的核心優(yōu)勢在于其原生速度！

它的表現(xiàn)優(yōu)于2.5 Pro，但速度快了3倍（基于Artificial Analysis基準(zhǔn)測試），而成本卻只是零頭。

Gemini 3 Flash的定價(jià)為每百萬輸入Token 0.50美元，每百萬輸出Token 3美元（音頻輸入保持在每百萬輸入Token 1美元）。

左右滑動查看

開發(fā)者新寵：極速與深度的完美平衡

對于開發(fā)者來說，模型的響應(yīng)速度是第一位。

Gemini 3 Flash專為迭代開發(fā)打造，提供Gemini 3 Pro級的編碼性能和低延遲——它能夠在高頻工作流中快速推理并解決任務(wù)。

在評估編碼智能體能力的SWE-bench Verified基準(zhǔn)測試中，Gemini 3 Flash獲得了78%的分?jǐn)?shù)，不僅超越了2.5系列，還超過了Gemini 3 Pro。

可以說，它在智能體編碼、生產(chǎn)級系統(tǒng)和響應(yīng)式交互應(yīng)用之間實(shí)現(xiàn)了理想的平衡。

與此同時(shí)，Gemini 3 Flash在推理、工具使用和多模態(tài)能力方面的強(qiáng)勁表現(xiàn)，非常適合希望進(jìn)行更復(fù)雜的視頻分析、數(shù)據(jù)提取和視覺問答的開發(fā)者。

這意味著它可以賦能那些景既需要極速響應(yīng)，也需要深度推理的更智能的應(yīng)用程序。

比如，Gemini 3 Flash能在一款手部追蹤的「彈球益智游戲」中實(shí)現(xiàn)多模態(tài)推理，提供近乎實(shí)時(shí)的AI輔助。

或者，近乎實(shí)時(shí)地構(gòu)建并A/B測試新的加載動畫設(shè)計(jì)，幫助簡化了從設(shè)計(jì)到代碼的流程。

以及，根據(jù)非常簡單的一段提示詞，編寫出三種獨(dú)特的設(shè)計(jì)變體。

甚至，還能通過多模態(tài)推理分析圖像，并生成帶有上下文UI覆蓋層的字幕，來將靜態(tài)圖像轉(zhuǎn)化為互動體驗(yàn)。

全民AI時(shí)代：搜你想搜，做你想做

Gemini 3 Flash現(xiàn)已成為Gemini App中的默認(rèn)模型，取代了2.5 Flash。

這意味著全球所有的Gemini用戶都將免費(fèi)獲得Gemini 3的體驗(yàn)，讓處理日常任務(wù)的能力得到重大升級。

得益于Gemini 3 Flash驚人的多模態(tài)推理能力，你可以用它來幫助你更快地看、聽和理解任何類型的信息。

例如，你可以讓Gemini理解你的視頻和圖像，并在幾秒鐘內(nèi)將這些內(nèi)容轉(zhuǎn)化為有用且可執(zhí)行的計(jì)劃。

比如，它可以通過分析短視頻的內(nèi)容，來為你制定改善高爾夫揮桿動作的計(jì)劃。

上傳一段音頻錄音，Gemini 3 Flash會識別你的知識盲區(qū)，創(chuàng)建一個(gè)定制測驗(yàn)，并針對答案給出詳細(xì)解釋。

此外，針對速度進(jìn)行優(yōu)化了的Gemini 3 Flash，還能在你畫草圖時(shí)就猜出你在畫什么。

或者，即便沒有任何編程知識，你也可以僅用語音從頭開始快速構(gòu)建有趣、實(shí)用的App。

只需隨時(shí)隨地口述給Gemini，它就能在幾分鐘內(nèi)將你原本非結(jié)構(gòu)化的想法轉(zhuǎn)化為功能完善的App。

Gemini 3 Flash也開始作為搜索中AI模式的默認(rèn)模型推出，面向全球用戶開放。

建立在Gemini 3 Pro的推理能力之上，采用Gemini 3 Flash的AI模式在解析問題的細(xì)微差別方面更加強(qiáng)大。

它會考量你查詢的方方面面，提供深思熟慮、全面且視覺上易于消化的回答——并從全網(wǎng)提取實(shí)時(shí)的本地信息和有用的鏈接。

結(jié)果有效地結(jié)合了研究與即時(shí)行動：你能在獲得特定推薦的同時(shí)得到智能梳理的內(nèi)容細(xì)分——一切都以搜索的速度呈現(xiàn)。

當(dāng)處理涉及多重考量的復(fù)雜目標(biāo)時(shí)，這一點(diǎn)尤為出色，比如試圖規(guī)劃一次說走就走的旅行，或快速學(xué)習(xí)復(fù)雜的教育概念。

收官2025：留給對手的時(shí)間不多了

Gemini 3 Flash的發(fā)布傳遞了一個(gè)清晰的信號：高性能AI不再昂貴，也不再遲鈍。

Gemini 3 Flash的邏輯很簡單：比我聰明的沒我快，比我快的沒我聰明，關(guān)鍵是它們都比我貴。

谷歌正在用極其激進(jìn)的策略——頂級推理+極致速度+地板價(jià)格，試圖在2025年底收割戰(zhàn)場。

對于普通用戶來說，Gemini App里的對話將變得極其流暢；對于開發(fā)者來說，構(gòu)建實(shí)時(shí)、復(fù)雜的AI應(yīng)用不再是燒錢的夢想，因?yàn)锳PI真的太便宜了。

2025年是充滿挑戰(zhàn)的一年，AI真正邁入了一個(gè)新時(shí)代，模型不再只是演示品，而是被大規(guī)模使用的日用品。

谷歌這一年并未追逐單一旗艦?zāi)Ｐ停麄兺瞥隽艘幌盗挟a(chǎn)品陣容，而且每個(gè)模型都特別能打：

追求速度，選Flash
追求深度，選Pro
追求推理，選Deep Think

開啟「智能平權(quán)」時(shí)代

Gemini 3 Flash發(fā)布最大的顛覆之處還是在Agentic Coding等任務(wù)上超過Gemini 3 Pro。

過去AI圈的邏輯是「大就是好」，但Gemini 3 Flash的意義在于它開啟了「智能平權(quán)」時(shí)代：

徹底降維打擊低成本模型市場：
在3 Flash出現(xiàn)之前，開發(fā)者在「便宜但笨」（如 GPT-4o-mini, 2.5 Flash）和「聰明但貴且慢」（如Pro）之間痛苦抉擇。Gemini 3 Flash把Pro級的智力拉到了Flash級的價(jià)格和速度，直接封死了競品低端模型的生存空間。
為智能體時(shí)代鋪路：
智能體工作的核心是「循環(huán)（Loop）」——思考、行動、觀察、再思考。如果模型太慢或太貴，這個(gè)循環(huán)就無法跑通。Flash極高的Token/秒/美元效率，是智能體能大規(guī)模商用的唯一基石。
構(gòu)建「延遲感」護(hù)城河：
谷歌意識到，在搜索和交互中，100ms的延遲差異比5%的準(zhǔn)確度差異更能決定用戶留存。Flash的「瞬發(fā)」感讓它在AI搜索模式下?lián)碛辛祟愃苽鹘y(tǒng)搜索的爽快感。

現(xiàn)在的壓力，全部來到了OpenAI這邊。

奧特曼，還坐得住嗎？是不是又要拉響紅色警報(bào)了～

彩蛋

目前來看，AI卷到Gemini 3 Flash這個(gè)程度感覺已經(jīng)到頭了。

我們試著用Gemin 3 Flash「套磁」了一下Gemini 4會在什么時(shí)候推出，能夠達(dá)到什么水平？

還是有驚喜的。

Gemini 4可能在2026年Google I/O大會推出（不過按照今年2.5的規(guī)律，大概率會是3.5）。

而3 Flash給的另一點(diǎn)則更加有意義，如果說Gemini 3是推理和速度的完美極致，那么下一代模型將聚焦于：

智能體的主動性
真正理解物理世界
長程記憶
以及超越人類的科學(xué)發(fā)現(xiàn)

真是太期待明年的到來了！

參考資料：

https://blog.google/products/gemini/gemini-3-flash/

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.