谷歌甩出“價(jià)格屠夫”！Gemini 3 Flash超Pro，成本僅1/4，速度如“閃電”

2025-12-19 17:58:57　來源: 智東西

北京舉報(bào)

分享至

智東西
編譯陳駿達(dá)
編輯李水青

智東西12月18日報(bào)道，昨晚，谷歌發(fā)布了Gemini 3 Flash，旨在用更低的成本提供前沿的智能水平。

具體來看，它輸出每百萬token的價(jià)格僅為Claude Sonnet 4.5的20%、GPT-5.2的21%，卻能在基準(zhǔn)測試上達(dá)到甚至超越這些旗艦級模型的水平。

即便是和Gemini 3 Pro相比，Gemini 3 Flash也極具性價(jià)比。Flash的價(jià)格僅為Pro的25%，卻在MMMU-Pro、SWE-bench Verified這些核心基準(zhǔn)測試上，超過了Pro版本的模型。

此前發(fā)布的Gemini 3系列模型在復(fù)雜推理、多模態(tài)和視覺理解、智能體及Vibe Coding任務(wù)方面都展現(xiàn)出優(yōu)勢，Gemini 3 Flash保留了這一基礎(chǔ)，將Gemini 3 Pro級別的推理能力與Flash級別的延遲、效率和成本相結(jié)合。

谷歌首席科學(xué)家Jeff Dean稱，Gemini 3 Flash不僅比2.5 Pro質(zhì)量更高，速度也快3倍，而且價(jià)格僅為后者的幾分之一。以下是并排演示：

（視頻）

Gemini 3 Flash目前已經(jīng)全面開放，開發(fā)者可通過Google AI Studio中的Gemini API、Gemini CLI以及智能體開發(fā)平臺Google Antigravity使用。而普通用戶能通過Gemini應(yīng)用程序和谷歌搜索中的AI模式使用。

一、專為迭代式開發(fā)打造，還幫你用“嘴編程”

Gemini 3 Flash究竟能做什么？谷歌稱，這是一款專為迭代式開發(fā)打造的模型，能夠以低延遲提供接近Gemini 3 Pro級別的編程性能。

谷歌分享了多個(gè)案例。比如，Gemini 3 Flash可以在一個(gè)手部追蹤的“彈球解謎游戲”中實(shí)現(xiàn)多模態(tài)推理，提供近乎實(shí)時(shí)的AI輔助。

它還可以近乎實(shí)時(shí)地構(gòu)建和A/B測試新的加載動畫設(shè)計(jì)，簡化了從設(shè)計(jì)到代碼的流程。

使用多模態(tài)推理，Gemini 3 Flash可快速分析帶有上下文UI覆蓋層的圖像，并生成字幕，最終將靜態(tài)圖像轉(zhuǎn)化為交互式體驗(yàn)。

憑借在推理、工具使用和多模態(tài)能力方面的出色表現(xiàn)，Gemini 3 Flash 特別適合希望進(jìn)行更復(fù)雜視頻分析、數(shù)據(jù)提取和視覺問答的開發(fā)者。

Gemini 3 Flash的多模態(tài)推理能力可用于幫助用戶看、聽和理解任何類型的信息。

用戶可以要求Gemini理解視頻和圖像，并在幾秒鐘內(nèi)將該內(nèi)容轉(zhuǎn)化為有幫助且可操作的計(jì)劃。

Gemini應(yīng)用程序中的Gemini 3 Flash可以分析短視頻內(nèi)容并給你一個(gè)計(jì)劃，比如如何改進(jìn)你的高爾夫揮桿。

由于Gemini 3 Flash針對速度進(jìn)行了優(yōu)化，它可以在你仍在繪圖時(shí)就“看到”并猜出你畫的是什么。

你可以上傳一段錄音，Gemini 3 Flash將識別你的知識盲點(diǎn)，創(chuàng)建一個(gè)自定義測驗(yàn)，并對答案給出詳細(xì)解釋。

或者，也可以嘗試“用嘴編程”，僅用語音輸入從零開始構(gòu)建有趣、有用的應(yīng)用程序。Gemini 3 Flash可以在幾分鐘內(nèi)將非結(jié)構(gòu)化的想法轉(zhuǎn)化為一個(gè)功能正常的應(yīng)用程序。

二、多領(lǐng)域性能超越Pro級模型，可自動調(diào)節(jié)思考量

Gemini 3 Flash在基準(zhǔn)測試上表現(xiàn)如何？它在GPQA Diamond（90.4%）和Humanity’s Last Exam（不使用工具時(shí)為33.7%）等博士級推理和知識基準(zhǔn)測試中，可與更大的前沿模型相媲美，并且在多項(xiàng)基準(zhǔn)測試中顯著優(yōu)于Gemini 2.5 Pro。

在評估編碼智能體能力的基準(zhǔn)測試SWE-bench Verified中，Gemini 3 Flash取得78%的成績，不僅超越了2.5系列，也超過了Gemini 3 Pro。

它還在MMMU Pro上達(dá)到了81.2%的分?jǐn)?shù)，與Gemini 3 Pro相當(dāng)，實(shí)現(xiàn)了最先進(jìn)的性能。

在下圖中展示的基準(zhǔn)測試中，Gemini 3 Flash在幾乎所有基準(zhǔn)測試上都超過了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。

除了前沿級別的推理和多模態(tài)能力外，Gemini 3 Flash的構(gòu)建旨在實(shí)現(xiàn)高效率，推動了質(zhì)量與成本、速度之間的帕累托邊界。下方散點(diǎn)圖顯示了多個(gè)語言模型的LMArena Elo得分與每百萬tokens價(jià)格的關(guān)系，其中一條線標(biāo)出了穿過Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托邊界。

在思考預(yù)算拉滿時(shí)，Gemini 3 Flash能夠調(diào)節(jié)其思考量。對于更復(fù)雜的用例，它可能會思考更長時(shí)間。但根據(jù)典型流量測量，在以更高的性能準(zhǔn)確完成日常任務(wù)的前提下，它平均比2.5 Pro少使用30%的tokens。

結(jié)語：Gemini 3模型版圖補(bǔ)全，有望深度嵌入日常應(yīng)用

Gemini 3系列模型自發(fā)布以來就廣受好評，不過其高昂的成本讓不少用戶望而卻步。Gemini 3 Flash補(bǔ)全了Gemini 3家族在輕量化、高性價(jià)比方面的布局，回應(yīng)了開發(fā)者在真實(shí)生產(chǎn)環(huán)境里的訴求。

從迭代式開發(fā)、Vibe Coding，到多模態(tài)應(yīng)用、實(shí)時(shí)交互和智能體系統(tǒng)，Gemini 3 Flash所展現(xiàn)的更高性價(jià)比，有望幫助智能更廣泛地嵌入日常應(yīng)用和商業(yè)系統(tǒng)之中。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.