![]()
智東西
編譯 陳駿達(dá)
編輯 李水青
智東西12月18日報(bào)道,昨晚,谷歌發(fā)布了Gemini 3 Flash,旨在用更低的成本提供前沿的智能水平。
具體來看,它輸出每百萬token的價(jià)格僅為Claude Sonnet 4.5的20%、GPT-5.2的21%,卻能在基準(zhǔn)測試上達(dá)到甚至超越這些旗艦級模型的水平。
即便是和Gemini 3 Pro相比,Gemini 3 Flash也極具性價(jià)比。Flash的價(jià)格僅為Pro的25%,卻在MMMU-Pro、SWE-bench Verified這些核心基準(zhǔn)測試上,超過了Pro版本的模型。
![]()
此前發(fā)布的Gemini 3系列模型在復(fù)雜推理、多模態(tài)和視覺理解、智能體及Vibe Coding任務(wù)方面都展現(xiàn)出優(yōu)勢,Gemini 3 Flash保留了這一基礎(chǔ),將Gemini 3 Pro級別的推理能力與Flash級別的延遲、效率和成本相結(jié)合。
谷歌首席科學(xué)家Jeff Dean稱,Gemini 3 Flash不僅比2.5 Pro質(zhì)量更高,速度也快3倍,而且價(jià)格僅為后者的幾分之一。以下是并排演示:
(視頻)
Gemini 3 Flash目前已經(jīng)全面開放,開發(fā)者可通過Google AI Studio中的Gemini API、Gemini CLI以及智能體開發(fā)平臺Google Antigravity使用。而普通用戶能通過Gemini應(yīng)用程序和谷歌搜索中的AI模式使用。
一、專為迭代式開發(fā)打造,還幫你用“嘴編程”
Gemini 3 Flash究竟能做什么?谷歌稱,這是一款專為迭代式開發(fā)打造的模型,能夠以低延遲提供接近Gemini 3 Pro級別的編程性能。
谷歌分享了多個(gè)案例。比如,Gemini 3 Flash可以在一個(gè)手部追蹤的“彈球解謎游戲”中實(shí)現(xiàn)多模態(tài)推理,提供近乎實(shí)時(shí)的AI輔助。
它還可以近乎實(shí)時(shí)地構(gòu)建和A/B測試新的加載動畫設(shè)計(jì),簡化了從設(shè)計(jì)到代碼的流程。
使用多模態(tài)推理,Gemini 3 Flash可快速分析帶有上下文UI覆蓋層的圖像,并生成字幕,最終將靜態(tài)圖像轉(zhuǎn)化為交互式體驗(yàn)。
憑借在推理、工具使用和多模態(tài)能力方面的出色表現(xiàn),Gemini 3 Flash 特別適合希望進(jìn)行更復(fù)雜視頻分析、數(shù)據(jù)提取和視覺問答的開發(fā)者。
Gemini 3 Flash的多模態(tài)推理能力可用于幫助用戶看、聽和理解任何類型的信息。
用戶可以要求Gemini理解視頻和圖像,并在幾秒鐘內(nèi)將該內(nèi)容轉(zhuǎn)化為有幫助且可操作的計(jì)劃。
Gemini應(yīng)用程序中的Gemini 3 Flash可以分析短視頻內(nèi)容并給你一個(gè)計(jì)劃,比如如何改進(jìn)你的高爾夫揮桿。
由于Gemini 3 Flash針對速度進(jìn)行了優(yōu)化,它可以在你仍在繪圖時(shí)就“看到”并猜出你畫的是什么。
你可以上傳一段錄音,Gemini 3 Flash將識別你的知識盲點(diǎn),創(chuàng)建一個(gè)自定義測驗(yàn),并對答案給出詳細(xì)解釋。
或者,也可以嘗試“用嘴編程”,僅用語音輸入從零開始構(gòu)建有趣、有用的應(yīng)用程序。Gemini 3 Flash可以在幾分鐘內(nèi)將非結(jié)構(gòu)化的想法轉(zhuǎn)化為一個(gè)功能正常的應(yīng)用程序。
二、多領(lǐng)域性能超越Pro級模型,可自動調(diào)節(jié)思考量
Gemini 3 Flash在基準(zhǔn)測試上表現(xiàn)如何?它在GPQA Diamond(90.4%)和Humanity’s Last Exam(不使用工具時(shí)為33.7%)等博士級推理和知識基準(zhǔn)測試中,可與更大的前沿模型相媲美,并且在多項(xiàng)基準(zhǔn)測試中顯著優(yōu)于Gemini 2.5 Pro。
在評估編碼智能體能力的基準(zhǔn)測試SWE-bench Verified中,Gemini 3 Flash取得78%的成績,不僅超越了2.5系列,也超過了Gemini 3 Pro。
它還在MMMU Pro上達(dá)到了81.2%的分?jǐn)?shù),與Gemini 3 Pro相當(dāng),實(shí)現(xiàn)了最先進(jìn)的性能。
在下圖中展示的基準(zhǔn)測試中,Gemini 3 Flash在幾乎所有基準(zhǔn)測試上都超過了Claude Sonnet 4.5、Gemini 2.5 Pro等模型。
![]()
除了前沿級別的推理和多模態(tài)能力外,Gemini 3 Flash的構(gòu)建旨在實(shí)現(xiàn)高效率,推動了質(zhì)量與成本、速度之間的帕累托邊界。下方散點(diǎn)圖顯示了多個(gè)語言模型的LMArena Elo得分與每百萬tokens價(jià)格的關(guān)系,其中一條線標(biāo)出了穿過Gemini 3 Pro’、Gemini 3 Flash和Gemini 3 Flash Lite的帕累托邊界。
![]()
在思考預(yù)算拉滿時(shí),Gemini 3 Flash能夠調(diào)節(jié)其思考量。對于更復(fù)雜的用例,它可能會思考更長時(shí)間。但根據(jù)典型流量測量,在以更高的性能準(zhǔn)確完成日常任務(wù)的前提下,它平均比2.5 Pro少使用30%的tokens。
結(jié)語:Gemini 3模型版圖補(bǔ)全,有望深度嵌入日常應(yīng)用
Gemini 3系列模型自發(fā)布以來就廣受好評,不過其高昂的成本讓不少用戶望而卻步。Gemini 3 Flash補(bǔ)全了Gemini 3家族在輕量化、高性價(jià)比方面的布局,回應(yīng)了開發(fā)者在真實(shí)生產(chǎn)環(huán)境里的訴求。
從迭代式開發(fā)、Vibe Coding,到多模態(tài)應(yīng)用、實(shí)時(shí)交互和智能體系統(tǒng),Gemini 3 Flash所展現(xiàn)的更高性價(jià)比,有望幫助智能更廣泛地嵌入日常應(yīng)用和商業(yè)系統(tǒng)之中。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.