年底了,谷歌又開(kāi)始沖業(yè)績(jī)了。
就在剛剛,Gemini 3 Flash 正式發(fā)布,直接對(duì)標(biāo) OpenAI 和 Anthropic 的旗艦?zāi)P停俜教?hào)稱比 2.5 Pro 速度快 3 倍,價(jià)格砍到 3 Pro 的四分之一,性能還不降反升。
用谷歌自己的話說(shuō),這是「為速度而生的前沿智能」。翻譯一下就是:又快又便宜,腦子還挺在線。
![]()
不過(guò),在實(shí)際體驗(yàn)過(guò)程中,Gemini 3 Flash 的性能表現(xiàn)還是遠(yuǎn)遠(yuǎn)不如 Pro 的,以至于讓我產(chǎn)生一種「貨不對(duì)板」的落差感,也歡迎更多朋友分享你的體驗(yàn)。
即便如此,谷歌在發(fā)布時(shí)機(jī)的選擇上依然稱得上「快、準(zhǔn)、狠」。
緊隨 Gemini 3 Pro 與 Deep Think 之后上馬 Flash,也是為了完全不給競(jìng)爭(zhēng)對(duì)手喘息的機(jī)會(huì),這也讓我越來(lái)越期待 Sam Altman 的圣誕節(jié)反擊禮物了。
![]()
而從今天起,你將能在 Gemini 產(chǎn)品線里用到三種模型:
Gemini 3 Flash (Fast):主打一個(gè)「快」,適合那些不需要長(zhǎng)鏈條思考、追求效率的對(duì)話場(chǎng)景。
Gemini 3 Flash (Thinking): 具備輕量化模型推理能力,使其能夠在面對(duì)復(fù)雜難題時(shí),通過(guò)模擬人類的思考過(guò)程來(lái)提升準(zhǔn)確率。
Gemini 3 Pro: 性能天花板,它依然是處理極高難度任務(wù)的首選。
倒反天罡!Gemini 3 Flash 跑分超越 Pro
基準(zhǔn)測(cè)試結(jié)果顯示,Gemini 3 Flash 保留了 Pro 級(jí)別的推理能力,但延遲、成本直接降到 Flash 級(jí)別。
具體來(lái)說(shuō),在 GPQA Diamond 這種博士級(jí)推理測(cè)試?yán)铮苣玫?90.4% 的成績(jī),跟那些體積更大的前沿模型打得有來(lái)有回。在 Humanity's Last Exam 這個(gè)變態(tài)難度的測(cè)試中,無(wú)需工具輔助就能拿到 33.7% 的分?jǐn)?shù)。
更夸張的是 MMMU Pro 測(cè)試,Gemini 3 Flash 直接拿下 81.2%,達(dá)到業(yè)界最先進(jìn)水平,跟自家的 3 Pro 表現(xiàn)相當(dāng),屬于是有些倒反天罡了。
![]()
以前大家覺(jué)得「質(zhì)量-成本-速度」三個(gè)維度很難兼顧,要么快但不聰明,要么聰明但卻貴。現(xiàn)在谷歌試圖用 Gemini 3 Flash 證明,只要工程化能力優(yōu)化到位,六邊形戰(zhàn)士是可以存在的。
![]()
數(shù)據(jù)顯示,其 Token 消耗比 2.5 Pro 少了三成,速度快三倍,價(jià)格更是壓到了輸入 0.5 美元/百萬(wàn) Token,輸出 3 美元/百萬(wàn) Token 的地板價(jià)。
![]()
行吧,現(xiàn)在的 AI 新模型不光要卷參數(shù),還要卷性價(jià)比了。
而且它還是個(gè)推理型模型,能根據(jù)任務(wù)復(fù)雜度靈活調(diào)整「思考」時(shí)間。即使在最低的「思考等級(jí)」下,3 Flash 的表現(xiàn)也常常超過(guò)前代模型的「高思考等級(jí)」。這種自適應(yīng)能力在實(shí)際應(yīng)用中特別有價(jià)值,不會(huì)出現(xiàn)「殺雞用牛刀」的資源浪費(fèi)。

對(duì)于開(kāi)發(fā)者來(lái)說(shuō),Gemini 3 Flash 的出現(xiàn),也意味著終于不用在速度和智能之間二選一了。
基準(zhǔn)測(cè)試顯示,Gemini 3 Flash 在 SWE-bench Verified 編碼測(cè)試?yán)锬玫?78% 的高分,不僅吊打 2.5 系列,甚至比自家的 3 Pro 還高。
此外,Gemini 3 Flash 的亮點(diǎn)還在于多模態(tài)能力,它能更快地處理視覺(jué)、音頻等輸入,把「看見(jiàn)、聽(tīng)見(jiàn)、理解」串成一條相對(duì)順滑的鏈路,適合需要即時(shí)反饋的交互場(chǎng)景。
具體來(lái)說(shuō),它可以分析高爾夫揮桿視頻并在短時(shí)間內(nèi)給出改進(jìn)建議;你畫(huà)草圖時(shí),它也能實(shí)時(shí)識(shí)別并預(yù)測(cè)你的意圖。再疊加代碼執(zhí)行能力,使它不僅能理解圖片內(nèi)容,還能在工具鏈支持下對(duì)圖片進(jìn)行處理與操作。

Gemini 3 Flash 快是真的快,但 ……
谷歌官方展示了幾個(gè)很有意思的應(yīng)用場(chǎng)景。
比如在「投球解謎」類游戲中,F(xiàn)lash 可以做實(shí)時(shí)的輔助推理,給出可行解甚至更優(yōu)解;

在交互 UI 設(shè)計(jì)流程里,它能生成加載動(dòng)畫(huà),并配合快速迭代做 A/B 方案對(duì)比;
你提供一張圖片,它也能完成基礎(chǔ)識(shí)別,再結(jié)合上下文生成交互式注釋。這些 Demo 的共同點(diǎn)是:強(qiáng)調(diào)實(shí)時(shí)性、強(qiáng)調(diào)迭代效率、強(qiáng)調(diào)能跑起來(lái)。
我也用 Gemini 3 Flash 跑了幾個(gè)案例。
不得不說(shuō),對(duì)比 Gemini 3 Pro,前者的響應(yīng)速度確實(shí)是極快的,但效果嘛,則比較中規(guī)中矩,對(duì)比 Gemini 3 Pro 則明顯犧牲了視覺(jué)與交互細(xì)節(jié)的質(zhì)量。

以復(fù)刻 macOS 界面為例,該模型的表現(xiàn)略顯乏力:底部 Dock 欄出現(xiàn)了明顯的圖標(biāo)缺失,且在交互細(xì)節(jié)的精致度上,也明顯遜于 Gemini 3 Pro 的生成效果。
這種差距在「復(fù)古擬物風(fēng)相機(jī)應(yīng)用」的設(shè)計(jì)任務(wù)中尤為突出。從生成的單頁(yè)應(yīng)用結(jié)果來(lái)看,其視覺(jué)呈現(xiàn)與預(yù)期目標(biāo)仍有較大差距。
![]()
此外,在嘗試打造「星球信號(hào)」網(wǎng)頁(yè)時(shí),有一定程度的交互細(xì)節(jié),但整體產(chǎn)出的頁(yè)面效果還是略顯粗糙,缺乏設(shè)計(jì)的細(xì)膩感。

兩條腿走路的谷歌:一邊卷死對(duì)手,一邊把 AI 塞進(jìn)幾十億人的生活
谷歌這次還把 Gemini 3 Flash 塞進(jìn)了搜索的 AI 模式(國(guó)內(nèi)暫不可用)里,逐步向全球開(kāi)放。
相比之前的版本,它更能理解復(fù)雜問(wèn)題中的細(xì)節(jié),從全網(wǎng)抓取實(shí)時(shí)信息和有用鏈接,輸出視覺(jué)上更清晰、有條理的綜合答案。

與此同時(shí),Gemini 3 Flash 正在成為 Google「全家桶」的默認(rèn)底座。Gemini 應(yīng)用、搜索 AI 模式、Vertex AI、Google AI Studio、Antigravity、Gemini CLI,全線上新。
全球用戶都能免費(fèi)體驗(yàn),企業(yè)用戶則可以通過(guò) Vertex AI 和 Gemini Enterprise 來(lái)調(diào)用。
最后再?gòu)?qiáng)調(diào)一遍價(jià)格,因?yàn)檫@個(gè)真的太香了。
輸入每百萬(wàn) Token 0.5 美元,輸出每百萬(wàn) Token 3 美元,音頻輸入每百萬(wàn) token 1 美元。試用價(jià)格不到 Gemini 3 Pro 的四分之一。
![]()
如果用上下文緩存,重復(fù) Token 的成本還能再省 90%。用 Batch API 異步處理的話,又能再省 50%,同時(shí)還能提升調(diào)用上限。對(duì)于同步或接近實(shí)時(shí)的場(chǎng)景,付費(fèi) API 用戶可以獲得面向生產(chǎn)環(huán)境的高調(diào)用速率。
價(jià)格打到這個(gè)程度、性能又不算差,OpenAI 和 Anthropic 當(dāng)然很難睡踏實(shí)。
但話得說(shuō)嚴(yán)謹(jǐn)一點(diǎn),當(dāng)宣傳口徑把 Flash 包裝成「幾乎 Pro 級(jí)」的時(shí)候,用戶自然會(huì)用 Pro 的標(biāo)準(zhǔn)去驗(yàn)貨;而一旦遇到復(fù)雜推理、長(zhǎng)鏈路任務(wù)、穩(wěn)定性要求更高的場(chǎng)景,F(xiàn)lash 的短板就會(huì)更明顯。
谷歌最大的底牌還是流量。
搜索、YouTube、Gmail、Google Maps,每天數(shù)十億用戶在使用這些產(chǎn)品。把 3 Flash嵌入到這些高頻應(yīng)用中,用戶也就在最熟悉的場(chǎng)景里,無(wú)感地、自然地被谷歌 AI 服務(wù)包圍。
這種打法 OpenAI 和 Anthropic 是學(xué)不來(lái)的。
![]()
一方面,谷歌財(cái)大氣粗,確實(shí)有資本燒錢(qián)搶市場(chǎng);另一方面,谷歌在 TPU、數(shù)據(jù)中心、分布式訓(xùn)練等基礎(chǔ)設(shè)施和工程優(yōu)化上的積累,確實(shí)能幫他們把成本壓下來(lái)。
一邊做 toB 的 API 服務(wù),一邊直接把 AI 能力塞進(jìn)自家產(chǎn)品里,覆蓋海量普通用戶。當(dāng)用戶習(xí)慣了在搜索里用 AI 模式,習(xí)慣了在 Gemini 應(yīng)用里對(duì)話,自然就會(huì)對(duì)谷歌的 AI 產(chǎn)生依賴。這才是谷歌真正的陽(yáng)謀。
當(dāng)然,這種巨頭間的內(nèi)卷對(duì)行業(yè)是殘酷的,但對(duì)用戶絕對(duì)是好事。模型更強(qiáng)、價(jià)格更低,開(kāi)發(fā)者能低成本創(chuàng)新,普通人能享受更智能的服務(wù),這大概是這場(chǎng) AI 軍備競(jìng)賽中,為數(shù)不多的確定性紅利。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡(jiǎn)歷投遞郵箱hr@ifanr.com
?? 郵件標(biāo)題「姓名+崗位名稱」(請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.