年底了,谷歌又開始沖業(yè)績了。
就在剛剛,Gemini 3 Flash 正式發(fā)布,直接對標 OpenAI 和 Anthropic 的旗艦模型,官方號稱比 2.5 Pro 速度快 3 倍,價格砍到 3 Pro 的四分之一,性能還不降反升。
用谷歌自己的話說,這是「為速度而生的前沿智能」。翻譯一下就是:又快又便宜,腦子還挺在線。
![]()
不過,在實際體驗過程中,Gemini 3 Flash 的性能表現(xiàn)還是遠遠不如 Pro 的,以至于讓我產(chǎn)生一種「貨不對板」的落差感,也歡迎更多朋友分享你的體驗。
即便如此,谷歌在發(fā)布時機的選擇上依然稱得上「快、準、狠」。
緊隨 Gemini 3 Pro 與 Deep Think 之后上馬 Flash,也是為了完全不給競爭對手喘息的機會,這也讓我越來越期待 Sam Altman 的圣誕節(jié)反擊禮物了。
![]()
而從今天起,你將能在 Gemini 產(chǎn)品線里用到三種模型:
Gemini 3 Flash (Fast):主打一個「快」,適合那些不需要長鏈條思考、追求效率的對話場景。
Gemini 3 Flash (Thinking): 具備輕量化模型推理能力,使其能夠在面對復雜難題時,通過模擬人類的思考過程來提升準確率。
Gemini 3 Pro: 性能天花板,它依然是處理極高難度任務(wù)的首選。
倒反天罡!Gemini 3 Flash 跑分超越 Pro
基準測試結(jié)果顯示,Gemini 3 Flash 保留了 Pro 級別的推理能力,但延遲、成本直接降到 Flash 級別。
具體來說,在 GPQA Diamond 這種博士級推理測試里,它能拿到 90.4% 的成績,跟那些體積更大的前沿模型打得有來有回。在 Humanity's Last Exam 這個變態(tài)難度的測試中,無需工具輔助就能拿到 33.7% 的分數(shù)。
更夸張的是 MMMU Pro 測試,Gemini 3 Flash 直接拿下 81.2%,達到業(yè)界最先進水平,跟自家的 3 Pro 表現(xiàn)相當,屬于是有些倒反天罡了。
![]()
以前大家覺得「質(zhì)量-成本-速度」三個維度很難兼顧,要么快但不聰明,要么聰明但卻貴。現(xiàn)在谷歌試圖用 Gemini 3 Flash 證明,只要工程化能力優(yōu)化到位,六邊形戰(zhàn)士是可以存在的。
![]()
數(shù)據(jù)顯示,其 Token 消耗比 2.5 Pro 少了三成,速度快三倍,價格更是壓到了輸入 0.5 美元/百萬 Token,輸出 3 美元/百萬 Token 的地板價。
![]()
行吧,現(xiàn)在的 AI 新模型不光要卷參數(shù),還要卷性價比了。
而且它還是個推理型模型,能根據(jù)任務(wù)復雜度靈活調(diào)整「思考」時間。即使在最低的「思考等級」下,3 Flash 的表現(xiàn)也常常超過前代模型的「高思考等級」。這種自適應(yīng)能力在實際應(yīng)用中特別有價值,不會出現(xiàn)「殺雞用牛刀」的資源浪費。

對于開發(fā)者來說,Gemini 3 Flash 的出現(xiàn),也意味著終于不用在速度和智能之間二選一了。
基準測試顯示,Gemini 3 Flash 在 SWE-bench Verified 編碼測試里拿到 78% 的高分,不僅吊打 2.5 系列,甚至比自家的 3 Pro 還高。
此外,Gemini 3 Flash 的亮點還在于多模態(tài)能力,它能更快地處理視覺、音頻等輸入,把「看見、聽見、理解」串成一條相對順滑的鏈路,適合需要即時反饋的交互場景。
具體來說,它可以分析高爾夫揮桿視頻并在短時間內(nèi)給出改進建議;你畫草圖時,它也能實時識別并預測你的意圖。再疊加代碼執(zhí)行能力,使它不僅能理解圖片內(nèi)容,還能在工具鏈支持下對圖片進行處理與操作。

Gemini 3 Flash 快是真的快,但 ……
谷歌官方展示了幾個很有意思的應(yīng)用場景。
比如在「投球解謎」類游戲中,F(xiàn)lash 可以做實時的輔助推理,給出可行解甚至更優(yōu)解;

在交互 UI 設(shè)計流程里,它能生成加載動畫,并配合快速迭代做 A/B 方案對比;
你提供一張圖片,它也能完成基礎(chǔ)識別,再結(jié)合上下文生成交互式注釋。這些 Demo 的共同點是:強調(diào)實時性、強調(diào)迭代效率、強調(diào)能跑起來。
我也用 Gemini 3 Flash 跑了幾個案例。
不得不說,對比 Gemini 3 Pro,前者的響應(yīng)速度確實是極快的,但效果嘛,則比較中規(guī)中矩,對比 Gemini 3 Pro 則明顯犧牲了視覺與交互細節(jié)的質(zhì)量。

以復刻 macOS 界面為例,該模型的表現(xiàn)略顯乏力:底部 Dock 欄出現(xiàn)了明顯的圖標缺失,且在交互細節(jié)的精致度上,也明顯遜于 Gemini 3 Pro 的生成效果。
這種差距在「復古擬物風相機應(yīng)用」的設(shè)計任務(wù)中尤為突出。從生成的單頁應(yīng)用結(jié)果來看,其視覺呈現(xiàn)與預期目標仍有較大差距。
![]()
此外,在嘗試打造「星球信號」網(wǎng)頁時,有一定程度的交互細節(jié),但整體產(chǎn)出的頁面效果還是略顯粗糙,缺乏設(shè)計的細膩感。

兩條腿走路的谷歌:一邊卷死對手,一邊把 AI 塞進幾十億人的生活
谷歌這次還把 Gemini 3 Flash 塞進了搜索的 AI 模式(國內(nèi)暫不可用)里,逐步向全球開放。
相比之前的版本,它更能理解復雜問題中的細節(jié),從全網(wǎng)抓取實時信息和有用鏈接,輸出視覺上更清晰、有條理的綜合答案。

與此同時,Gemini 3 Flash 正在成為 Google「全家桶」的默認底座。Gemini 應(yīng)用、搜索 AI 模式、Vertex AI、Google AI Studio、Antigravity、Gemini CLI,全線上新。
全球用戶都能免費體驗,企業(yè)用戶則可以通過 Vertex AI 和 Gemini Enterprise 來調(diào)用。
最后再強調(diào)一遍價格,因為這個真的太香了。
輸入每百萬 Token 0.5 美元,輸出每百萬 Token 3 美元,音頻輸入每百萬 token 1 美元。試用價格不到 Gemini 3 Pro 的四分之一。
![]()
如果用上下文緩存,重復 Token 的成本還能再省 90%。用 Batch API 異步處理的話,又能再省 50%,同時還能提升調(diào)用上限。對于同步或接近實時的場景,付費 API 用戶可以獲得面向生產(chǎn)環(huán)境的高調(diào)用速率。
價格打到這個程度、性能又不算差,OpenAI 和 Anthropic 當然很難睡踏實。
但話得說嚴謹一點,當宣傳口徑把 Flash 包裝成「幾乎 Pro 級」的時候,用戶自然會用 Pro 的標準去驗貨;而一旦遇到復雜推理、長鏈路任務(wù)、穩(wěn)定性要求更高的場景,F(xiàn)lash 的短板就會更明顯。
谷歌最大的底牌還是流量。
搜索、YouTube、Gmail、Google Maps,每天數(shù)十億用戶在使用這些產(chǎn)品。把 3 Flash嵌入到這些高頻應(yīng)用中,用戶也就在最熟悉的場景里,無感地、自然地被谷歌 AI 服務(wù)包圍。
這種打法 OpenAI 和 Anthropic 是學不來的。
![]()
一方面,谷歌財大氣粗,確實有資本燒錢搶市場;另一方面,谷歌在 TPU、數(shù)據(jù)中心、分布式訓練等基礎(chǔ)設(shè)施和工程優(yōu)化上的積累,確實能幫他們把成本壓下來。
一邊做 toB 的 API 服務(wù),一邊直接把 AI 能力塞進自家產(chǎn)品里,覆蓋海量普通用戶。當用戶習慣了在搜索里用 AI 模式,習慣了在 Gemini 應(yīng)用里對話,自然就會對谷歌的 AI 產(chǎn)生依賴。這才是谷歌真正的陽謀。
當然,這種巨頭間的內(nèi)卷對行業(yè)是殘酷的,但對用戶絕對是好事。模型更強、價格更低,開發(fā)者能低成本創(chuàng)新,普通人能享受更智能的服務(wù),這大概是這場 AI 軍備競賽中,為數(shù)不多的確定性紅利。
歡迎加入 APPSO AI 社群,一起暢聊 AI 產(chǎn)品,獲取,解鎖更多 AI 新知
我們正在招募伙伴
簡歷投遞郵箱hr@ifanr.com
?? 郵件標題「姓名+崗位名稱」(請隨簡歷附上項目/作品或相關(guān)鏈接)
![]()
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.