網(wǎng)易首頁(yè) > 網(wǎng)易號(hào) > 正文申請(qǐng)入駐

剛剛，Gemini 3 再次大更新！全球免費(fèi)享 Pro 級(jí)智商，奧特曼又要失眠了

2025-12-18 05:46:11　來(lái)源: AppSo

廣東舉報(bào)

分享至

年底了，谷歌又開(kāi)始沖業(yè)績(jī)了。

就在剛剛，Gemini 3 Flash 正式發(fā)布，直接對(duì)標(biāo) OpenAI 和 Anthropic 的旗艦?zāi)Ｐ停俜教?hào)稱比 2.5 Pro 速度快 3 倍，價(jià)格砍到 3 Pro 的四分之一，性能還不降反升。

用谷歌自己的話說(shuō)，這是「為速度而生的前沿智能」。翻譯一下就是：又快又便宜，腦子還挺在線。

不過(guò)，在實(shí)際體驗(yàn)過(guò)程中，Gemini 3 Flash 的性能表現(xiàn)還是遠(yuǎn)遠(yuǎn)不如 Pro 的，以至于讓我產(chǎn)生一種「貨不對(duì)板」的落差感，也歡迎更多朋友分享你的體驗(yàn)。

即便如此，谷歌在發(fā)布時(shí)機(jī)的選擇上依然稱得上「快、準(zhǔn)、狠」。

緊隨 Gemini 3 Pro 與 Deep Think 之后上馬 Flash，也是為了完全不給競(jìng)爭(zhēng)對(duì)手喘息的機(jī)會(huì)，這也讓我越來(lái)越期待 Sam Altman 的圣誕節(jié)反擊禮物了。

而從今天起，你將能在 Gemini 產(chǎn)品線里用到三種模型：

Gemini 3 Flash (Fast)：主打一個(gè)「快」，適合那些不需要長(zhǎng)鏈條思考、追求效率的對(duì)話場(chǎng)景。

Gemini 3 Flash (Thinking)：具備輕量化模型推理能力，使其能夠在面對(duì)復(fù)雜難題時(shí)，通過(guò)模擬人類的思考過(guò)程來(lái)提升準(zhǔn)確率。

Gemini 3 Pro：性能天花板，它依然是處理極高難度任務(wù)的首選。

倒反天罡！Gemini 3 Flash 跑分超越 Pro

基準(zhǔn)測(cè)試結(jié)果顯示，Gemini 3 Flash 保留了 Pro 級(jí)別的推理能力，但延遲、成本直接降到 Flash 級(jí)別。

具體來(lái)說(shuō)，在 GPQA Diamond 這種博士級(jí)推理測(cè)試?yán)铮苣玫?90.4% 的成績(jī)，跟那些體積更大的前沿模型打得有來(lái)有回。在 Humanity's Last Exam 這個(gè)變態(tài)難度的測(cè)試中，無(wú)需工具輔助就能拿到 33.7% 的分?jǐn)?shù)。

更夸張的是 MMMU Pro 測(cè)試，Gemini 3 Flash 直接拿下 81.2%，達(dá)到業(yè)界最先進(jìn)水平，跟自家的 3 Pro 表現(xiàn)相當(dāng)，屬于是有些倒反天罡了。

以前大家覺(jué)得「質(zhì)量-成本-速度」三個(gè)維度很難兼顧，要么快但不聰明，要么聰明但卻貴。現(xiàn)在谷歌試圖用 Gemini 3 Flash 證明，只要工程化能力優(yōu)化到位，六邊形戰(zhàn)士是可以存在的。

數(shù)據(jù)顯示，其 Token 消耗比 2.5 Pro 少了三成，速度快三倍，價(jià)格更是壓到了輸入 0.5 美元/百萬(wàn) Token，輸出 3 美元/百萬(wàn) Token 的地板價(jià)。

行吧，現(xiàn)在的 AI 新模型不光要卷參數(shù)，還要卷性價(jià)比了。

而且它還是個(gè)推理型模型，能根據(jù)任務(wù)復(fù)雜度靈活調(diào)整「思考」時(shí)間。即使在最低的「思考等級(jí)」下，3 Flash 的表現(xiàn)也常常超過(guò)前代模型的「高思考等級(jí)」。這種自適應(yīng)能力在實(shí)際應(yīng)用中特別有價(jià)值，不會(huì)出現(xiàn)「殺雞用牛刀」的資源浪費(fèi)。

對(duì)于開(kāi)發(fā)者來(lái)說(shuō)，Gemini 3 Flash 的出現(xiàn)，也意味著終于不用在速度和智能之間二選一了。

基準(zhǔn)測(cè)試顯示，Gemini 3 Flash 在 SWE-bench Verified 編碼測(cè)試?yán)锬玫?78% 的高分，不僅吊打 2.5 系列，甚至比自家的 3 Pro 還高。

此外，Gemini 3 Flash 的亮點(diǎn)還在于多模態(tài)能力，它能更快地處理視覺(jué)、音頻等輸入，把「看見(jiàn)、聽(tīng)見(jiàn)、理解」串成一條相對(duì)順滑的鏈路，適合需要即時(shí)反饋的交互場(chǎng)景。

具體來(lái)說(shuō)，它可以分析高爾夫揮桿視頻并在短時(shí)間內(nèi)給出改進(jìn)建議；你畫(huà)草圖時(shí)，它也能實(shí)時(shí)識(shí)別并預(yù)測(cè)你的意圖。再疊加代碼執(zhí)行能力，使它不僅能理解圖片內(nèi)容，還能在工具鏈支持下對(duì)圖片進(jìn)行處理與操作。

Gemini 3 Flash 快是真的快，但 ……

谷歌官方展示了幾個(gè)很有意思的應(yīng)用場(chǎng)景。

比如在「投球解謎」類游戲中，F(xiàn)lash 可以做實(shí)時(shí)的輔助推理，給出可行解甚至更優(yōu)解；

在交互 UI 設(shè)計(jì)流程里，它能生成加載動(dòng)畫(huà)，并配合快速迭代做 A/B 方案對(duì)比；

你提供一張圖片，它也能完成基礎(chǔ)識(shí)別，再結(jié)合上下文生成交互式注釋。這些 Demo 的共同點(diǎn)是：強(qiáng)調(diào)實(shí)時(shí)性、強(qiáng)調(diào)迭代效率、強(qiáng)調(diào)能跑起來(lái)。

我也用 Gemini 3 Flash 跑了幾個(gè)案例。

不得不說(shuō)，對(duì)比 Gemini 3 Pro，前者的響應(yīng)速度確實(shí)是極快的，但效果嘛，則比較中規(guī)中矩，對(duì)比 Gemini 3 Pro 則明顯犧牲了視覺(jué)與交互細(xì)節(jié)的質(zhì)量。

以復(fù)刻 macOS 界面為例，該模型的表現(xiàn)略顯乏力：底部 Dock 欄出現(xiàn)了明顯的圖標(biāo)缺失，且在交互細(xì)節(jié)的精致度上，也明顯遜于 Gemini 3 Pro 的生成效果。

這種差距在「復(fù)古擬物風(fēng)相機(jī)應(yīng)用」的設(shè)計(jì)任務(wù)中尤為突出。從生成的單頁(yè)應(yīng)用結(jié)果來(lái)看，其視覺(jué)呈現(xiàn)與預(yù)期目標(biāo)仍有較大差距。

此外，在嘗試打造「星球信號(hào)」網(wǎng)頁(yè)時(shí)，有一定程度的交互細(xì)節(jié)，但整體產(chǎn)出的頁(yè)面效果還是略顯粗糙，缺乏設(shè)計(jì)的細(xì)膩感。

兩條腿走路的谷歌：一邊卷死對(duì)手，一邊把 AI 塞進(jìn)幾十億人的生活

谷歌這次還把 Gemini 3 Flash 塞進(jìn)了搜索的 AI 模式（國(guó)內(nèi)暫不可用）里，逐步向全球開(kāi)放。

相比之前的版本，它更能理解復(fù)雜問(wèn)題中的細(xì)節(jié)，從全網(wǎng)抓取實(shí)時(shí)信息和有用鏈接，輸出視覺(jué)上更清晰、有條理的綜合答案。

與此同時(shí)，Gemini 3 Flash 正在成為 Google「全家桶」的默認(rèn)底座。Gemini 應(yīng)用、搜索 AI 模式、Vertex AI、Google AI Studio、Antigravity、Gemini CLI，全線上新。

全球用戶都能免費(fèi)體驗(yàn)，企業(yè)用戶則可以通過(guò) Vertex AI 和 Gemini Enterprise 來(lái)調(diào)用。

最后再?gòu)?qiáng)調(diào)一遍價(jià)格，因?yàn)檫@個(gè)真的太香了。

輸入每百萬(wàn) Token 0.5 美元，輸出每百萬(wàn) Token 3 美元，音頻輸入每百萬(wàn) token 1 美元。試用價(jià)格不到 Gemini 3 Pro 的四分之一。

如果用上下文緩存，重復(fù) Token 的成本還能再省 90%。用 Batch API 異步處理的話，又能再省 50%，同時(shí)還能提升調(diào)用上限。對(duì)于同步或接近實(shí)時(shí)的場(chǎng)景，付費(fèi) API 用戶可以獲得面向生產(chǎn)環(huán)境的高調(diào)用速率。

價(jià)格打到這個(gè)程度、性能又不算差，OpenAI 和 Anthropic 當(dāng)然很難睡踏實(shí)。

但話得說(shuō)嚴(yán)謹(jǐn)一點(diǎn)，當(dāng)宣傳口徑把 Flash 包裝成「幾乎 Pro 級(jí)」的時(shí)候，用戶自然會(huì)用 Pro 的標(biāo)準(zhǔn)去驗(yàn)貨；而一旦遇到復(fù)雜推理、長(zhǎng)鏈路任務(wù)、穩(wěn)定性要求更高的場(chǎng)景，F(xiàn)lash 的短板就會(huì)更明顯。

谷歌最大的底牌還是流量。

搜索、YouTube、Gmail、Google Maps，每天數(shù)十億用戶在使用這些產(chǎn)品。把 3 Flash嵌入到這些高頻應(yīng)用中，用戶也就在最熟悉的場(chǎng)景里，無(wú)感地、自然地被谷歌 AI 服務(wù)包圍。

這種打法 OpenAI 和 Anthropic 是學(xué)不來(lái)的。

一方面，谷歌財(cái)大氣粗，確實(shí)有資本燒錢(qián)搶市場(chǎng)；另一方面，谷歌在 TPU、數(shù)據(jù)中心、分布式訓(xùn)練等基礎(chǔ)設(shè)施和工程優(yōu)化上的積累，確實(shí)能幫他們把成本壓下來(lái)。

一邊做 toB 的 API 服務(wù)，一邊直接把 AI 能力塞進(jìn)自家產(chǎn)品里，覆蓋海量普通用戶。當(dāng)用戶習(xí)慣了在搜索里用 AI 模式，習(xí)慣了在 Gemini 應(yīng)用里對(duì)話，自然就會(huì)對(duì)谷歌的 AI 產(chǎn)生依賴。這才是谷歌真正的陽(yáng)謀。

當(dāng)然，這種巨頭間的內(nèi)卷對(duì)行業(yè)是殘酷的，但對(duì)用戶絕對(duì)是好事。模型更強(qiáng)、價(jià)格更低，開(kāi)發(fā)者能低成本創(chuàng)新，普通人能享受更智能的服務(wù)，這大概是這場(chǎng) AI 軍備競(jìng)賽中，為數(shù)不多的確定性紅利。

歡迎加入 APPSO AI 社群，一起暢聊 AI 產(chǎn)品，獲取，解鎖更多 AI 新知

我們正在招募伙伴

簡(jiǎn)歷投遞郵箱hr@ifanr.com

?? 郵件標(biāo)題「姓名+崗位名稱」（請(qǐng)隨簡(jiǎn)歷附上項(xiàng)目/作品或相關(guān)鏈接）

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺(tái)“網(wǎng)易號(hào)”用戶上傳并發(fā)布，本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.