網易首頁 > 網易號 > 正文申請入駐

谷歌Gemini 3.1新模型深夜掀桌, 每秒狂飆363 token! 1/4價格暴擊Claude

2026-03-04 06:24:18　來源: 新智元

北京舉報

分享至

新智元報道

編輯：好困桃子

【新智元導讀】谷歌深夜再放大招，Gemini 3.1 Flash-Lite正式登場。輸出速度363 token/s，價格僅0.25美元/百萬Token，跑分卻碾壓GPT-5 mini和2.5 Flash，堪稱最強「窮人版旗艦」。

繼Gemini 3.1 Pro屠榜封神之后，谷歌又在深夜扔出一顆炸彈。

剛剛，Gemini 3.1 Flash-Lite正式上線！

速度363 tokens/s，輸出價格1.50美元/百萬Token，跑分直接碾壓GPT-5 mini和Claude 4.5 Haiku。

同一任務下，相較于2.5 Flash（33分鐘），3.1 Flash-Lite僅用了4分鐘，token消耗最少，且正確率最高。

毫不夸張地說，3.1 Flash-Lite幾乎可以做到「瞬時」輸出。

上傳一份任何PDF、文本、圖片、視頻、音頻，它能極速轉成Markdown格式。

又或是，3.1 Flash-Lite「粒子鍛造器」，迅速出模擬不同的動態效果，堪稱驚艷。

目前，開發者已經可以通過Google AI Studio的Gemini API體驗預覽版，企業用戶可通過Vertex AI接入。

用1/4的價格，跑出5倍的速度

先看最直觀的數字。

3.1 Flash-Lite的輸出速度達到363 tokens/s，跟自家2.5 Flash-Lite（366 tokens/s）幾乎持平，但把上一代Gemini 2.5 Flash（249 tokens/s）遠遠甩在了身后。

而那些「貴族選手」呢？

GPT-5 mini只有71 tokens/s，Claude 4.5 Haiku也不過108 tokens/s，Grok 4.1 Fast稍好一些，145 tokens/s。

換句話說，Flash-Lite的速度是GPT-5 mini的5倍，是Claude 4.5 Haiku的3.4倍，價格卻只有后者的四分之一。

再看具體定價。

3.1 Flash-Lite輸入0.25美元/百萬Token、輸出1.50美元/百萬Token。

3.1 Flash-Lite比3.1 Pro便宜8倍

對比之下，GPT-5 mini的輸出價格是2.00美元，Gemini 2.5 Flash是2.50美元，而Claude 4.5 Haiku更是高達5.00美元，整整貴了3倍還多。

一句話概括：跑得比你快，還比你便宜，跑分還比你高。

跑分碾壓，小模型的「越級挑戰」

在最考驗科學知識和推理能力的GPQA Diamond上，3.1 Flash-Lite直接轟出86.9%的高分。

這一成績不僅碾壓了GPT-5 mini的82.3%和Claude 4.5 Haiku的73.0%，甚至把體量更大、價格更貴的Gemini 2.5 Flash（82.8%）也踩在了腳下。

多模態理解方面同樣強悍。

在MMMU-Pro測試中，Flash-Lite拿下76.8%，力壓GPT-5 mini（74.1%）、Gemini 2.5 Flash（66.7%）、Grok 4.1 Fast（63.0%）和Claude 4.5 Haiku（58.0%）。

在事實準確性測試SimpleQA Verified中，差距更是斷崖級。

Flash-Lite以43.3%的準確率遙遙領先，而Gemini 2.5 Flash為28.1%，GPT-5 mini僅有9.5%（4.5倍），Claude 4.5 Haiku更是低到5.5%（近8倍）。

多語言能力方面，MMMLU測試中Flash-Lite以88.9%登頂，超過了Gemini 2.5 Flash的86.6%和GPT-5 mini的84.9%，在這個價位段里沒有對手。

在視頻理解領域，Video-MMMU得分84.8%，同樣是同級別最高，GPT-5 mini（82.5%）和Gemini 2.5 Flash（79.2%）均不及。

當然，3.1 Flash-Lite也并非沒有短板。

在LiveCodeBench代碼生成測試中，Flash-Lite得分72.0%，雖然不低，但GPT-5 mini憑借80.4%明顯更強，Grok 4.1 Fast也有76.5%。

在Humanity's Last Exam中，Flash-Lite得分16.0%，與GPT-5 mini的16.7%基本持平，但Grok 4.1 Fast以17.6%拿到了這個級別的最高分。

但別忘了一個核心事實：Flash-Lite的價格只有這些對手的幾分之一。

Arena打進全球前40

實驗室跑分只是一面，真刀真槍的盲測對戰才見真章。

在Chatbot Arena的文本競技場中，3.1 Flash-Lite以1432的Elo分數排名第36。

它身邊的鄰居是o3（1432分）和GPT-5 High（1434分），而身后緊跟著的是Grok 4.1 Fast Reasoning（1430分）。

一個定價0.25美元的輕量模型，Elo分數和OpenAI的旗艦推理模型o3打成平手，這個性價比足夠讓人震驚。

在代碼競技場中，3.1 Flash-Lite得分1261，排名并列35。

它在這里的對手包括Claude Haiku 4.5（1308分，第31名）和DeepSeek V3.2（1321分，第34名），差距不算大，但確實還有提升空間。

在Artificial Analysis評測中，3.1 Flash-Lite在輸出速度和成本效益上，目前業界最優。

「思考深度」可調

除了硬核性能，3.1 Flash-Lite還標配了thinking levels功能，開發者可以自由設定模型在每個任務上投入多少推理資源。

批量翻譯、內容審核、數據分類這類高頻低復雜度任務跑淺思考模式，速度和成本壓到極致。

生成UI界面、構建模擬環境、執行多步驟復雜指令？切到深度推理模式，效果不輸大模型。

實測：輕量模型的重量級表現

在實際測試中，3.1 Flash-Lite展現出了遠超其定位的能力。

電商場景：瞬間填滿原型圖。

給出一句指令，Flash-Lite就能在幾秒內用幾十個品類、數百款商品填滿一整個電商界面原型，包含名稱、價格、分類、圖片占位。

這在以往，需要設計師手動填充半天的工作，現在一個Prompt搞定。

實時數據看板：天氣預報+歷史分析。

Flash-Lite能夠結合最新的天氣預報接口和歷史數據，實時生成動態的天氣數據可視化看板。

對于需要快速搭建數據展示層的開發者來說，這個能力直接省掉了一個「前端工程師」。

SaaS AI智能體：多步任務自動化。

Flash-Lite可以構建處理多步驟靈活任務的SaaS智能體，幫助企業自動化客戶工單處理、訂單跟蹤等流程。

在低延遲和低成本的加持下，這類高頻調用場景正是Flash-Lite的主戰場。

海量內容處理：快速分析歸類。

面對大批量的圖片、文檔、用戶評論等非結構化內容，Flash-Lite還能夠快速完成分析、標簽化和歸類整理。

性價比賽道，徹底變天

3.1 Flash-Lite的發布，標志著AI競爭進入了一個全新的階段。

過去，各家大模型都在卷「誰最強」——ARC-AGI刷分、HLE拼推理、代碼競賽爭排名。

但Flash-Lite的出現，把戰場拉到了另一個維度。

光卷性能已經不夠了。誰能用最低的成本交付最高的質量，誰才是真正的贏家。

用幾分之一的價格打出旗艦級效果、用5倍的速度碾壓競品、在事實準確性上斷崖領先，谷歌用Flash-Lite告訴所有人：在性價比這條賽道上，它已經跑在了前面。

而對于全球數百萬開發者來說，這可能是目前最值得關注的模型之一。

畢竟，在真實的產品場景中，成本和速度有時比跑分更重要。

參考資料：

https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

https://storage.googleapis.com/deepmind-media/gemini/gemini_3-1_flash-lite_model_evaluation.pdf

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相關推薦

熱點推薦

女子在杭州西湖景區把“西泠印社”認成“杜帥冷面”，網友：四個字認錯五個，當事人：沒有文化確實不行

揚子晚報 2026-03-06 17:44:56
1442 跟貼 1442
下一波冷空氣時間確定！廣州，要下雨了

環球網資訊 2026-03-08 07:23:09
40 跟貼 40

超級杯聯賽遭遇兩連敗，上海海港的新賽季警報提前拉響

澎湃新聞 2026-03-08 08:56:27
1 跟貼 1

被全網催開門的河南水煎包店老板準備明天營業，正在打掃衛生、備餐：煎包還是1元2個，胡辣湯3元1碗

大象新聞 2026-03-07 14:47:24
325 跟貼 325
油價或迎來本年度飆升加滿一箱油要貴20元

都市快報橙柿互動 2026-03-07 23:13:42
1335 跟貼 1335

阿聯酋航空暫停所有進出迪拜航班

界面新聞 2026-03-07 15:24:47
1112 跟貼 1112

路虎攬勝回應長城汽車董事長魏建軍道歉：真誠和擔當是最好的代言，堅持原創，祝長城汽車越來越好

中國能源網 2026-03-07 15:29:05
181 跟貼 181
河南一公司連續兩年婦女節給近2000名女員工發160萬元紅包，員工：過年領的2100元還沒用完，又發800元，太幸福了

極目新聞 2026-03-07 20:45:42
472 跟貼 472

1比2不敵河南遭“開門黑”，海港主帥穆斯卡特直言：“很多事，我無法評論”

文匯報 2026-03-08 04:07:08
108 跟貼 108
男子硬核爬山直接在山頂烹飪，風景配美食太愜意

南陽日報 2026-03-07 18:45:14
80 跟貼 80
廣東爸媽的養老金又提標了

廣東廣播電視臺 2026-03-07 17:23:38
85 跟貼 85
爆火，有人說幾天賺了26萬！近千人在騰訊樓下排隊，QQ最新宣布

都市快報橙柿互動 2026-03-08 08:11:30
0 跟貼 0
爸媽取名“嫕澂”生僻燙嘴，少有人認識，4歲萌娃自己拍板新名字，請叫我“予檸”

大象新聞 2026-03-07 19:50:04
61 跟貼 61
上海部分商場取消“寵物友好”，商家: 怎么做都會被差評！矛盾如何彌合？

縱相新聞 2026-03-08 08:52:10
31 跟貼 31
王毅談世界多極化：大國應帶頭守規矩、講信用

新華社 2026-03-08 10:55:41
167 跟貼 167
銀價爆了！ 12月5日白銀價格再度大漲報58.11美元/盎司日內漲幅1.75%

每日經濟新聞 2026-03-07 21:35:32
79 跟貼 79
中國發布丨讓學生身上有汗、眼里有光、健康第一，教育部將采取這些行動

中國網 2026-03-07 13:12:18
73 跟貼 73
中國絕不走國強必霸的路

央視新聞 2026-03-08 10:57:13
1 跟貼 1
房主任回村住百元旅館被嘲引熱議！風向一邊倒，她真的錯了嗎？

木子愛娛樂大號 2026-03-08 11:27:57
0 跟貼 0
潘功勝：央行將實施好適度寬松的貨幣政策

財聯社 2026-03-07 18:33:09
21 跟貼 21
崛起書店，你不能關，也不會關

慢書房 2026-03-08 11:29:58
0 跟貼 0
王毅：中國是地區安全的穩定錨

央視新聞客戶端 2026-03-08 10:38:22
23 跟貼 23
供應告急國際尿素價格飆升！為何國內市場“波瀾不驚”？

中國能源網 2026-03-08 08:49:02
23 跟貼 23
兩會三人談：打通增收堵點讓農民 “錢袋子” 鼓起來

農視網 2026-03-08 10:32:46
1 跟貼 1
女子誤拿了凳子后急忙返還致歉，卻遭對方將螺螄粉湯偷倒進帽子

靜若梨花 2026-03-08 11:23:37
1 跟貼 1
廣東汕頭一女子狂笑磕傷額頭變“熊貓眼”！當事人辟謠：絕非家暴！網友：這眼影有點時尚

深圳晚報 2026-03-08 11:48:52
0 跟貼 0

新智元

AI產業主平臺領航智能+時代

14664文章數 66667關注度

往期回顧全部

態度原創

+arrTaiduYuanC[i].tag+' | '+arrTaiduYuanC[i].title+'
\

藝術

數碼

旅游

房產

游戲

手機 / 數碼

房產 / 家居

谷歌Gemini 3.1新模型深夜掀桌, 每秒狂飆363 token! 1/4價格暴擊Claude

REDMI Pad 2平板或推出9.7英寸版本 現款為11英寸

伊朗公布行動細節 有導彈配備集束彈頭均命中目標

伊朗公布行動細節 有導彈配備集束彈頭均命中目標

大傷后被交易，他說：22歲的我已經死了

周迅新戀情曝光，李亞鵬等人已成過去

油價要失控？

OpenClaw最大的推手是閑魚和小紅書

9分鐘充飽 全新騰勢Z9GT首搭閃充技術26.98萬起

態度原創

他是二王書法的化身？米芾的秘密揭曉！

華為PC加速鴻蒙化 上半年或推出兩款鴻蒙PC新品！

有一億人？無錫這些地方擠爆了

傳統學區房熄火？2月海口二手房爆火的板塊竟然是…

數毛社評NS2《生化7/8》：掌機原生分辨率僅432p

REDMI Pad 2平板或推出9.7英寸版本現款為11英寸

伊朗公布行動細節有導彈配備集束彈頭均命中目標

伊朗公布行動細節有導彈配備集束彈頭均命中目標

9分鐘充飽全新騰勢Z9GT首搭閃充技術26.98萬起

華為PC加速鴻蒙化上半年或推出兩款鴻蒙PC新品！