<cite id="ffb66"></cite><cite id="ffb66"><track id="ffb66"></track></cite>
      <legend id="ffb66"><li id="ffb66"></li></legend>
      色婷婷久,激情色播,久久久无码专区,亚洲中文字幕av,国产成人A片,av无码免费,精品久久国产,99视频精品3
      網易首頁 > 網易號 > 正文 申請入駐

      谷歌Gemini 3.1新模型深夜掀桌, 每秒狂飆363 token! 1/4價格暴擊Claude

      0
      分享至


      新智元報道

      編輯:好困 桃子

      【新智元導讀】谷歌深夜再放大招,Gemini 3.1 Flash-Lite正式登場。輸出速度363 token/s,價格僅0.25美元/百萬Token,跑分卻碾壓GPT-5 mini和2.5 Flash,堪稱最強「窮人版旗艦」。

      繼Gemini 3.1 Pro屠榜封神之后,谷歌又在深夜扔出一顆炸彈。

      剛剛,Gemini 3.1 Flash-Lite正式上線!

      速度363 tokens/s,出價格1.50美元/百萬Token,跑分直接碾壓GPT-5 mini和Claude 4.5 Haiku



      同一任務下,相較于2.5 Flash(33分鐘),3.1 Flash-Lite僅用了4分鐘,token消耗最少,且正確率最高。


      毫不夸張地說,3.1 Flash-Lite幾乎可以做到「瞬時」輸出

      上傳一份任何PDF、文本、圖片、視頻、音頻,它能極速轉成Markdown格式。


      又或是,3.1 Flash-Lite「粒子鍛造器」,迅速出模擬不同的動態效果,堪稱驚艷。


      目前,開發者已經可以通過Google AI Studio的Gemini API體驗預覽版,企業用戶可通過Vertex AI接入。


      用1/4的價格,跑出5倍的速度

      先看最直觀的數字。

      3.1 Flash-Lite的輸出速度達到363 tokens/s,跟自家2.5 Flash-Lite(366 tokens/s)幾乎持平,但把上一代Gemini 2.5 Flash(249 tokens/s)遠遠甩在了身后。

      而那些「貴族選手」呢?

      GPT-5 mini只有71 tokens/s,Claude 4.5 Haiku也不過108 tokens/s,Grok 4.1 Fast稍好一些,145 tokens/s。

      換句話說,Flash-Lite的速度是GPT-5 mini的5倍,是Claude 4.5 Haiku的3.4倍,價格卻只有后者的四分之一


      再看具體定價。

      3.1 Flash-Lite輸入0.25美元/百萬Token、輸出1.50美元/百萬Token。


      3.1 Flash-Lite比3.1 Pro便宜8倍

      對比之下,GPT-5 mini的輸出價格是2.00美元,Gemini 2.5 Flash是2.50美元,而Claude 4.5 Haiku更是高達5.00美元,整整貴了3倍還多。

      一句話概括:跑得比你快,還比你便宜,跑分還比你高。


      跑分碾壓,小模型的「越級挑戰」

      在最考驗科學知識和推理能力的GPQA Diamond上,3.1 Flash-Lite直接轟出86.9%的高分。

      這一成績不僅碾壓了GPT-5 mini的82.3%和Claude 4.5 Haiku的73.0%,甚至把體量更大、價格更貴的Gemini 2.5 Flash(82.8%)也踩在了腳下。

      多模態理解方面同樣強悍。

      在MMMU-Pro測試中,Flash-Lite拿下76.8%,力壓GPT-5 mini(74.1%)、Gemini 2.5 Flash(66.7%)、Grok 4.1 Fast(63.0%)和Claude 4.5 Haiku(58.0%)。

      事實準確性測試SimpleQA Verified中,差距更是斷崖級

      Flash-Lite以43.3%的準確率遙遙領先,而Gemini 2.5 Flash為28.1%,GPT-5 mini僅有9.5%(4.5倍),Claude 4.5 Haiku更是低到5.5%(近8倍)。

      多語言能力方面,MMMLU測試中Flash-Lite以88.9%登頂,超過了Gemini 2.5 Flash的86.6%和GPT-5 mini的84.9%,在這個價位段里沒有對手。

      視頻理解領域,Video-MMMU得分84.8%,同樣是同級別最高,GPT-5 mini(82.5%)和Gemini 2.5 Flash(79.2%)均不及。


      當然,3.1 Flash-Lite也并非沒有短板。

      LiveCodeBench代碼生成測試中,Flash-Lite得分72.0%,雖然不低,但GPT-5 mini憑借80.4%明顯更強,Grok 4.1 Fast也有76.5%。

      Humanity's Last Exam中,Flash-Lite得分16.0%,與GPT-5 mini的16.7%基本持平,但Grok 4.1 Fast以17.6%拿到了這個級別的最高分。

      但別忘了一個核心事實:Flash-Lite的價格只有這些對手的幾分之一。

      Arena打進全球前40

      實驗室跑分只是一面,真刀真槍的盲測對戰才見真章。

      在Chatbot Arena的文本競技場中,3.1 Flash-Lite以1432的Elo分數排名第36

      它身邊的鄰居是o3(1432分)和GPT-5 High(1434分),而身后緊跟著的是Grok 4.1 Fast Reasoning(1430分)。

      一個定價0.25美元的輕量模型,Elo分數和OpenAI的旗艦推理模型o3打成平手,這個性價比足夠讓人震驚。


      在代碼競技場中,3.1 Flash-Lite得分1261,排名并列35。

      它在這里的對手包括Claude Haiku 4.5(1308分,第31名)和DeepSeek V3.2(1321分,第34名),差距不算大,但確實還有提升空間。


      在Artificial Analysis評測中,3.1 Flash-Lite在輸出速度和成本效益上,目前業界最優。


      「思考深度」可調

      除了硬核性能,3.1 Flash-Lite還標配了thinking levels功能,開發者可以自由設定模型在每個任務上投入多少推理資源。

      • 批量翻譯、內容審核、數據分類這類高頻低復雜度任務跑淺思考模式,速度和成本壓到極致。

      • 生成UI界面、構建模擬環境、執行多步驟復雜指令?切到深度推理模式,效果不輸大模型。


      實測:輕量模型的重量級表現

      在實際測試中,3.1 Flash-Lite展現出了遠超其定位的能力。

      電商場景:瞬間填滿原型圖。

      給出一句指令,Flash-Lite就能在幾秒內用幾十個品類、數百款商品填滿一整個電商界面原型,包含名稱、價格、分類、圖片占位。

      這在以往,需要設計師手動填充半天的工作,現在一個Prompt搞定。


      實時數據看板:天氣預報+歷史分析。

      Flash-Lite能夠結合最新的天氣預報接口和歷史數據,實時生成動態的天氣數據可視化看板。

      對于需要快速搭建數據展示層的開發者來說,這個能力直接省掉了一個「前端工程師」。


      SaaS AI智能體:多步任務自動化。

      Flash-Lite可以構建處理多步驟靈活任務的SaaS智能體,幫助企業自動化客戶工單處理、訂單跟蹤等流程。

      在低延遲和低成本的加持下,這類高頻調用場景正是Flash-Lite的主戰場。


      海量內容處理:快速分析歸類。

      面對大批量的圖片、文檔、用戶評論等非結構化內容,Flash-Lite還能夠快速完成分析、標簽化和歸類整理。


      性價比賽道,徹底變天

      3.1 Flash-Lite的發布,標志著AI競爭進入了一個全新的階段。

      過去,各家大模型都在卷「誰最強」——ARC-AGI刷分、HLE拼推理、代碼競賽爭排名。

      但Flash-Lite的出現,把戰場拉到了另一個維度。

      光卷性能已經不夠了。誰能用最低的成本交付最高的質量,誰才是真正的贏家。


      用幾分之一的價格打出旗艦級效果、用5倍的速度碾壓競品、在事實準確性上斷崖領先,谷歌用Flash-Lite告訴所有人:在性價比這條賽道上,它已經跑在了前面。

      而對于全球數百萬開發者來說,這可能是目前最值得關注的模型之一。

      畢竟,在真實的產品場景中,成本和速度有時比跑分更重要。

      參考資料:

      https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-3-1-flash-lite/

      https://storage.googleapis.com/deepmind-media/gemini/gemini_3-1_flash-lite_model_evaluation.pdf

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      學校繳費33600元!東莞一家長哭訴已拼盡全力生活,還是力不從心

      學校繳費33600元!東莞一家長哭訴已拼盡全力生活,還是力不從心

      火山詩話
      2026-03-07 07:54:49
      1年1100萬美金!聯盟第1!湖人2換1交易血賺,東契奇把話挑明

      1年1100萬美金!聯盟第1!湖人2換1交易血賺,東契奇把話挑明

      小彭美識
      2026-03-08 10:46:00
      這是要復婚?過年丟下4年女友,直奔三亞陪佟麗婭!陳思誠太膈應人了

      這是要復婚?過年丟下4年女友,直奔三亞陪佟麗婭!陳思誠太膈應人了

      八卦王者
      2026-03-08 11:01:19
      起風了!表決結果出爐,22名綠委缺席!蔣萬安、盧秀燕高下立判!

      起風了!表決結果出爐,22名綠委缺席!蔣萬安、盧秀燕高下立判!

      浪子阿邴聊體育
      2026-03-08 04:13:40
      1年1100萬美金!聯盟第1!湖人2換1交易血賺,東契奇把話挑明

      1年1100萬美金!聯盟第1!湖人2換1交易血賺,東契奇把話挑明

      世界體育圈
      2026-03-08 10:43:18
      足不出戶一鍵養龍蝦!美團推出OpenClaw遠程部署服務

      足不出戶一鍵養龍蝦!美團推出OpenClaw遠程部署服務

      快科技
      2026-03-07 12:37:27
      陶虹這腿無法直視了,徐導這么能賺錢為啥不保養一下

      陶虹這腿無法直視了,徐導這么能賺錢為啥不保養一下

      愛下廚的阿釃
      2026-03-06 20:11:39
      伊朗反擊取得重大成果?千萬別信網上的那些專家和爽文

      伊朗反擊取得重大成果?千萬別信網上的那些專家和爽文

      壹家言
      2026-03-04 19:37:20
      懸念不大了!NBA西部季后賽球隊,大概率這8支,勇士基本出局

      懸念不大了!NBA西部季后賽球隊,大概率這8支,勇士基本出局

      籃球掃地僧
      2026-03-07 15:18:27
      全國人大代表、北京協和醫院院長張抒揚建議:年輕人,別錯過最佳生育年齡,為人父母的幸福感是無可替代的

      全國人大代表、北京協和醫院院長張抒揚建議:年輕人,別錯過最佳生育年齡,為人父母的幸福感是無可替代的

      觀威海
      2026-03-07 12:07:22
      川普:伊朗只剩無條件投降!拉里賈尼成了頭號斬首目標

      川普:伊朗只剩無條件投降!拉里賈尼成了頭號斬首目標

      深度報
      2026-03-07 22:13:54
      鄧肯“接班人”實至名歸!文班亞馬生涯第三年數據高度復刻傳奇!

      鄧肯“接班人”實至名歸!文班亞馬生涯第三年數據高度復刻傳奇!

      田先生籃球
      2026-03-05 14:13:10
      高葉這衣服暴露了真實身材

      高葉這衣服暴露了真實身材

      科學發掘
      2026-03-07 22:21:36
      江蘇一女子當著丈夫和女兒的面點兩男模 還讓丈夫買單

      江蘇一女子當著丈夫和女兒的面點兩男模 還讓丈夫買單

      塵埃里的看客
      2026-03-07 17:05:51
      請收藏!WTT重慶冠軍賽賽程出爐,看點全梳理不錯過每個精彩瞬間

      請收藏!WTT重慶冠軍賽賽程出爐,看點全梳理不錯過每個精彩瞬間

      乒談
      2026-03-08 00:10:21
      男子養豪豬拔刺 每斤刺能賣400元

      男子養豪豬拔刺 每斤刺能賣400元

      閃電新聞
      2026-03-08 00:25:56
      局長被免職后去世,全局只有我去吊唁,后來他的妻子擔任市委書記

      局長被免職后去世,全局只有我去吊唁,后來他的妻子擔任市委書記

      秋風專欄
      2025-12-29 16:32:49
      漢纜股份這回徹底出圈了

      漢纜股份這回徹底出圈了

      蔚然先聲
      2026-03-08 08:32:12
      很遺憾這兩位沒有在一起,多么郎才女貌,天作之合,好般配呀

      很遺憾這兩位沒有在一起,多么郎才女貌,天作之合,好般配呀

      草莓解說體育
      2026-03-06 14:49:46
      賭徒的結局真的是一無所有嗎 網友講述百億老板到騙他300萬過程

      賭徒的結局真的是一無所有嗎 網友講述百億老板到騙他300萬過程

      侃神評故事
      2026-03-07 07:15:03
      2026-03-08 12:04:49
      新智元 incentive-icons
      新智元
      AI產業主平臺領航智能+時代
      14664文章數 66667關注度
      往期回顧 全部

      數碼要聞

      REDMI Pad 2平板或推出9.7英寸版本 現款為11英寸

      頭條要聞

      伊朗公布行動細節 有導彈配備集束彈頭均命中目標

      頭條要聞

      伊朗公布行動細節 有導彈配備集束彈頭均命中目標

      體育要聞

      大傷后被交易,他說:22歲的我已經死了

      娛樂要聞

      周迅新戀情曝光,李亞鵬等人已成過去

      財經要聞

      油價要失控?

      科技要聞

      OpenClaw最大的推手是閑魚和小紅書

      汽車要聞

      9分鐘充飽 全新騰勢Z9GT首搭閃充技術26.98萬起

      態度原創

      藝術
      數碼
      旅游
      房產
      游戲

      藝術要聞

      他是二王書法的化身?米芾的秘密揭曉!

      數碼要聞

      華為PC加速鴻蒙化 上半年或推出兩款鴻蒙PC新品!

      旅游要聞

      有一億人?無錫這些地方擠爆了

      房產要聞

      傳統學區房熄火?2月海口二手房爆火的板塊竟然是…

      數毛社評NS2《生化7/8》:掌機原生分辨率僅432p

      無障礙瀏覽 進入關懷版