網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

馬斯克放出新模型Grok 4 Fast，1/25成本媲美Gemini 2.5 Pro

2025-09-22 19:27:32　來源: 大數(shù)據(jù)文摘

北京舉報

分享至

大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載夕小瑤科技說

就在昨天深夜，馬斯克的 xAI 悄無聲息地扔出了一顆重磅炸彈——Grok 4 Fast！

熟悉 AI 圈的家人們都知道，xAI 的迭代速度堪稱恐怖（xAI 到底怎么做到，這么少的開發(fā)人員，模型更迭的這這么快。。。）幾乎一月一更新。

但這次更新，確實(shí)值得說一說，這次 xAI 改變了牌局的玩法，直接把“性價比”這個概念帶到了一個新的高度。

用老板馬斯克的夸獎來說：“這就是進(jìn)展！”

別看模型名字里有個“Fast”，這可不是只圖快、犧牲智能的“小甜點(diǎn)”：

以 25 分之一的成本，實(shí)現(xiàn) Gemini 2.5 Pro 級別的智能！
行業(yè)天花板級別的 200 萬 Token 上下文窗口。
無縫融合網(wǎng)頁與 X (推特) 平臺，提供實(shí)時、多媒體的搜索增強(qiáng)。

傳送門:https://x.ai/news/grok-4-fast

在過去，有一個規(guī)則是公認(rèn)的—模型的性能和它的“思考成本”（即推理消耗的 token）是成正比的。模型越聰明，調(diào)用起來就越貴、越慢。

但 xAI 通過大規(guī)模強(qiáng)化學(xué)習(xí)（RL）技術(shù)，把 Grok 4 Fast 的智能“壓縮”到了極致，最終的效果是：新模型 Grok 4 Fast 性能幾乎與頂級的 Grok 4 持平，但平均節(jié)省了 40% 的推理 Token 消耗。

Grok 4 Fast 定價為：

輸入: $0.2 / 每百萬 Tokens(約人民幣 1.42)
輸出: $0.5 / 每百萬 Tokens（3.56 ）

為了讓大家有個對比，咱列一下其他家的：

DeepSeek：

Gemini：

更關(guān)鍵的是，Grok 4 Fast 不僅實(shí)現(xiàn)了平均 40% 的 Token 節(jié)省和極具攻擊性的定價，更在各大權(quán)威基準(zhǔn)測試中取得了“屠榜”級的表現(xiàn)：

在推理基準(zhǔn)測試中，Grok 4 Fast 在大幅降低 token 成本的同時，全面超越了 Grok 3 Mini：

在 LMArena 搜索競賽中，Grok-4-Fast-Search 以 1163 的 ELO 評分奪得冠軍，領(lǐng)先第二名 o3-search 17 分，展現(xiàn)了其在模擬真實(shí)世界應(yīng)用場景中的絕對優(yōu)勢：

在 LMArena 的 Text Arena 中， Grok 4 Fast 排名第八，表現(xiàn)與 grok-4-0709 相當(dāng)，在同重量級中遠(yuǎn)遠(yuǎn)優(yōu)于同行（所有同等規(guī)模的模型排名均在第 18 位或以下）：

在極度考驗(yàn)語義理解與分類推理能力的紐約時報連線謎題（NYT Connections Benchmark）中，Grok 4 Fast Reasoning 以其卓越的“智商”直接登頂，超越了 GPT-5、Gemini 2.5 Pro 等一系列頂級模型。

在著名的“Artificial Analysis 智能指數(shù)”中，Grok 4 Fast 僅用 Gemini 2.5 Pro 約二十五分之一的成本，就達(dá)到了同等級別的智能表現(xiàn)。

更夸張的是它的速度，根據(jù) Artificial Analysis 的獨(dú)立評測，Grok 4 Fast API 非常快，輸出速度高達(dá) 344 tokens/秒，大約是 OpenAI GPT-5 API 的 2.5 倍，端到端延遲僅 3.8 秒，是當(dāng)之無愧目前最快的前沿模型：

除了出色的性能，Token 效率是 Grok 4 Fast 的另一大亮點(diǎn)—它使用 6100 萬 token 完成了智能指數(shù)測試（Gemini 2.5 Pro 用了 9300 萬，Grok 4 用了 1.2 億）。

Grok 4 Fast 通過端到端的工具使用強(qiáng)化學(xué)習(xí)（RL）進(jìn)行訓(xùn)練，成為了一個天生的“工具調(diào)用大師”，當(dāng)你給它一個復(fù)雜的搜索任務(wù)時，它不再是簡單地返回一堆鏈接。它會像一個真正的人類研究員一樣：

主動瀏覽網(wǎng)頁和 X 平臺。
點(diǎn)擊鏈接，深入挖掘信息。
解析 X 上的圖片和視頻內(nèi)容。
整合出一份實(shí)時、精準(zhǔn)的報告。

目前 Grok 的官方已經(jīng)可以使用 Grok 4 Fast 了！

而且，xAI 還送上了一個福利：Grok 4 Fast 的 API 將在 OpenRouter 和 Vercel AI Gateway 上限時免費(fèi)提供。感興趣的開發(fā)者家人們，可以沖了！

咱們小小的測了下 Grok4 Fast，用了測評大模型的幾個經(jīng)典的考題：

首先是草莓和比大小：

這個沒問題是意料之內(nèi)，那再試試編程：

請幫我生成一個小球在六邊形內(nèi)模仿物理規(guī)律跳動的網(wǎng)頁

表現(xiàn)一言難盡。。都沒有小球在網(wǎng)頁中出現(xiàn)。

再給你一次機(jī)會！

請幫我生成一個網(wǎng)頁版本的連連看游戲

這個很絲滑，而且游戲的運(yùn)行也正確無誤！

再看下 Grok 4 Fast 的文筆：

請幫我生成小說特朗普與外星人的相遇

模型的性能整體看還是可以的，感興趣的家人們可以再猛猛考驗(yàn)他一下和我們分享～

但是非常值得震撼的是，Grok 4 Fast 的發(fā)布，再次印證了那個非常可怕的趨勢：獲取頂尖 AI 智能的成本正在雪崩式下降。

根據(jù)數(shù)據(jù)統(tǒng)計，在過去一年半里，獲取 GPT-4 級別智能的成本已經(jīng)下降了約 500 倍：

而 Grok 4 Fast 的出現(xiàn)，無疑是為這把火又添了一大桶油。。。。

對于開發(fā)者而言，這意味著可以用更低的成本構(gòu)建更強(qiáng)大、更實(shí)用的 AI 應(yīng)用，對于我們普通用戶而言，一個更智能、更便宜、更無處不在的 AI 時代，正加速向我們駛來。

GPU 訓(xùn)練特惠！

H100/H200 GPU算力按秒計費(fèi)，平均節(jié)省開支30%以上！

掃碼了解詳情?

點(diǎn)「贊」的人都變好看了哦！

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.