大數(shù)據(jù)文摘受權(quán)轉(zhuǎn)載夕小瑤科技說
就在昨天深夜,馬斯克的 xAI 悄無聲息地扔出了一顆重磅炸彈——Grok 4 Fast!
![]()
熟悉 AI 圈的家人們都知道,xAI 的迭代速度堪稱恐怖(xAI 到底怎么做到,這么少的開發(fā)人員,模型更迭的這這么快。。。)幾乎一月一更新。
但這次更新,確實(shí)值得說一說,這次 xAI 改變了牌局的玩法,直接把“性價比”這個概念帶到了一個新的高度。
用老板馬斯克的夸獎來說:“這就是進(jìn)展!”
![]()
別看模型名字里有個“Fast”,這可不是只圖快、犧牲智能的“小甜點(diǎn)”:
以 25 分之一的成本,實(shí)現(xiàn) Gemini 2.5 Pro 級別的智能!
行業(yè)天花板級別的 200 萬 Token 上下文窗口。
無縫融合網(wǎng)頁與 X (推特) 平臺,提供實(shí)時、多媒體的搜索增強(qiáng)。
傳送門:https://x.ai/news/grok-4-fast
在過去,有一個規(guī)則是公認(rèn)的—模型的性能和它的“思考成本”(即推理消耗的 token)是成正比的。模型越聰明,調(diào)用起來就越貴、越慢。
但 xAI 通過大規(guī)模強(qiáng)化學(xué)習(xí)(RL)技術(shù),把 Grok 4 Fast 的智能“壓縮”到了極致,最終的效果是:新模型 Grok 4 Fast 性能幾乎與頂級的 Grok 4 持平,但平均節(jié)省了 40% 的推理 Token 消耗。
![]()
Grok 4 Fast 定價為:
輸入: $0.2 / 每百萬 Tokens(約人民幣 1.42)
輸出: $0.5 / 每百萬 Tokens(3.56 )
為了讓大家有個對比,咱列一下其他家的:
DeepSeek:
![]()
Gemini:
![]()
更關(guān)鍵的是,Grok 4 Fast 不僅實(shí)現(xiàn)了平均 40% 的 Token 節(jié)省和極具攻擊性的定價,更在各大權(quán)威基準(zhǔn)測試中取得了“屠榜”級的表現(xiàn):
在推理基準(zhǔn)測試中,Grok 4 Fast 在大幅降低 token 成本的同時,全面超越了 Grok 3 Mini:
在 LMArena 搜索競賽中,Grok-4-Fast-Search 以 1163 的 ELO 評分奪得冠軍,領(lǐng)先第二名 o3-search 17 分,展現(xiàn)了其在模擬真實(shí)世界應(yīng)用場景中的絕對優(yōu)勢:
在 LMArena 的 Text Arena 中, Grok 4 Fast 排名第八,表現(xiàn)與 grok-4-0709 相當(dāng),在同重量級中遠(yuǎn)遠(yuǎn)優(yōu)于同行(所有同等規(guī)模的模型排名均在第 18 位或以下):
![]()
在極度考驗(yàn)語義理解與分類推理能力的紐約時報連線謎題(NYT Connections Benchmark)中,Grok 4 Fast Reasoning 以其卓越的“智商”直接登頂,超越了 GPT-5、Gemini 2.5 Pro 等一系列頂級模型。
在著名的“Artificial Analysis 智能指數(shù)”中,Grok 4 Fast 僅用 Gemini 2.5 Pro 約二十五分之一的成本,就達(dá)到了同等級別的智能表現(xiàn)。
![]()
更夸張的是它的速度,根據(jù) Artificial Analysis 的獨(dú)立評測,Grok 4 Fast API 非常快,輸出速度高達(dá) 344 tokens/秒,大約是 OpenAI GPT-5 API 的 2.5 倍,端到端延遲僅 3.8 秒,是當(dāng)之無愧目前最快的前沿模型:
![]()
除了出色的性能,Token 效率是 Grok 4 Fast 的另一大亮點(diǎn)—它使用 6100 萬 token 完成了智能指數(shù)測試(Gemini 2.5 Pro 用了 9300 萬,Grok 4 用了 1.2 億)。
Grok 4 Fast 通過端到端的工具使用強(qiáng)化學(xué)習(xí)(RL)進(jìn)行訓(xùn)練,成為了一個天生的“工具調(diào)用大師”,當(dāng)你給它一個復(fù)雜的搜索任務(wù)時,它不再是簡單地返回一堆鏈接。它會像一個真正的人類研究員一樣:
主動瀏覽網(wǎng)頁和 X 平臺。
點(diǎn)擊鏈接,深入挖掘信息。
解析 X 上的圖片和視頻內(nèi)容。
整合出一份實(shí)時、精準(zhǔn)的報告。
目前 Grok 的官方已經(jīng)可以使用 Grok 4 Fast 了!
![]()
而且,xAI 還送上了一個福利:Grok 4 Fast 的 API 將在 OpenRouter 和 Vercel AI Gateway 上限時免費(fèi)提供。 感興趣的開發(fā)者家人們,可以沖了!
![]()
咱們小小的測了下 Grok4 Fast,用了測評大模型的幾個經(jīng)典的考題:
首先是草莓和比大小:
![]()
這個沒問題是意料之內(nèi),那再試試編程:
請幫我生成一個小球在六邊形內(nèi)模仿物理規(guī)律跳動的網(wǎng)頁
表現(xiàn)一言難盡。。都沒有小球在網(wǎng)頁中出現(xiàn)。
![]()
再給你一次機(jī)會!
請幫我生成一個網(wǎng)頁版本的連連看游戲
這個很絲滑,而且游戲的運(yùn)行也正確無誤!
再看下 Grok 4 Fast 的文筆:
請幫我生成小說 特朗普與外星人的相遇
![]()
模型的性能整體看還是可以的,感興趣的家人們可以再猛猛考驗(yàn)他一下和我們分享 ~
但是非常值得震撼的是,Grok 4 Fast 的發(fā)布,再次印證了那個非常可怕的趨勢:獲取頂尖 AI 智能的成本正在雪崩式下降。
根據(jù)數(shù)據(jù)統(tǒng)計,在過去一年半里,獲取 GPT-4 級別智能的成本已經(jīng)下降了約 500 倍:
![]()
而 Grok 4 Fast 的出現(xiàn),無疑是為這把火又添了一大桶油。。。。
對于開發(fā)者而言,這意味著可以用更低的成本構(gòu)建更強(qiáng)大、更實(shí)用的 AI 應(yīng)用,對于我們普通用戶而言,一個更智能、更便宜、更無處不在的 AI 時代,正加速向我們駛來。
GPU 訓(xùn)練特惠!
H100/H200 GPU算力按秒計費(fèi),平均節(jié)省開支30%以上!
掃碼了解詳情?
點(diǎn)「贊」的人都變好看了哦!
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.