2025年11月18日,埃隆·馬斯克旗下人工智能公司xAI在全球同步發布了最新聊天機器人 Grok?4.1,并以免費全平臺的形式向公眾開放。該版本在發布當天即在多個權威基準榜單上實現“雙冠”——在 LMArena 文本競技場奪得全球第一,在 EQ?Bench3 情緒智能評測中奪得榜首,標志著 AI 領域的“王座”在一夜之間易主。
![]()
打開百度APP暢享高清圖片
靜默上線、免費全平臺
Grok?4.1 采用“靜默上線”方式,于2024年4月首次在網頁、iOS 與 Android 三端以 beta 版形式向用戶開放,隨后在本次發布會上宣布正式免費向所有人開放,用戶無需付費即可體驗其全部功能。xAI 團隊表示,此次升級在算力與訓練規模上實現了 一個數量級 的提升,采用了全新獎勵模型和大規模 RL 引擎,顯著提升了模型的響應速度與質量。
![]()
雙版本布局:Thinking 與標準版
本次發布的 Grok?4.1 包含兩大版本:
Grok?4.1 Thinking(代號 quasarflux),主打深度推理與復雜任務處理;
Grok?4.1(代號 tensor),側重對話流暢性與情感交互。
兩者在算力、幻覺率以及情緒智能方面均實現了顯著突破。與前代 Grok?4 相比,幻覺率下降了約 3 倍,FactScore 評估顯示事實準確性大幅提升。
![]()
基準成績搶占榜首
在 LMArena Text Arena 中,Grok?4.1 Thinking 以 1483?Elo 位居全球第一,領先競爭對手 Gemini?2.5?Pro 31 分;標準版以 1465?Elo 緊隨其后,位列第二。在 EQ?Bench3(情緒智能評測)中,Grok?4.1 獲得 1586?Elo,再次拔得頭籌。創意寫作基準 Creative Writing?v3 也顯示出 1722?Elo 的高分,較前代提升約 600 分,彰顯其在文本生成與創意表達方面的優勢。
![]()
智商+情商雙在線的核心競爭力
xAI 將 Grok4.1 定位為 “智商+情商雙在線” 的新一代對話模型。實驗數據顯示,在 64.78% 的使用場景中,用戶更傾向于選擇 Grok4.1;其在共情、情緒理解以及人際交互方面的表現尤為突出,情感交互滿意度提升約 22%。與此同時,非推理模式的輸出 Token 從約 2300 降至 850,響應速度顯著加快,仍保持高排名。
對標谷歌 Gemini,搶占先機
在 Gemini?3.0 尚未正式發布前,Grok?4.1 已率先登場并在多項基準上超越 Gemini?2.5?Pro,搶占了 AI 市場的先機。馬斯克在發布會上強調,Grok?4.1 的速度與品質提升是“用戶可以立刻感受到的”,并指出該模型在細微意圖感知、對話連貫性以及情感表達方面均實現了突破。
市場影響與未來展望
Grok?4.1 的免費全平臺策略迅速吸引了全球數百萬用戶注冊使用,短時間內在 LMArena 與 EQ?Bench 等平臺的活躍度激增。業內分析人士認為,xAI 此舉不僅提升了其在大模型競爭格局中的話語權,也對谷歌、OpenAI 等傳統巨頭形成了強有力的挑戰。隨著后續版本的迭代與功能擴展,Grok 系列有望在企業級應用、教育輔導以及內容創作等多個場景繼續保持領先。
結語:Grok?4.1 通過算力升級、獎勵模型創新以及情緒智能的雙重強化,實現了在多個權威基準上的“雙冠”成績,并以免費全平臺的方式快速占領用戶市場,標志著 AI 領域的競爭格局正在發生深刻變化。xAI 未來的技術路線與生態布局值得業界持續關注。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.