網易首頁 > 網易號 > 正文申請入駐

馬斯克xAI全新旗艦?Grok?4.1?登頂LMArena?AI榜首，雙冠封王搶占AI王座！

2025-11-18 20:35:09　來源: 新網科技

上海舉報

分享至

2025年11月18日，埃隆·馬斯克旗下人工智能公司xAI在全球同步發布了最新聊天機器人 Grok?4.1，并以免費全平臺的形式向公眾開放。該版本在發布當天即在多個權威基準榜單上實現“雙冠”——在 LMArena 文本競技場奪得全球第一，在 EQ?Bench3 情緒智能評測中奪得榜首，標志著 AI 領域的“王座”在一夜之間易主。

打開百度APP暢享高清圖片

靜默上線、免費全平臺

Grok?4.1 采用“靜默上線”方式，于2024年4月首次在網頁、iOS 與 Android 三端以 beta 版形式向用戶開放，隨后在本次發布會上宣布正式免費向所有人開放，用戶無需付費即可體驗其全部功能。xAI 團隊表示，此次升級在算力與訓練規模上實現了一個數量級的提升，采用了全新獎勵模型和大規模 RL 引擎，顯著提升了模型的響應速度與質量。

雙版本布局：Thinking 與標準版

本次發布的 Grok?4.1 包含兩大版本：

Grok?4.1 Thinking（代號 quasarflux），主打深度推理與復雜任務處理；

Grok?4.1（代號 tensor），側重對話流暢性與情感交互。

兩者在算力、幻覺率以及情緒智能方面均實現了顯著突破。與前代 Grok?4 相比，幻覺率下降了約 3 倍，FactScore 評估顯示事實準確性大幅提升。

基準成績搶占榜首

在 LMArena Text Arena 中，Grok?4.1 Thinking 以 1483?Elo 位居全球第一，領先競爭對手 Gemini?2.5?Pro 31 分；標準版以 1465?Elo 緊隨其后，位列第二。在 EQ?Bench3（情緒智能評測）中，Grok?4.1 獲得 1586?Elo，再次拔得頭籌。創意寫作基準 Creative Writing?v3 也顯示出 1722?Elo 的高分，較前代提升約 600 分，彰顯其在文本生成與創意表達方面的優勢。

智商+情商雙在線的核心競爭力

xAI 將 Grok4.1 定位為 “智商+情商雙在線” 的新一代對話模型。實驗數據顯示，在 64.78% 的使用場景中，用戶更傾向于選擇 Grok4.1；其在共情、情緒理解以及人際交互方面的表現尤為突出，情感交互滿意度提升約 22%。與此同時，非推理模式的輸出 Token 從約 2300 降至 850，響應速度顯著加快，仍保持高排名。

對標谷歌 Gemini，搶占先機

在 Gemini?3.0 尚未正式發布前，Grok?4.1 已率先登場并在多項基準上超越 Gemini?2.5?Pro，搶占了 AI 市場的先機。馬斯克在發布會上強調，Grok?4.1 的速度與品質提升是“用戶可以立刻感受到的”，并指出該模型在細微意圖感知、對話連貫性以及情感表達方面均實現了突破。

市場影響與未來展望

Grok?4.1 的免費全平臺策略迅速吸引了全球數百萬用戶注冊使用，短時間內在 LMArena 與 EQ?Bench 等平臺的活躍度激增。業內分析人士認為，xAI 此舉不僅提升了其在大模型競爭格局中的話語權，也對谷歌、OpenAI 等傳統巨頭形成了強有力的挑戰。隨著后續版本的迭代與功能擴展，Grok 系列有望在企業級應用、教育輔導以及內容創作等多個場景繼續保持領先。

結語：Grok?4.1 通過算力升級、獎勵模型創新以及情緒智能的雙重強化，實現了在多個權威基準上的“雙冠”成績，并以免費全平臺的方式快速占領用戶市場，標志著 AI 領域的競爭格局正在發生深刻變化。xAI 未來的技術路線與生態布局值得業界持續關注。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.