網易首頁 > 網易號 > 正文申請入駐

馬斯克花錢砸出的Grok 3，超越DeepSeek與OpenAI？

2025-02-18 19:20:45　來源: 科技旋渦

北京舉報

分享至

20萬GPU打造的AI奇跡，能否顛覆行業？

科技旋渦編輯部

北京時間2月18日午間，馬斯克旗下人工智能初創公司xAI正式發布新一代聊天機器人Grok 3。馬斯克和他的人工智能團隊聲稱，Grok 3測試版的高級推理能力超過了現有的人工智能模型。

馬斯克這個號稱地表最聰明的AI，完美詮釋了什么叫“有錢任性”，只因其使用了20萬塊GPU訓練模型。那么，它真的能夠超越風頭正盛的DeepSeek和行業先鋒OpenAI嗎?

燒錢無數的Grok 3有多強?

在Grok 3的直播中，馬斯克等人介紹了Grok 3的訓練歷程。去年馬斯克劇透，Grok 3在10萬張H100上進行訓練，是首個達到如此訓練集群規模的模型。今天的發布會上又透露，到訓練進行到第92天時，集群規模擴展到了20萬卡。

Grok 3的實力也的確證明了，在當下這個時期，砸錢是一種巨大的優勢。這一波Grok 3有滿血和mini兩個版本，在數學、科學、代碼等數據集上表現均超過了GPT-4o、DeepSeek-V3等非推理模型。

Grok-3 mini的性能基本上領先或媲美其他閉源/開源模型。在著名大模型LMSYS Arena排行榜中，Grok-3刷榜，Elo評分超1400位列最高，沒有任何一個模型能與之相比，堪稱斷層式領先。

xAI團隊還展示了Grok 3如何執行有趣的任務。例如計算從地球到火星的航天器任務。Grok 3 生成了一張太空發射的動畫 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復雜的物理知識，Grok 3需要理解這些內容。

Grok 3還展示了在自動化游戲開發方面的潛力。xAI團隊要求Grok 3現場創造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素，并呈現出獨特玩法：當連接了至少三個相同顏色的方塊時，會觸發重力機制使方塊消除，這種方式類似《寶石迷陣》。

此外，Grok 3包含一個名為Big Brain的功能，這是一個推理模型模式，允許在處理查詢時進行更深入的思考。馬斯克指出，17個月前，最初的Grok模型幾乎不能解決高中問題，而現在它已經進步了很多，他幽默地比喻“Grok已經準備好上大學了”。

性價比與猛砸錢，大模型的路該怎么走?

眾所周知，DeepSeek通過獨特的算法優化、架構設計以及高效的資源利用方式，大幅降低了對英偉達高端GPU的依賴。這也致使英偉達股價暴跌16.97%，市值單日蒸發約5926.58億美元。

DeepSeek聲稱其模型訓練成本僅為同類模型的1/5至1/10，這意味著其在擺脫英偉達硬件束縛的情況下，仍然在推理性能等方面都表現出與ChatGPT-o1接近的能力，部分領域還有所超越。

反觀馬斯克的Grok 3不僅砸進去20萬塊GPU，更是為了盡快推出Grok 3，在短短四個月內建成數據中心。如此巨大的投入換來的也僅僅只是lmArena 排行榜中41分的提升，這真的值嗎?

事實上，馬斯克瘋狂砸錢的舉動或許有著提前布局的考量。當下，任何AI的訓練都離不開GPU，只不過DeepSeek走的是“精算師路線”——通過算法優化，用行業1/10的成本實現90%的性能。而馬斯克的20萬塊GPU不僅是為了快速推出Grok 3，更可能是為了后續依舊保持快速迭代的選擇。

誠然，馬斯克的Grok 3的確超越了DeepSeek，但似乎更像是一個加強版，而非大跨度的領先。我們期待看到未來DeepSeek依舊能夠憑借超高的“性價比”再度震驚世界。

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.