![]()
20萬GPU打造的AI奇跡,能否顛覆行業(yè)?
科技旋渦編輯部
北京時間2月18日午間,馬斯克旗下人工智能初創(chuàng)公司xAI正式發(fā)布新一代聊天機器人Grok 3。馬斯克和他的人工智能團隊聲稱,Grok 3測試版的高級推理能力超過了現(xiàn)有的人工智能模型。
馬斯克這個號稱地表最聰明的AI,完美詮釋了什么叫“有錢任性”,只因其使用了20萬塊GPU訓練模型。那么,它真的能夠超越風頭正盛的DeepSeek和行業(yè)先鋒OpenAI嗎?
燒錢無數(shù)的Grok 3有多強?
在Grok 3的直播中,馬斯克等人介紹了Grok 3的訓練歷程。去年馬斯克劇透,Grok 3在10萬張H100上進行訓練,是首個達到如此訓練集群規(guī)模的模型。今天的發(fā)布會上又透露,到訓練進行到第92天時,集群規(guī)模擴展到了20萬卡。
![]()
Grok 3的實力也的確證明了,在當下這個時期,砸錢是一種巨大的優(yōu)勢。這一波Grok 3有滿血和mini兩個版本,在數(shù)學、科學、代碼等數(shù)據(jù)集上表現(xiàn)均超過了GPT-4o、DeepSeek-V3等非推理模型。
![]()
Grok-3 mini的性能基本上領先或媲美其他閉源/開源模型。在著名大模型LMSYS Arena排行榜中,Grok-3刷榜,Elo評分超1400位列最高,沒有任何一個模型能與之相比,堪稱斷層式領先。
![]()
xAI團隊還展示了Grok 3如何執(zhí)行有趣的任務。例如計算從地球到火星的航天器任務。Grok 3 生成了一張?zhí)瞻l(fā)射的動畫 3D 軌跡圖(即從地球到火星然后再返回地球的可行軌跡)。這涉及一些復雜的物理知識,Grok 3需要理解這些內容。
![]()
Grok 3還展示了在自動化游戲開發(fā)方面的潛力。xAI團隊要求Grok 3現(xiàn)場創(chuàng)造一款融合《俄羅斯方塊》和《寶石迷陣》的新游戲。Grok 3生成的Python腳本定義了游戲的常量、顏色、方塊形狀等元素,并呈現(xiàn)出獨特玩法:當連接了至少三個相同顏色的方塊時,會觸發(fā)重力機制使方塊消除,這種方式類似《寶石迷陣》。
此外,Grok 3包含一個名為Big Brain的功能,這是一個推理模型模式,允許在處理查詢時進行更深入的思考。馬斯克指出,17個月前,最初的Grok模型幾乎不能解決高中問題,而現(xiàn)在它已經(jīng)進步了很多,他幽默地比喻“Grok已經(jīng)準備好上大學了”。
性價比與猛砸錢,大模型的路該怎么走?
眾所周知,DeepSeek通過獨特的算法優(yōu)化、架構設計以及高效的資源利用方式,大幅降低了對英偉達高端GPU的依賴。這也致使英偉達股價暴跌16.97%,市值單日蒸發(fā)約5926.58億美元。
![]()
DeepSeek聲稱其模型訓練成本僅為同類模型的1/5至1/10,這意味著其在擺脫英偉達硬件束縛的情況下,仍然在推理性能等方面都表現(xiàn)出與ChatGPT-o1接近的能力,部分領域還有所超越。
反觀馬斯克的Grok 3不僅砸進去20萬塊GPU,更是為了盡快推出Grok 3,在短短四個月內建成數(shù)據(jù)中心。如此巨大的投入換來的也僅僅只是lmArena 排行榜中41分的提升,這真的值嗎?
![]()
事實上,馬斯克瘋狂砸錢的舉動或許有著提前布局的考量。當下,任何AI的訓練都離不開GPU,只不過DeepSeek走的是“精算師路線”——通過算法優(yōu)化,用行業(yè)1/10的成本實現(xiàn)90%的性能。而馬斯克的20萬塊GPU不僅是為了快速推出Grok 3,更可能是為了后續(xù)依舊保持快速迭代的選擇。
誠然,馬斯克的Grok 3的確超越了DeepSeek,但似乎更像是一個加強版,而非大跨度的領先。我們期待看到未來DeepSeek依舊能夠憑借超高的“性價比”再度震驚世界。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.