谷歌發(fā)起的 AI 象棋賽首日戰(zhàn)況：Grok 統(tǒng)治全場，Kimi 違規(guī)四連敗，Claude 迷失殘局！

2025-08-06 14:49:35　來源: 大數(shù)據(jù)文摘

北京舉報(bào)

分享至

大數(shù)據(jù)文摘出品

在Google旗下Kaggle平臺主辦的“棋局競技場”中，一場AI國際象棋比賽正在展開。

參與者不是Stockfish或AlphaZero這樣的專業(yè)引擎，而是八個大型語言模型（LLM）：Grok 4、Gemini 2.5 Pro、o4-mini、o3、Claude 4 Opus、DeepSeek R1、Gemini 2.5 Flash和Kimi k2。

比賽規(guī)則簡單直接——單敗淘汰制。每局比賽，AI有四次機(jī)會做出合法走子，四次失敗即告負(fù)。

不比誰“算力強(qiáng)”，而是要看誰更能理解、分析并解決問題。

這是一場對AI通用智能（AGI）未來潛力的探索試驗(yàn)。

01 橫掃四場，Grok 4領(lǐng)跑全場

在8月5日首日四場對決中，四場全是4比0橫掃，沒有任何懸念。Grok 4擊敗Gemini 2.5 Flash，以全勝之姿晉級四強(qiáng)。

不僅贏得干凈利落，更展現(xiàn)了全場最具邏輯性的走法。

在對局中，Grok 4不斷識別對手的漏子，并迅速發(fā)起攻擊，每一分都帶著“計(jì)算后的獵殺”感。

相比其他模型依賴模板式開局和反應(yīng)式走子，Grok 4則像是在做一場目標(biāo)清晰的圍獵。

Gemini 2.5 Flash的失誤固然給了機(jī)會，但Grok 4真正讓人驚訝的是它的策略意識和位置判斷力。

即使是在沒有開局庫、沒有輔助引擎的純思維對弈中，Grok 4也表現(xiàn)出令人意外的棋局掌控力。

與此同時(shí)，Gemini 2.5 Pro也以4比0戰(zhàn)勝Claude 4 Opus晉級。

這組對局中出現(xiàn)了更多“合法走子”的回合，也出現(xiàn)了數(shù)次由棋局終結(jié)的真正“將死”，而非判負(fù)。

其中最令人印象深刻的是第四局，Gemini 2.5 Pro在局面占優(yōu)的情況下，仍舊犯下了幾個不該有的“送子”失誤。

即使如此，它依然靠兩后強(qiáng)勢將死對手，保住了勝果。不過，從比賽內(nèi)容來看，Claude 4 Opus的表現(xiàn)明顯更為混亂。

在第一局，它在第十步選擇“g5”，主動暴露王翼，直接加速敗局。評論指出：“Claude 4 Opus看上去知道一些戰(zhàn)術(shù)，但局勢一變，它就像陷入迷霧。”

DeepSeek R1對陣o4-mini的比賽更像是一場“幻覺測試”。

開局階段，雙方都能給出幾步強(qiáng)有力的操作。但進(jìn)入中局，DeepSeek R1反復(fù)犯下“看錯棋盤”的錯誤。

在一盤中，它甚至試圖將馬移到一個不存在的位置。盡管如此，o4-mini仍然完成了兩次“實(shí)打?qū)崱钡膶⑺?/strong>，成為唯一在一場比賽中完成兩次將死的AI。

o4-mini因此拿下4分，晉級下一輪。

最混亂的對局來自o3與Kimi k2的交手。Kimi k2沒有在任何一局中完成超過8步的對弈。

它連續(xù)四次在第四次嘗試時(shí)下出非法棋，自動判負(fù)。從注釋來看，Kimi k2的確懂得一些開局套路。

但一旦脫離開局庫，它便徹底迷失方向，甚至連車、象的走法都記錯。不是不會下棋，而是“忘了規(guī)則”。

這讓人對它的訓(xùn)練數(shù)據(jù)和邏輯能力產(chǎn)生疑問。

03 AI的弱點(diǎn)，暴露在棋盤上

比賽成了一面“照妖鏡”。從棋盤的表現(xiàn)看，大部分AI模型在以下三個方面表現(xiàn)不佳：

第一，無法完整“視覺化”整盤棋。許多AI看得見棋子，卻無法判斷整體布局關(guān)系。

第二，缺乏“因果理解”的連續(xù)性。一個子被吃了之后，AI往往不能明白其位置失守的后果，下一步仍會把王送進(jìn)敵人攻擊線。

第三，合法走子頻頻出錯。不僅僅是“不會”，而是“記不得”。Kimi k2在每盤中失敗的方式幾乎完全一樣：連續(xù)四次下出非法走子。

而這不是引擎限制，而是理解能力薄弱的體現(xiàn)。相比之下，Grok 4在這三方面都展現(xiàn)出極強(qiáng)的適應(yīng)力。它能識別未被保護(hù)的棋子，能計(jì)算簡單戰(zhàn)術(shù)，也沒有出現(xiàn)非法走子的情況。

這場比賽仍在繼續(xù)。8月6日，將迎來半決賽。

四強(qiáng)對陣如下：Grok 4 vs Gemini 2.5 Pro，o4-mini vs o3。

誰會最終登頂尚不得而知，但從首日表現(xiàn)來看，Grok 4無疑是目前的最大熱門。

比賽官網(wǎng)：https://www.chess.com/news/view/kaggle-game-arena-chess-2025-day-1

作者長期關(guān)注 AI 產(chǎn)業(yè)與學(xué)術(shù)，歡迎對這些方向感興趣的朋友添加微信Q1yezi，共同交流行業(yè)動態(tài)與技術(shù)趨勢！

GPU 訓(xùn)練特惠！

H100/H200 GPU算力按秒計(jì)費(fèi)，平均節(jié)省開支30%以上！

掃碼了解詳情?

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

/閱讀下一篇/

返回網(wǎng)易首頁下載網(wǎng)易新聞客戶端

相關(guān)推薦

熱點(diǎn)推薦

谷歌Gemini上線AI音樂創(chuàng)作，一夜革了Suno的命！

新智元 2026-02-19 12:39:23
2 跟貼 2

谷歌再掀AI戰(zhàn)火：Gemini上線音樂模型一句話即可生成歌曲

財(cái)聯(lián)社 2026-02-19 03:42:17
17 跟貼 17

印度一大學(xué)拿中國機(jī)器狗冒充自研

環(huán)球時(shí)報(bào) 2026-02-18 16:09:05
2162 跟貼 2162

Claude最強(qiáng)Sonnet模型4.6來了，百萬token上下文

機(jī)器之心Pro 2026-02-18 21:11:29
2 跟貼 2

45億紅包打響AI入口大戰(zhàn)，百度給出另一種回應(yīng)

量子位 2026-02-19 17:54:22
0 跟貼 0

春晚之后，AI和機(jī)器人為啥都去了一個地方？

量子位 2026-02-19 12:40:49
5 跟貼 5

內(nèi)蒙古草原名場面！狼偷不著羊，就跟藏獒貼貼，網(wǎng)友：前狼假寐，蓋以誘敵

BRTV新聞 2026-02-19 07:15:56
148 跟貼 148

氣大爺掀棋盤171局，炮兵拿下一大片，大師棋藝簡直是爐火純青

棋客象棋 2026-02-15 13:33:59
16 跟貼 16

棋仙鐘珍對弈日本棋王，十步絕殺！

古籍修復(fù)手札 2026-02-19 06:10:43
0 跟貼 0

近日，青海。車主自駕青海遇男子招手搭車，男子去快遞站給孩子們?nèi)∵^冬物資，車主好心送男子去學(xué)校，車主：

中安在線 2026-02-18 22:00:26
122 跟貼 122

勝率高手五進(jìn)一挑戰(zhàn)帽子哥！

卿何薄命l 2026-02-16 09:59:39
13 跟貼 13

奇兵種對決！柳大華死磕攻防高手！

象棋王闖 2026-02-15 20:32:48
0 跟貼 0

氣大爺掀棋盤168局，連殺反連殺，高手過招讓人心驚膽寒

棋客象棋 2026-02-17 11:24:20
33 跟貼 33

公園象棋攤：精彩對弈現(xiàn)場

淺笑撫琴弦x 2026-02-18 06:02:50
0 跟貼 0

胡榮華戰(zhàn)洪智，雙車脅士鎖喉絕殺！

象棋王闖 2026-02-15 20:32:44
0 跟貼 0

1850億豪賭硬件生態(tài)！Google I/O 2026定檔，Gemini 可穿戴將有新突破？

鈦媒體APP 2026-02-19 10:14:08
2 跟貼 2

匈牙利、斯洛伐克宣布暫停向?yàn)蹩颂m出口柴油

財(cái)聯(lián)社 2026-02-18 23:58:05
2367 跟貼 2367

這棋專治暴脾氣，玩之前看好醫(yī)院位置，免得突發(fā)狀況

品茶悟浮沉 2026-02-16 01:44:59
6 跟貼 6

女兒、孫子兩顆棋子，老杜更疼誰？

蜻蜓世音 2026-02-16 18:03:34
48 跟貼 48

《使命召喚：戰(zhàn)區(qū)手游》今年4月17日停服

3DM游戲 2026-02-19 08:28:05
1 跟貼 1

三招苦肉計(jì)失效，柳大華強(qiáng)勢碾壓！

象棋王闖 2026-02-15 20:32:42
11 跟貼 11

馬年吉祥事業(yè)旺

舊書改造工坊 2026-02-19 09:05:30
0 跟貼 0

媒體：馬克龍真魔怔了在印度還暗戳戳提中國

澎湃新聞 2026-02-18 22:58:24
1733 跟貼 1733

哐哐棄子，氣吞山河

斗魚主播象棋死神 2026-02-16 07:00:28
0 跟貼 0

【美股盤前】黃仁勛：為GTC 2026準(zhǔn)備了多款前所未見的新芯片；英偉達(dá)清倉Arm全部股份；Meta重啟智能手表計(jì)劃，計(jì)劃2026年推出；OpenAI最

每日經(jīng)濟(jì)新聞 2026-02-19 17:52:31
0 跟貼 0

氣大爺掀棋盤173局，炮低兵拿下一大片，大師手段實(shí)在是高明

棋客象棋 2026-02-16 12:42:14
2 跟貼 2

氣大爺掀棋盤176局，三個小卒詭計(jì)多端，大師用絕妙手段拿下

棋客象棋 2026-02-19 13:35:34
0 跟貼 0

如何布局“脫譜屏風(fēng)馬”破士抽車？中炮過河車最容易上套，妙哉

星哥講棋 2026-02-18 15:47:41
6 跟貼 6

2026年五羊杯象棋賽，陸偉韜大戰(zhàn)吳魏，光腳的不怕穿鞋的

依笑而鐹 2026-02-18 02:54:15
3 跟貼 3

布局陷阱如同深水冰！紅炮炮口與黑炮炮口面對面卻不敢吭聲，窩囊

星哥講棋 2026-02-17 15:08:14
5 跟貼 5

氣大爺掀棋盤174局，大師巧妙排兵布陣，贏得實(shí)在是漂亮

棋客象棋 2026-02-16 14:21:49
8 跟貼 8

如何布局“左馬盤河”精細(xì)陷阱？每當(dāng)對手走屏風(fēng)馬，只有矛沒有盾

星哥講棋 2026-02-16 13:23:15
6 跟貼 6

胖子嘲笑對手不會踢球，開局就被虐慘

快樂追劇吧 2026-02-19 15:53:41
1 跟貼 1

民間棋王遭笑笑斬盡殺絕，直播高潮迭起

一往情深a 2026-02-18 11:09:38
0 跟貼 0

反向過年新潮流：老外扎堆來中國，單日飛三亞外國游客大增3倍

每日經(jīng)濟(jì)新聞 2026-02-15 11:30:33
2624 跟貼 2624

背水一戰(zhàn)，狹路亮劍

斗魚主播象棋死神 2026-02-19 07:43:22
1 跟貼 1

圍棋經(jīng)典“一車十子寒”挑戰(zhàn)

霧以淚聚i 2026-02-19 10:16:35
1 跟貼 1

《鏢人》：天下誰人不是棋子，戳穿所有成年人的江湖

刀馬物語 2026-02-19 07:50:21
4 跟貼 4

美國開始出手！一周挖走4名中國頂尖人才，年薪1個億美元令人咋舌

烽火觀察 2026-02-19 11:41:25
0 跟貼 0

單板滑雪男子坡障技巧預(yù)賽，蘇翊鳴首輪穩(wěn)健開局

咪咕體育 2026-02-17 12:07:44
0 跟貼 0

伊朗國防部隊(duì)：進(jìn)入全面?zhèn)鋺?zhàn)狀態(tài)
每日經(jīng)濟(jì)新聞
2026-02-19 16:07:49

意大利知名地標(biāo)“愛情拱門”突然崩塌，永久消失，當(dāng)?shù)厥虚L：曾有成千上萬的情侶來打卡，旅游業(yè)遭“毀滅性打擊”
大風(fēng)新聞
2026-02-17 19:26:03

南京一商場晚上突發(fā)火災(zāi)，看電影的觀眾緊急逃生，應(yīng)急部門：火已撲滅，無人傷亡
極目新聞
2026-02-19 12:49:48

浙江一地通知：即日起全域禁止銷售
都市快報(bào)橙柿互動
2026-02-19 17:58:37

后續(xù)，江蘇一家人吃飯父親酒后掀桌，兒子透露更多，以后不回家了
離離言幾許
2026-02-18 23:24:35

第3金還要耐心等待！天公不作美，中國隊(duì)冬奧熱門沖金項(xiàng)再次延期
全景體育V
2026-02-19 10:10:31

南方大米產(chǎn)量第一，為啥超市里大部分還是東北米？南方米去哪了？
天下十三洲獵奇
2026-02-18 23:53:55

突發(fā)！美國出手封殺多家中國機(jī)構(gòu)
芯火相承
2026-02-19 10:02:18

42歲王濛再破天花板！退役12年，再次讓李琰和整個冰壇“沉默”了
翰飛觀事
2026-02-16 11:29:39

林丹在西班牙過年，別墅內(nèi)景曝光，全家人與朋友除夕吃海鮮大餐
手工制作阿殲
2026-02-19 11:58:33

再立新功！俄價(jià)值超1.2億美元的S-300VM與道爾防空系統(tǒng)遭摧毀
軍迷戰(zhàn)情室
2026-02-18 23:58:09

2018年，張扣扣向王家復(fù)仇，唯獨(dú)不殺王自新妻子：她有不死的理由
米果說識
2026-02-19 09:32:34

凌晨發(fā)送恐嚇信息？桔子酒店涉事門店：已報(bào)警，非員工發(fā)送
大風(fēng)新聞
2026-02-19 09:46:23

12死！湖北煙花店爆炸：店主身份被扒，大量內(nèi)幕披露，知情者發(fā)聲
博士觀察
2026-02-19 00:06:41

2月17日俄烏最新： 2.5 年來的最大戰(zhàn)果
西樓飲月
2026-02-17 20:49:47

湖北12死煙花爆燃：死者身份公布，大量內(nèi)部照流出，責(zé)任人被控制
博士觀察
2026-02-19 11:41:09

尹錫悅庭審細(xì)節(jié)曝光：被判無期只瞥了一眼法官，離庭時(shí)與律師相視一笑！法官闡述為何不判死刑
紅星新聞
2026-02-19 17:28:30

太尷尬了！大年初一，上海網(wǎng)友哭訴稱大門被鄰居貼兩張“大字報(bào)”
火山詩話
2026-02-19 15:05:12

襄陽宜城煙花店才50多平米，要了12條人命！最害人的，或是防盜網(wǎng)
火山詩話
2026-02-19 13:50:13

坐3.6億飛機(jī)，戴1000萬名表，拿5000萬炒股的秦奮究竟什么背景
涵豆說娛
2026-01-19 17:21:55

2026-02-19 18:43:00