剛剛,馬斯克Grok4干翻谷歌Gemini!o3殺入首屆大模型對抗賽決戰(zhàn)
首屆大模型國際象棋對抗賽,第二輪戰(zhàn)報出爐了!
Kaggle Game Arena上,谷歌舉辦的AI國際象棋表演賽中,Grok 4和o3順利挺進半決賽:
o3一舉擊敗o4-mini
Grok 4在加賽中戰(zhàn)勝Gemini 2.5 Pro,晉級決賽將迎戰(zhàn)o3

十幾個小時的激烈對決中,全球八大頂尖模型,如今僅剩下Grok 4和o3順利挺進半決賽。
在首輪對戰(zhàn)中,DeepSeek R1、Kimi K2 Instruct、Claude Opus 4、Gemini 2.5 Flash全部潰敗。

Kaggle Game Arena 2025 AI國際象棋表演賽:半決賽對陣圖
如今,第二輪的結果,再次篩選出了兩位優(yōu)勝者。
盡管o3的勝出早有預料,Grok與Gemini之間的對決卻異常激烈,常規(guī)賽戰(zhàn)成2比2后,最終通過加賽才分出勝負。

賽事的最后一日將在8月7日(星期四)舉行,開賽時間為美國東部時間下午1點(ET)。
屆時,國際象棋世界冠軍Magnus Carlsen與英國三連冠棋手David Howell攜手解說Grok 4對陣o3的巔峰對決。
傳送門:https://www.kaggle.com/game-arena
若是o3拿下最終冠軍,再加上萬眾矚目的GPT-5登場,OpenAI明天可謂是雙喜臨門。
那么,第二輪大模型對戰(zhàn),具體情況如何?
o3穩(wěn)贏o4-mini,準確率100%
根據(jù)OpenAI的介紹,o4-mini是o3的輕量化、運行更快的版本。
因此,o3以4比0橫掃對手晉級決賽,也在情理之中。
雖然這場比賽的初衷是研究AI的「思考」方式,但第二盤棋卻令不少普通棋迷眼前一亮:
o3在僅用12步的快棋中實現(xiàn)了一次類似Puzzle Rush的將殺,雖不是真正意義上的密殺(smothered mate),但完成度非常接近。

雖然AI在本賽事中的棋藝屢遭詬病,但o3在這盤棋中卻打出了100分的完美準確率:

o3 vs. o4-mini,準確率100分
本輪后續(xù)的比賽節(jié)奏也基本如出一轍:較弱的AI(此處為o4-mini)在中盤階段失去判斷力,連續(xù)犯下關鍵失誤。
不過值得一提的是第三盤,這可能是目前為止最自然、最接近人類風格的一局。
尤其是o3在棋局中完成的兩個中間手(intermezzo)——12...Bb4+和19...e3+,堪稱本輪亮點。

o3晉級決賽,將與另一場激戰(zhàn)的勝者會師。
Grok 4險些折戟,鏖戰(zhàn)Gemini 2.5 Pro
盡管Grok在賽事中的表現(xiàn)一直相當強勢,這次卻險些折戟。
最終,在加賽「末日戰(zhàn)」(Armageddon)中,Grok 4用黑棋在占優(yōu)局面下逼和對手,才得以晉級。

比賽伊始,Grok的表現(xiàn)出人意料地混亂,在短時間內(nèi)連續(xù)失子,被Gemini抓住機會贏下首局。
第二盤,雙方在第11步前一直遵循開局理論。
通常情況下,AI只要跟隨開局理論就表現(xiàn)不錯,一旦進入「自由發(fā)揮」階段,就容易出錯。
而Grok和Gemini的開局掌握明顯強于其他模型,也讓這場對決異常焦灼。
不過,Grok一旦脫離理論,很快就開始出錯——先是丟馬,但Gemini也隨即「走火入魔」,不但送出皇后,最后整盤棋也丟掉,Grok扳回一局。

接下來兩盤棋依然各有勝負,走的都是熟悉劇本:AI在短暫的「理論時間」后很快開始失誤。
Grok贏下第三局暫時領先,Gemini在第四局扳平比分。
比賽進入加賽環(huán)節(jié),采用「末日戰(zhàn)」規(guī)則,Grok執(zhí)黑,具有和棋即勝優(yōu)勢(雖然此次并無時間限制)。
加賽過程跌宕起伏。
Gemini曾長時間占優(yōu),甚至錯過了一步直接將死的機會——與o3擊敗o4-mini的那步棋型如出一轍。
國際象棋大師Peter Heine Nielsen(世界冠軍Magnus Carlsen的教練)也順勢對Grok給出了「指導建議」。

最終,Gemini在多子殘局中送掉皇后,看似已將勝利拱手相讓。
但Grok沒能把握優(yōu)勢,在多一車的局勢下未能完成絕殺,因三次重復局面被判和棋,比賽最終以平局告終。
盡管結局略顯遺憾,但這局仍被評為「今日最佳對局」。

第二輪比賽戰(zhàn)況就這么多,想必所有人都期待明日終局之戰(zhàn)——Grok與o3將于明天爭奪冠軍。
Gemini 2.5 Pro和o4-mini則將進行三四名對決。記得鎖定總決賽直播!






































