偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

剛剛,馬斯克Grok4干翻谷歌Gemini!o3殺入首屆大模型對抗賽決戰(zhàn)

人工智能 新聞
第二輪首屆大模型對抗賽結果出爐了!o3輕而易舉擊敗o4-mini,拿下100%勝率。Grok 4和Gemini 2.5 Pro激烈對決,最終在加賽中Grok 4成功晉級。明日,Grok 4和o3將迎來終局之戰(zhàn)。

首屆大模型國際象棋對抗賽,第二輪戰(zhàn)報出爐了!

Kaggle Game Arena上,谷歌舉辦的AI國際象棋表演賽中,Grok 4和o3順利挺進半決賽:

o3一舉擊敗o4-mini  

Grok 4在加賽中戰(zhàn)勝Gemini 2.5 Pro,晉級決賽將迎戰(zhàn)o3

圖片

十幾個小時的激烈對決中,全球八大頂尖模型,如今僅剩下Grok 4和o3順利挺進半決賽。

在首輪對戰(zhàn)中,DeepSeek R1、Kimi K2 Instruct、Claude Opus 4、Gemini 2.5 Flash全部潰敗。

圖片

Kaggle Game Arena 2025 AI國際象棋表演賽:半決賽對陣圖

如今,第二輪的結果,再次篩選出了兩位優(yōu)勝者。

盡管o3的勝出早有預料,Grok與Gemini之間的對決卻異常激烈,常規(guī)賽戰(zhàn)成2比2后,最終通過加賽才分出勝負。

圖片

賽事的最后一日將在8月7日(星期四)舉行,開賽時間為美國東部時間下午1點(ET)。

屆時,國際象棋世界冠軍Magnus Carlsen與英國三連冠棋手David Howell攜手解說Grok 4對陣o3的巔峰對決。

傳送門:https://www.kaggle.com/game-arena

若是o3拿下最終冠軍,再加上萬眾矚目的GPT-5登場,OpenAI明天可謂是雙喜臨門。

那么,第二輪大模型對戰(zhàn),具體情況如何?

o3穩(wěn)贏o4-mini,準確率100%

根據(jù)OpenAI的介紹,o4-mini是o3的輕量化、運行更快的版本。

因此,o3以4比0橫掃對手晉級決賽,也在情理之中。

雖然這場比賽的初衷是研究AI的「思考」方式,但第二盤棋卻令不少普通棋迷眼前一亮:

o3在僅用12步的快棋中實現(xiàn)了一次類似Puzzle Rush的將殺,雖不是真正意義上的密殺(smothered mate),但完成度非常接近。

圖片

雖然AI在本賽事中的棋藝屢遭詬病,但o3在這盤棋中卻打出了100分的完美準確率:

圖片

o3 vs. o4-mini,準確率100分

本輪后續(xù)的比賽節(jié)奏也基本如出一轍:較弱的AI(此處為o4-mini)在中盤階段失去判斷力,連續(xù)犯下關鍵失誤。

不過值得一提的是第三盤,這可能是目前為止最自然、最接近人類風格的一局。

尤其是o3在棋局中完成的兩個中間手(intermezzo)——12...Bb4+和19...e3+,堪稱本輪亮點。

圖片

o3晉級決賽,將與另一場激戰(zhàn)的勝者會師。

Grok 4險些折戟,鏖戰(zhàn)Gemini 2.5 Pro

盡管Grok在賽事中的表現(xiàn)一直相當強勢,這次卻險些折戟。

最終,在加賽「末日戰(zhàn)」(Armageddon)中,Grok 4用黑棋在占優(yōu)局面下逼和對手,才得以晉級。

圖片

比賽伊始,Grok的表現(xiàn)出人意料地混亂,在短時間內(nèi)連續(xù)失子,被Gemini抓住機會贏下首局。

第二盤,雙方在第11步前一直遵循開局理論。

通常情況下,AI只要跟隨開局理論就表現(xiàn)不錯,一旦進入「自由發(fā)揮」階段,就容易出錯。

而Grok和Gemini的開局掌握明顯強于其他模型,也讓這場對決異常焦灼。

不過,Grok一旦脫離理論,很快就開始出錯——先是丟馬,但Gemini也隨即「走火入魔」,不但送出皇后,最后整盤棋也丟掉,Grok扳回一局。

圖片

接下來兩盤棋依然各有勝負,走的都是熟悉劇本:AI在短暫的「理論時間」后很快開始失誤。

Grok贏下第三局暫時領先,Gemini在第四局扳平比分。

比賽進入加賽環(huán)節(jié),采用「末日戰(zhàn)」規(guī)則,Grok執(zhí)黑,具有和棋即勝優(yōu)勢(雖然此次并無時間限制)。

加賽過程跌宕起伏。

Gemini曾長時間占優(yōu),甚至錯過了一步直接將死的機會——與o3擊敗o4-mini的那步棋型如出一轍。

國際象棋大師Peter Heine Nielsen(世界冠軍Magnus Carlsen的教練)也順勢對Grok給出了「指導建議」。

圖片

最終,Gemini在多子殘局中送掉皇后,看似已將勝利拱手相讓。

但Grok沒能把握優(yōu)勢,在多一車的局勢下未能完成絕殺,因三次重復局面被判和棋,比賽最終以平局告終。

盡管結局略顯遺憾,但這局仍被評為「今日最佳對局」。

圖片

第二輪比賽戰(zhàn)況就這么多,想必所有人都期待明日終局之戰(zhàn)——Grok與o3將于明天爭奪冠軍。

Gemini 2.5 Pro和o4-mini則將進行三四名對決。記得鎖定總決賽直播!

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-08-05 15:11:36

AI模型象棋

2025-03-21 09:50:56

2025-08-11 14:12:35

GPT-4oAIGrok 4

2025-08-07 08:54:00

2024-09-02 08:30:00

大模型AI

2025-06-04 04:25:00

Claude 4ChatGPT o3模型

2025-08-07 09:05:00

2025-07-11 11:58:59

多智能體Grok 4AI

2024-03-18 14:17:06

大模型開源人工智能

2025-07-10 16:58:04

2024-03-12 13:14:40

2025-07-02 14:42:03

AI代碼模型

2025-08-25 08:54:00

2025-09-22 11:36:10

2025-08-04 08:40:00

2023-12-08 12:58:26

2025-09-19 09:10:00

2025-02-11 09:20:00

LLM模型AI

2025-07-15 18:08:04

2023-12-13 08:46:33

人工智能ChatGPT機器人
點贊
收藏

51CTO技術棧公眾號