剛剛,OpenAI拿下IOI金牌,僅次于前五名人類選手!參賽推理模型才奪得IMO金牌
一覺醒來,OpenAI 的大模型又完成了一項壯舉!
在全球頂級編程賽事之一 ——2025 年國際信息學奧林匹克(IOI)中,OpenAI 的推理模型取得了足以摘得金牌的高分,并在 AI 參賽者中排名第一!
IOI 2025(即第 37 屆國際信息學奧林匹克)在玻利維亞的蘇克雷舉行,7 月 27 日正式開幕,并已于 8 月 3 日落下了帷幕。在此次賽事中,中國隊大獲全勝,全員金牌奪冠。
而就在不久前,OpenAI 剛剛在 IMO(國際數(shù)學奧林匹克競賽)2025 中拿到了金牌級別的成績。

在比賽中,OpenAI 參加了 IOI 的在線 AI 賽道,在 330 位人類參賽者中,所用推理模型的得分只落后于 5 位人類選手,拿下了 AI 參賽者中的 No 1。
與人類選手一樣,OpenAI 遵守了 5 小時答題時間和 50 次提交的限制。
同樣地,OpenAI 沒有使用互聯(lián)網(wǎng)或 RAG(檢索增強生成),僅能訪問一個基礎(chǔ)的終端工具。

OpenAI 使用了一組通用推理模型,并且沒有針對 IOI 進行專門的訓練。唯一的輔助策略是選擇要提交的解答,并與 IOI API 建立連接。
相較于去年 IOI 的表現(xiàn),OpenAI 今年的這一成績實現(xiàn)了巨大飛躍。
去年,OpenAI 僅差一點就拿到了銅牌,并且當時依賴一個更加人工定制的測試策略。短短一年的時間,OpenAI 的成績就從第 49 百分位躍升到第 98 百分位!
過去幾周,OpenAI 在 AtCoder 世界總決賽、IMO 和 IOI 上都取得非常好的成績,展示了最新研究方法帶來的巨大進步,這些讓人非常興奮。OpenAI 正努力構(gòu)建更聰明、更強大的模型,未來將盡快將它們帶入主流產(chǎn)品中。
下圖為備戰(zhàn) IOI 2025 的團隊成員以及長期推動 OpenAI 競技編程的團隊成員。

OpenAI 聯(lián)合創(chuàng)始人、總裁 Greg Brockma 盛贊了此次 IOI 中自家模型「金牌級的表現(xiàn)」。

OpenAI 專注于多步推理、自博弈和多智能體 AI 的研究科學家 Noam Brown 表示,「重要的啟示是:我們在 IMO 上取得金牌的模型就是最好的競賽編程模型?!?/span>
他分享了更多的細節(jié):在 IMO 結(jié)束后,他們對 IMO 金牌模型進行了全面評測,發(fā)現(xiàn)它不僅在競賽數(shù)學方面表現(xiàn)最佳,在包括編程在內(nèi)的許多其他領(lǐng)域也是最強的模型。
所以,團隊決定直接使用完全相同的 IMO 金牌模型,不做任何改動,將它應用到 IOI 競賽系統(tǒng)中。
IOI 比賽中的輔助策略包括:先從幾個不同的模型中采樣解答,然后再用另一個模型結(jié)合啟發(fā)式方法來篩選要提交的解答。最終獲得了金牌,在所有參賽選手中排名第 6。
事實證明,在 OpenAI 采樣的所有模型中,IMO 金牌模型的表現(xiàn)確實是最好的。


對于此次 OpenAI 在 IOI 賽事中取得金牌,網(wǎng)友感嘆到:沒有專門訓練就取得了這樣的成績,很了不起,這意味著通用推理能力正變得非常強大。

對于這個模型的「真身」,大家也是各種猜測。

也許正如下面這位網(wǎng)友所言,大家現(xiàn)在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 奪金推理模型的相同(或更強)技術(shù)的公開版本!看起來將會是又一次全方位的重大飛躍。

所以,OpenAI,別光顧著自夸,趕緊發(fā)布吧。







































