剛剛，OpenAI拿下IOI金牌，僅次于前五名人類選手！參賽推理模型才奪得IMO金牌

2025-08-12 09:14:00

在全球頂級編程賽事之一 ——2025 年國際信息學奧林匹克（IOI）中，OpenAI 的推理模型取得了足以摘得金牌的高分，并在 AI 參賽者中排名第一！

一覺醒來，OpenAI 的大模型又完成了一項壯舉！

在全球頂級編程賽事之一 ——2025 年國際信息學奧林匹克（IOI）中，OpenAI 的推理模型取得了足以摘得金牌的高分，并在 AI 參賽者中排名第一！

IOI 2025（即第 37 屆國際信息學奧林匹克）在玻利維亞的蘇克雷舉行，7 月 27 日正式開幕，并已于 8 月 3 日落下了帷幕。在此次賽事中，中國隊大獲全勝，全員金牌奪冠。

而就在不久前，OpenAI 剛剛在 IMO（國際數(shù)學奧林匹克競賽）2025 中拿到了金牌級別的成績。

在比賽中，OpenAI 參加了 IOI 的在線 AI 賽道，在 330 位人類參賽者中，所用推理模型的得分只落后于 5 位人類選手，拿下了 AI 參賽者中的 No 1。

與人類選手一樣，OpenAI 遵守了 5 小時答題時間和 50 次提交的限制。

同樣地，OpenAI 沒有使用互聯(lián)網(wǎng)或 RAG（檢索增強生成），僅能訪問一個基礎(chǔ)的終端工具。

OpenAI 使用了一組通用推理模型，并且沒有針對 IOI 進行專門的訓練。唯一的輔助策略是選擇要提交的解答，并與 IOI API 建立連接。

相較于去年 IOI 的表現(xiàn)，OpenAI 今年的這一成績實現(xiàn)了巨大飛躍。

去年，OpenAI 僅差一點就拿到了銅牌，并且當時依賴一個更加人工定制的測試策略。短短一年的時間，OpenAI 的成績就從第 49 百分位躍升到第 98 百分位！

過去幾周，OpenAI 在 AtCoder 世界總決賽、IMO 和 IOI 上都取得非常好的成績，展示了最新研究方法帶來的巨大進步，這些讓人非常興奮。OpenAI 正努力構(gòu)建更聰明、更強大的模型，未來將盡快將它們帶入主流產(chǎn)品中。

下圖為備戰(zhàn) IOI 2025 的團隊成員以及長期推動 OpenAI 競技編程的團隊成員。

OpenAI 聯(lián)合創(chuàng)始人、總裁 Greg Brockma 盛贊了此次 IOI 中自家模型「金牌級的表現(xiàn)」。

OpenAI 專注于多步推理、自博弈和多智能體 AI 的研究科學家 Noam Brown 表示，「重要的啟示是：我們在 IMO 上取得金牌的模型就是最好的競賽編程模型?！?/span>

他分享了更多的細節(jié)：在 IMO 結(jié)束后，他們對 IMO 金牌模型進行了全面評測，發(fā)現(xiàn)它不僅在競賽數(shù)學方面表現(xiàn)最佳，在包括編程在內(nèi)的許多其他領(lǐng)域也是最強的模型。

所以，團隊決定直接使用完全相同的 IMO 金牌模型，不做任何改動，將它應用到 IOI 競賽系統(tǒng)中。

IOI 比賽中的輔助策略包括：先從幾個不同的模型中采樣解答，然后再用另一個模型結(jié)合啟發(fā)式方法來篩選要提交的解答。最終獲得了金牌，在所有參賽選手中排名第 6。

事實證明，在 OpenAI 采樣的所有模型中，IMO 金牌模型的表現(xiàn)確實是最好的。

對于此次 OpenAI 在 IOI 賽事中取得金牌，網(wǎng)友感嘆到：沒有專門訓練就取得了這樣的成績，很了不起，這意味著通用推理能力正變得非常強大。

對于這個模型的「真身」，大家也是各種猜測。

也許正如下面這位網(wǎng)友所言，大家現(xiàn)在迫不及待想看到 OpenAI 推出采用在 IMO 和 IOI 2025 奪金推理模型的相同（或更強）技術(shù)的公開版本！看起來將會是又一次全方位的重大飛躍。

所以，OpenAI，別光顧著自夸，趕緊發(fā)布吧。

責任編輯：張燕妮來源：機器之心

偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p