偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

ICPC總決賽被AI統(tǒng)治!GPT-5組合系統(tǒng)12題全對(duì)登頂,人類打破頭只能爭(zhēng)奪第三

人工智能
在剛剛結(jié)束的2025年國(guó)際大學(xué)程序設(shè)計(jì)競(jìng)賽(ICPC)世界總決賽上,OpenAI的系統(tǒng)完美解決全部12道題目,若計(jì)入排名將位居第一。

這屆大學(xué)生太難了,好不容易拼進(jìn)編程競(jìng)賽總決賽,還要被AI秀一臉。

在剛剛結(jié)束的2025年國(guó)際大學(xué)程序設(shè)計(jì)競(jìng)賽(ICPC)世界總決賽上,OpenAI的系統(tǒng)完美解決全部12道題目,若計(jì)入排名將位居第一。

谷歌的Gemini 2.5 Deep Think模型解決10道題目,達(dá)到金牌水準(zhǔn)名列第二。

圖片圖片

這場(chǎng)頂級(jí)賽事匯集了來(lái)自全球103個(gè)國(guó)家、近3000所大學(xué)的139支頂尖隊(duì)伍。

而AI系統(tǒng)在ICPC官方監(jiān)督的獨(dú)立“AI實(shí)驗(yàn)賽道”中,與人類選手面對(duì)相同題目和評(píng)測(cè)標(biāo)準(zhǔn),表現(xiàn)非常搶眼。

其中比較難的一道“問題C”,沒有一個(gè)大學(xué)團(tuán)隊(duì)能夠解決,Gemini和OpenAI的模型組合都解決了。

圖片圖片

谷歌不知出于什么原因,還比人類選手晚10分鐘才啟動(dòng)系統(tǒng),就有點(diǎn)過(guò)分了啊。

OpenAI滿分奪魁,給GPT-5配了強(qiáng)力外援

OpenAI這次派出的是GPT-5和一個(gè)實(shí)驗(yàn)性推理模型的組合陣容。在不到五小時(shí)的比賽時(shí)間里,這套系統(tǒng)成功解決了全部12道題目。

具體來(lái)說(shuō),GPT-5獨(dú)立完成了前11道題目,而且其中11道題都是一次提交就通過(guò)了ICPC官方的在線評(píng)測(cè)環(huán)境。

圖片圖片

對(duì)OpenAI系統(tǒng)來(lái)說(shuō),最有挑戰(zhàn)的是問題G,由實(shí)驗(yàn)性推理模型在GPT-5遇到困難后接力完成,兩個(gè)模型總共提交了9次才攻克這道難題。

人類選手中也只有第一名圣彼得堡國(guó)立大學(xué)團(tuán)隊(duì)在3次嘗試中解決,很多大學(xué)團(tuán)隊(duì)一次都沒有提交過(guò)這個(gè)問題。

圖片圖片

OpenAI暫沒有分享這道題的解決思路,但他們特別強(qiáng)調(diào)參賽的是通用推理模型,并沒有專門為ICPC進(jìn)行訓(xùn)練。

另外值得一提的是,OpenAI團(tuán)隊(duì)中有不少研究員本身就是ICPC的參賽選手出身,包括接任Ilya首席科學(xué)家Jakub Pachocki,關(guān)于他的故事可以看奧特曼:點(diǎn)名表?yè)P(yáng)兩個(gè)波蘭人,OpenAI還沒遇到過(guò)他們解決不了的問題。

此時(shí)距離OpenAI首次推出推理模型o1差不多剛好一年,與一年前相比,現(xiàn)在的推理模型不僅更智能、更快速,而且成本效益更高了。

谷歌Gemini獨(dú)立解決難題

谷歌Gemini 2.5 Deep Think在比賽開始10分鐘后啟動(dòng),最終在五小時(shí)內(nèi)成功解決了12道題目中的10道,達(dá)到了金牌級(jí)別。

Gemini在前45分鐘內(nèi)就解決了8道題目,三小時(shí)內(nèi)又攻克了兩道,按照總用時(shí)677分鐘計(jì)算,若與大學(xué)隊(duì)伍比較,Gemini的成績(jī)將排在第二位。

下圖中,Gemini解決問題的時(shí)間以藍(lán)色顯示,最快的大學(xué)隊(duì)伍所用時(shí)間以灰色顯示。

圖片圖片

對(duì)于人類選手沒解決的問題C,谷歌分享了解題思路。

這道題要求設(shè)計(jì)一個(gè)通過(guò)相互連接的管道網(wǎng)絡(luò)向儲(chǔ)存庫(kù)分配液體的方案,目標(biāo)是找到一種配置使所有儲(chǔ)存庫(kù)盡快填滿。

由于每個(gè)管道可以打開、關(guān)閉或部分打開,可能的配置數(shù)量是無(wú)限的,這使得搜索最優(yōu)配置變得極其困難。

圖片圖片

Gemini的解決方案:

它首先假設(shè)每個(gè)儲(chǔ)存庫(kù)都有一個(gè)“優(yōu)先級(jí)值”,代表相對(duì)于其他儲(chǔ)存庫(kù)應(yīng)該優(yōu)先考慮的程度。

當(dāng)給定一組優(yōu)先級(jí)值時(shí),可以使用動(dòng)態(tài)規(guī)劃算法找到管道的最佳配置通過(guò)應(yīng)用極小化極大定理,原始問題可以通過(guò)尋找使結(jié)果流量最受約束的優(yōu)先級(jí)值來(lái)解決。

利用優(yōu)先級(jí)值和最優(yōu)流量之間的關(guān)系,Gemini使用嵌套三元搜索在碗狀凸解空間中快速找到最優(yōu)優(yōu)先級(jí)值,成功解決了問題C。

谷歌DeepMind表示,Gemini的成功融合了預(yù)訓(xùn)練、后訓(xùn)練、新型強(qiáng)化學(xué)習(xí)技術(shù)、多步推理和并行思維等一系列技術(shù)進(jìn)展。

在強(qiáng)化學(xué)習(xí)過(guò)程中,他們訓(xùn)練Gemini為編程界面臨的一些最困難的問題進(jìn)行推理和生成代碼,從結(jié)果反饋中學(xué)習(xí)并不斷改進(jìn)方法。

One More Thing

自推理模型范式問世之后,AI連續(xù)在數(shù)學(xué)奧賽IMO,信息學(xué)奧賽IOI,編程大賽ICPC中表現(xiàn)出色。

不過(guò),這次OpenAI研究副總裁Jerry Tworek表示:

ICPC之后我們可能不會(huì)打別的競(jìng)賽了,下一個(gè)前沿領(lǐng)域更令人興奮。

圖片

人類選手們可以松一口氣了。

那么什么是下一個(gè)前沿領(lǐng)域?可以參考Tworek最新的個(gè)人介紹:

如何將各類科學(xué)和工程技能應(yīng)用于現(xiàn)實(shí)世界的問題。

圖片圖片

這些領(lǐng)域的研究者、工作者們,GPT-5來(lái)找你們了。

參考鏈接:
[1]https://x.com/OpenAI/status/1968368133024231902
[2]https://deepmind.google/discover/blog/gemini-achieves-gold-level-performance-at-the-international-collegiate-programming-contest-world-finals/
[3]https://worldfinals.icpc.global/2025/

責(zé)任編輯:武曉燕 來(lái)源: 量子位
相關(guān)推薦

2023-04-25 14:00:00

GPTAI

2025-08-07 16:21:27

GPT-5AI模型

2025-10-14 08:54:00

2025-06-19 09:06:00

2010-02-06 09:15:14

ACMICPC

2025-10-13 09:13:00

2025-09-19 14:53:34

2024-01-22 13:57:00

模型訓(xùn)練

2025-08-19 09:56:03

2025-08-14 09:31:24

GPT-5AI

2025-09-10 08:31:00

2025-08-04 14:22:33

GPT-5Claude編碼

2024-01-18 12:30:03

2023-11-09 12:41:04

AI模型

2025-10-20 02:00:00

2024-04-01 00:50:00

吳恩達(dá)智能體

2013-08-27 16:09:10

中關(guān)村在線
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)