人類擊敗OpenAI守住編程冠軍!10小時(shí)激戰(zhàn)兩次反超,AI最后關(guān)頭功虧一簣
10小時(shí)激戰(zhàn)!人類最后關(guān)頭實(shí)現(xiàn)超越,獲得編程總決賽冠軍~
而原本始終保持領(lǐng)先優(yōu)勢的OpenAI,最終屈居第二。

在剛剛落幕的AtCoder世界巡回總決賽上,12名決賽選手兩天時(shí)間里展開角逐。
結(jié)果過程還挺緊張刺激,尤其前兩名的爭奪上。
OpenAI 在大部分比賽中都排名第一,本以為就這樣了。人類開始反超,結(jié)果還剩1小時(shí)20分鐘的時(shí)候,OpenAI又重新領(lǐng)先。不過還是沒有堅(jiān)持到最后。

OpenAI總裁Greg Brockman發(fā)來賀電,中間還夾帶私貨:OpenAI位居第二。

此時(shí)獲得冠軍的人類表示要累死了。
因?yàn)檫^去三天我估計(jì)只睡了10個(gè)小時(shí),現(xiàn)在都快撐不住了。

網(wǎng)友:你看,模型就不會(huì)這樣。

好好,到底還是人類機(jī)靈啊~~
10小時(shí)激戰(zhàn):人類兩次反超鎖定勝局
AtCoder是一個(gè)全球性質(zhì)的日本編程競賽網(wǎng)站,任何人都可以隨時(shí)參加,挑戰(zhàn)歷年的5000道真題。
如果排名優(yōu)異(前12名),將有機(jī)會(huì)前往日本參與一年一度的世界巡回總決賽。

它有兩種類型的競賽:算法類和啟發(fā)式,OpenAI參與的是后者,與12位優(yōu)異人類同臺競技。每位選手都有個(gè)這樣的介紹卡片。

算法類,參賽者需要提交一個(gè)程序,快速準(zhǔn)確地解決給定的問題,誰答對的多誰就勝。
啟發(fā)式是2021年才開始評級、2024年才開始競賽的類別。在這類比賽中,參賽者比拼的是他們能在規(guī)定時(shí)間(10小時(shí)內(nèi))找到最優(yōu)解。
比如,考慮一條追蹤100個(gè)點(diǎn)返回的路徑。那么最右邊這個(gè)方法將獲得最高分。

比賽期間你可以提交任何編程語言,并且支持重復(fù)提交,不過兩次提交之間至少要間隔5分鐘。不過提交一次錯(cuò)誤答案就要扣時(shí)間。
此次比賽全程直播。OpenAI參賽的模型叫做OpenAI-AHC,從提交的記錄來看,前期發(fā)揮得都很不錯(cuò)。
前六個(gè)小時(shí)提交的回答,全都是得分點(diǎn),第一次提交就有31萬得分。


比賽還剩下三個(gè)小時(shí)的時(shí)候,OpenAI依然是穩(wěn)居第一。

但是在后半程開始出現(xiàn)失誤,好幾道題出現(xiàn)「執(zhí)行時(shí)間超出限制」的情況,導(dǎo)致零分。

反觀Psycho,就顯得十分穩(wěn)定,全是綠燈。

尤其他第一次提交,就獲得了六百多萬的得分。

于是就在還剩兩小時(shí)四十分鐘的時(shí)候,他直接完成了反超。

而且相差的分?jǐn)?shù)還不小。

后面正如Greg所說,還剩下一個(gè)多小時(shí)的時(shí)候,OpenAIAHC再次反超。

這種局勢一直穩(wěn)定在還剩46分鐘時(shí),就在Psycho提交之后,再次回到了第一的位置,結(jié)果就直接穩(wěn)定到最后了。

By the way,OpenAI的提交次數(shù)已經(jīng)是人類的好幾倍了。隨便拎出個(gè)人類選手,提交次數(shù)一頁就可以瀏覽完。

結(jié)果一出,不少人想起之前幾次人機(jī)大戰(zhàn)的比賽。

網(wǎng)友表示:看來這是人類最后一次勝利。

冠軍還曾效力OpenAI,訓(xùn)練AI戰(zhàn)勝人類
值得一提的是,這位來自波蘭的Psycho,與OpenAI和Greg是有點(diǎn)淵源在的。
從他個(gè)人介紹來看,他是個(gè)游戲設(shè)計(jì)者,也是個(gè)職業(yè)競技程序員。
但以前在OpenAI待過,于是順藤摸瓜找到了當(dāng)時(shí)2019年的一篇文章。

當(dāng)時(shí)OpenAI Five在Dota 2游戲里擊敗世界冠軍,成為首個(gè)電競比賽中戰(zhàn)勝人類的AI系統(tǒng)。
而他所在團(tuán)隊(duì)利用強(qiáng)化學(xué)習(xí)進(jìn)行大規(guī)模訓(xùn)練,就在OpenAI Five持續(xù)訓(xùn)練10個(gè)月后,終于戰(zhàn)勝了世界冠軍。
當(dāng)時(shí)這篇論文也還有Greg Brockman參與。
六年之前,他在OpenAI訓(xùn)練AI,要AI戰(zhàn)勝人類。
六年之后,他站在了人類選手這一邊,挑戰(zhàn)自己老東家的大模型,結(jié)果挑戰(zhàn)成功了。
Interesting~
此次對于Greg的祝賀,他回應(yīng)道,謝謝你讓我的生活更有趣,現(xiàn)在我回去準(zhǔn)備退休了。

順便說一嘴,今年這場比賽還是由OpenAI贊助的。
第一名可以獲得50萬日元,差不多兩萬四人民幣。第二名能獲得九千六百多元。

嗯看來,OpenAI這一波,還是有實(shí)際的收獲的(Doge)。
10小時(shí)賽程回放:https://www.youtube.com/live/TG3ChQH61vE

































