陶哲軒支持!AI數(shù)學(xué)奧林匹克競賽進(jìn)步獎公布,獎金100多萬美元
「AI 數(shù)學(xué)奧林匹克競賽(AIMO 進(jìn)步獎)的初步成績已公布。根據(jù)排行榜的數(shù)據(jù),目前看來,獲勝的程序在私人測試中正確回答了 29/50 道題,這一成績比預(yù)期的要高?!箘倓偅照苘幵趥€人博客中公布了這一消息。

AIMO 最初由一家搞機(jī)器學(xué)習(xí)量化交易的非銀行金融機(jī)構(gòu) XTX Markets 發(fā)起,主要是讓參與者使用 AI 模型解決國際數(shù)學(xué)難題,而本次進(jìn)步獎的目標(biāo)是創(chuàng)建能夠解決用 LaTeX 格式編寫的復(fù)雜數(shù)學(xué)問題的算法和模型。這將有助于推動人工智能模型的數(shù)學(xué)推理能力,并推動前沿知識的發(fā)展。
值得一提的是,此次進(jìn)步獎是首次頒發(fā),獲獎隊伍將角逐 104.8 萬美元的獎金。
參賽題目包括中級高中數(shù)學(xué)競賽的題目,但難度沒有達(dá)到國際數(shù)學(xué)奧林匹克(IMO)的水平。
獲獎資格要求團(tuán)隊公開發(fā)布其代碼、方法、數(shù)據(jù)和模型參數(shù)。
根據(jù)排名,我們可以看出,獲得第一名的是 Numina 的團(tuán)隊,CMU_MATH 位列第二,after exams 暫居第三,codeinter、Conor #2 團(tuán)隊分別拿到第四、第五的成績。
根據(jù)規(guī)則,參賽小組最多 5 人,排名前五的就有兩位是單人作戰(zhàn)。

大家使用的模型也是各不相同,包括 Mixtral?8x7b、Gemma、Llama 3 等。

一直以來,IMO 國際奧林匹克數(shù)學(xué)競賽都是由專門研究數(shù)學(xué)的愛好者們直接參與,但隨著大模型能力的不斷提升,其在數(shù)學(xué)中的表現(xiàn)受到越來越多的關(guān)注。
大家測試的重點(diǎn)也逐漸從類似的高考題轉(zhuǎn)戰(zhàn)到奧林匹克競技場上,此前,來自 Google DeepMind 的 AlphaGeometry 登上 Nature,該研究解決了 30 個奧林匹克級別問題中的 25 個,接近國際數(shù)學(xué)奧林匹克競賽金牌選手的平均表現(xiàn)。
在大模型爆發(fā)的當(dāng)下,已經(jīng)不止一家開始挑戰(zhàn)奧賽難題,讓他們之間一較高下結(jié)果會怎樣呢?
去年 11 月,專門為 AI 設(shè)立的數(shù)學(xué)比賽來了,獎金為 1000 萬美元,旨在激勵開放式的人工智能模型開發(fā),使其能夠在國際數(shù)學(xué)奧林匹克(IMO)中表現(xiàn)得與頂尖人類參賽者一樣出色。此次進(jìn)步獎是作為 AIMO 大獎的一部分進(jìn)行評選。

AIMO 顧問委員都是數(shù)學(xué)界的大牛,包括菲爾茲獎得主 Timothy Gowers 和陶哲軒(Terence Tao),與他們一同任職的還有 Po-Shen Loh、Dan Roberts 和 Geoff Smith。



































