陶哲軒點(diǎn)評(píng)谷歌AlphaProof:AI在數(shù)學(xué)競(jìng)賽中展現(xiàn)「超凡智慧」
在奧數(shù)問(wèn)題面前,AI 的「智商」往往不太夠用。
不過(guò),這已經(jīng)是過(guò)去式了。谷歌 DeepMind 用 AI 做出了今年國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽 IMO 的真題,并且距拿金牌僅一步之遙。對(duì)于 AI 來(lái)說(shuō),奧數(shù)不再是問(wèn)題了。
IMO 2024 中六個(gè)問(wèn)題的每一個(gè)問(wèn)題滿(mǎn)分為 7 分,總分最高 42 分。DeepMind 的系統(tǒng)最終得分為 28 分,意味著解決的 4 個(gè)問(wèn)題都獲得了滿(mǎn)分 —— 相當(dāng)于銀牌類(lèi)別的最高分。
DeepMind 文章連接:https://deepmind.google/discover/blog/ai-solves-imo-problems-at-silver-medal-level/
常用 AI 輔助證明的數(shù)學(xué)家陶哲軒近期正處在出差的忙碌中,對(duì)問(wèn)題求解引擎 AlphaProof 和 AlphaGeometry2 還未完全消化。但他在自己的博客上對(duì) DeepMind 的 AI 系統(tǒng)參加 IMO 競(jìng)賽這件事表達(dá)了自己的看法。

陶哲軒談到,這是一項(xiàng)非常偉大的工作, 再次改變了我們對(duì)哪些基準(zhǔn)挑戰(zhàn)可以通過(guò) AI 輔助或完全自主的方法實(shí)現(xiàn)的期望。
例如,IMO 級(jí)別的幾何問(wèn)題現(xiàn)在對(duì)于專(zhuān)用的 AI 工具來(lái)說(shuō)已基本解決。現(xiàn)在看來(lái),通過(guò)強(qiáng)化學(xué)習(xí)過(guò)程可以找到形式化證明的 IMO 問(wèn)題至少在某種程度上可以被 AI 攻克。雖然目前每個(gè)問(wèn)題需要相當(dāng)大的計(jì)算量,并且在形式化方面需要人類(lèi)的幫助。
在陶哲軒看來(lái),這種方法還有一些「buff 加成」,它能使形式化數(shù)學(xué)更容易自動(dòng)化,這反過(guò)來(lái)可能會(huì)促進(jìn)包含形式化成分的數(shù)學(xué)研究方法。如果更公開(kāi)地共享由此產(chǎn)生的形式證明數(shù)據(jù)庫(kù),它可能是一個(gè)有用的資源。
這種方法(更多地基于強(qiáng)化學(xué)習(xí)而非大型語(yǔ)言模型,有點(diǎn)類(lèi)似 AlphaGo 的精神,且強(qiáng)調(diào)整體方法)非常聰明,事后來(lái)看很有道理。正如「AI 效應(yīng)」所言,一旦解釋清楚,它不會(huì)給人一種展示人類(lèi)智能的感覺(jué);但它仍然是我們 AI 輔助問(wèn)題解決工具集能力的擴(kuò)展。

「AI 效應(yīng)」是指當(dāng)人工智能技術(shù)取得進(jìn)展或解決問(wèn)題時(shí),人們往往會(huì)認(rèn)為這些成就并不是真正的人工智能或者不具備真正的智能。換句話(huà)說(shuō),一旦某項(xiàng)技術(shù)被理解或普及,它就不再被認(rèn)為是智能的。這種現(xiàn)象表明,人們對(duì) “智能” 的定義和期望會(huì)隨著技術(shù)的進(jìn)步而不斷提高。
本月月初,陶哲軒在自己的博客中發(fā)布 AI 數(shù)學(xué)奧林匹克競(jìng)賽(AIMO 進(jìn)步獎(jiǎng))的初步成績(jī)已公布的消息。其中,獲得第一名的是 Numina 的團(tuán)隊(duì)。
他在最新博客中表示,DeepMind 的這些新工具無(wú)法與最近贏(yíng)得 AIMO 進(jìn)步獎(jiǎng)的 NuminaMath 模型直接比較。NuminaMath 模型完全自動(dòng)化且資源效率高出數(shù)個(gè)數(shù)量級(jí),并且采用了完全不同的方法(使用大型語(yǔ)言模型生成 Python 代碼,以蠻力解決區(qū)域競(jìng)賽級(jí)別的數(shù)值答案問(wèn)題)。這個(gè)模型也是完全開(kāi)源的。這也是非常不錯(cuò)的工作,展示了嘗試使用 AI 來(lái)輔助或自動(dòng)化數(shù)學(xué)問(wèn)題解決過(guò)程的不同部分的多維挑戰(zhàn)。
其實(shí) DeepMind 在數(shù)學(xué)推理方面有著不懈的努力。在今年年初,它的人工智能算法就已經(jīng)在數(shù)學(xué)奧林匹克競(jìng)賽(IMO)上取得了重大成績(jī)突破。論文《Solving olympiad geometry without human demonstrations》向世人介紹了 AlphaGeometry,還登上了國(guó)際權(quán)威期刊《自然》雜志。專(zhuān)家表示,這是人工智能朝著具有人類(lèi)推理能力方向邁進(jìn)的重要一步。

論文鏈接:https://www.nature.com/articles/s41586-023-06747-5
未來(lái) DeepMind 還將帶給我們?cè)鯓拥捏@喜,我們拭目以待。





































