數(shù)學界地震!GPT-5連破10道「百年懸案」,陶哲軒:AI革命才剛開始
科學研究,尤其是數(shù)學研究,真的要被AI徹底改變了。
兩位數(shù)學研究人員,利用GPT-5,只用一個周末就解決了10個「百年懸案」級的埃爾德什難題。
埃爾德什難題,又名為Erd?s problems,是數(shù)學家埃爾德什生前留下的大約1000多個問題,此前人類只解決了部分。
上一周,前微軟副總裁,現(xiàn)OpenAI研究科學家Sebastien Bubeck第一次確認了這件事。

今天,其中的一名的研究人員Mark Sellke最終確認了細節(jié)。
他們「問了」GPT-5數(shù)千次,就找到了10個未解決的埃爾德什難題的求解方案。
并且GPT-5還在另外11個問題上,發(fā)現(xiàn)了顯著進展。
這種通過AI查詢搜索的研究范式可能徹底改變科學、數(shù)學等基礎學科的研究方法。

AI已經是數(shù)學家的大殺器,如果不用可能就面臨出局了。
其中,Bubeck特地提到GPT-5 Pro在文獻搜索方面的能力非常強大。
比如在問題339上,GPT-5 Pro經過搜索確認,其實有其他數(shù)學家20年前就解決了。
這種深層的文獻搜索能力,目前只有AI能夠做到。

就連陶哲軒也表示,AI正在改變數(shù)學研究。
陶哲軒:「中等能力」的AI是關鍵
就在最近,陶哲軒連發(fā)數(shù)條推文表示:
未來AI在數(shù)學上的最有成效應用,并不會來自最強大的模型去解最難的問題,而是來自「中等能力」的AI去處理那些瑣碎、耗時、但又不可或缺的研究環(huán)節(jié)。

比如幫數(shù)學家查文獻、整理筆記、驗證引用、歸檔資料——這些看起來「沒技術含量」的工作,恰恰是最適合AI的。
他用來說明和論證這個觀點的例子正是開頭所描述的埃爾德什難題。

在一個叫Erd?s Problems的網站上,收錄著上千個以數(shù)學家保羅·埃爾德什命名的命題。
其中大約600個被標注為「未解決」。

就在幾天前,幾位數(shù)學志愿者嘗試了一個新方法——用AI深度檢索工具重新搜索資料,解決Erd?s Problems上的數(shù)學難題。
AI幫他們掃出一批疑似「已有解」的線索,人工再復核、比對、閱讀。
短短幾天,6個原本被列為「未解決」的問題被重新標記為「solved」:Problem 339、Problem 494、Problem 621、Problem 822、Problem 903、Problem 1043。

隨即,評論區(qū)熱鬧了起來。
有人驚訝:原來這些題早被解決,只是沒人找到;也有人開始主動使用同樣的工具,繼續(xù)篩查更多問題。
數(shù)學界第一次感受到:AI不一定幫你「解出」什么,但能幫你「發(fā)現(xiàn)」被遺忘的答案。
陶哲軒在帖文中評價這一趨勢:
AI工具輸出不會直接進入網站,而是由人工復核后更新。但過去幾天評論區(qū)明顯活躍了,出現(xiàn)了更多帶文獻鏈接的注釋,說明很多發(fā)現(xiàn)確實是AI輔助完成的。
陶哲軒本人在Github上也維護了一個Erd?s Problems埃爾德什問題數(shù)據(jù)庫。
截止發(fā)稿前2個小時,陶哲軒才剛剛更新了數(shù)據(jù)庫。

這些問題中有些還有懸賞金。

比如懸賞10000美元的數(shù)論題。
這道題目已經2001年被Baker,Harman和Pintz解決。
然后在2025年9月28日正式確認,大概率就是在AI的幫助下找到的。


其他埃爾德什難題速覽
比如上面提到的問題339,GPT-5 Pro直接從浩如煙海的論文里找到了「答案」。
就是2003年發(fā)布的一篇論文。

問題621是一道圖論。

問題822為數(shù)論。

問題903是組合數(shù)學。

其他未解決的問題,有些還有懸賞金額。
如果你稍微懂點數(shù)學,也可以用GPT-5試著搜索一下。

以上這些難題,絕大部分問題可能已經在浩如煙海的論文中被前人解決了。
但在AI出現(xiàn)前,想通過人力來查遍所有論文是不現(xiàn)實的。
從查文獻開始,AI正悄悄重塑數(shù)學研究
在數(shù)學研究里,查文獻一直是最讓人頭疼的環(huán)節(jié)之一。
如果問題有清晰的名字、固定的研究圈子,那還好。隨便搜一篇關鍵論文,順著引用鏈往前往后查,就能很快摸清全貌。
可很多問題壓根沒有標準名稱。
有的埋在幾十年前的期刊里,有的藏在不同學派、不同語言的論文中,還有的被研究者「順帶提了一嘴」,但沒出現(xiàn)在標題里。
陶哲軒說,這時候用傳統(tǒng)方法,就像在大海撈針。
哪怕你是專家,也得一篇篇點開、反復確認。有時花幾天功夫,才發(fā)現(xiàn)看錯了方向。
AI則能跨語義、跨領域地掃描大規(guī)模文獻,用自然語言理解去捕捉相似概念。
比如輸入一個模糊的研究方向,AI就能自動聯(lián)想到各種近義的表達、不同領域的說法,從而找到那些人類肉眼容易忽略的論文。
當然,陶哲軒也提醒:AI查文獻并不需要「完美命中」。

但只要在同樣的時間里,能找到更多有用的線索、減少無效命中,它就已經贏了。
而且學者在學會使用之后,投入的時間成本會被多次使用「平攤」,越用越值。
在他看來,這種模式的意義不止是提效。它其實在重構科研的節(jié)奏:
AI的成功率不必是100%,它只要比傳統(tǒng)方法更高,就能帶來真正的生產力提升。
在傳統(tǒng)科研里,當研究者查遍資料、卻一無所獲時,這個過程通常不會寫進論文。
畢竟,沒人會在結論里說「我什么都沒找到」。

一方面是擔心被誤會成「沒查仔細」;另一方面,是因為學術寫作習慣于只報告「成功」的結果。
但這樣一來,同一個「無結果」的搜索,可能會被不同的人重復幾十遍。
陶哲軒在帖子最后寫道:AI的系統(tǒng)化搜索,可能改變這種狀況。
因為當機器以同樣的標準批量檢索上百個問題時,「沒查到」也變成了可量化的數(shù)據(jù)。
例如,可以公開地寫:在36個問題中, 24個找到了額外文獻, 12個沒有。這樣的結果更透明,也能更準確反映已有文獻的分布。
AI不僅幫人找到答案,也讓「沒有答案」成為有價值的發(fā)現(xiàn)。
它讓科研流程第一次具備了信息閉環(huán):正向結果指向進步,反向結果避免浪費。
這或許才是AI帶來的真正文化變革,它讓科學回到它最樸素的樣子——誠實地呈現(xiàn)事實,不論好壞。
陶哲軒這一連串思考,看似在談AI,其實是在談「人類如何重新組織知識」。
AI不會創(chuàng)造真理,而是在于讓人類更快地接近真理。
它讓重復勞動變得可控,讓查不到結果也能成為信息;它不是研究者的競爭者,而是科研世界里第一個真正的時間節(jié)省器。
它讓數(shù)學家不再被搜索、整理、驗證這些繁瑣工作拖住,而是能把注意力重新放回那件最重要的事——思考。
或許未來我們回望這一刻,會發(fā)現(xiàn):人工智能沒有改變數(shù)學的本質,它只是讓數(shù)學回到了它該有的速度。





































