陶哲軒找 GPT-5 解數(shù)學(xué)題:29 行 Python代碼,“無幻覺、順到離譜”
陶哲軒(Terence Tao),最近在一個學(xué)術(shù)問答網(wǎng)站上,親口講述了自己如何用 ChatGPT 解出一道數(shù)學(xué)問題。
他在 MathOverflow 上發(fā)帖,原本只是想驗證一組復(fù)雜的不等式。
圖片
他已經(jīng)有了理論分析,卻需要一組“具體數(shù)值”來驗證推導(dǎo)是否成立。
過去,這類問題往往要靠程序員式的笨功夫——寫 Python、調(diào)參數(shù)、跑模型。
但這一次,陶哲軒找了 ChatGPT。起初,AI 給出的代碼并不完美。運(yùn)行速度太慢,參數(shù)設(shè)置也不對。
陶哲軒沒有放棄,而是一步步拆解問題,與 ChatGPT 對話,修正每一個邏輯環(huán)節(jié)。
當(dāng)他重新構(gòu)建問題背景后,ChatGPT 終于找到了合適的參數(shù)。
最后,他用同樣由 ChatGPT 生成的一小段 Python 代碼驗證了結(jié)果。
“我沒有遇到幻覺或無意義的回答,”陶哲軒寫道,“整個過程順暢得令人驚訝?!?/span>
AI,節(jié)省了他幾個小時
陶哲軒說,這一過程為他節(jié)省了數(shù)小時。如果沒有 AI,他得自己從零寫腳本、測試、調(diào) bug。那不僅要時間,更要極強(qiáng)的耐心。
“AI 能利用上下文,自動發(fā)現(xiàn)我請求中的數(shù)學(xué)錯誤,并在生成代碼前修正?!彼麑懙?。
他甚至承認(rèn),如果沒有 AI,他可能根本不會嘗試這類“數(shù)值搜索”,而是退回到更抽象的理論推演。
換句話說,ChatGPT 讓他做了一件自己原本不會做的事。那一刻,他不是在寫代碼,而是在與一個懂?dāng)?shù)學(xué)的助手對話。
一個能理解公式結(jié)構(gòu)、能指出他思路漏洞、還能幫他“動手實驗”的助手。
陶哲軒對 AI 并不盲目。他在總結(jié)中寫道:自己對大語言模型總體持開放態(tài)度,但也懷疑它們能否推動真正的數(shù)學(xué)創(chuàng)新。
AI 擅長處理具體問題,卻難以提出真正的新理論。但他也認(rèn)為,這并非壞事。
在他看來,未來的數(shù)學(xué)研究將進(jìn)入一個全新階段“工業(yè)化數(shù)學(xué)”(industrial-scale mathematics)。
那是一個人機(jī)協(xié)作的時代。成百上千的研究者,配合 AI 工具,一起處理宏大的數(shù)學(xué)問題。
就像制造業(yè)流水線一樣,AI 可以承擔(dān)重復(fù)計算、驗證與代碼生成;人類負(fù)責(zé)抽象推理與方向判斷。
他把這種變化比作“國際象棋的轉(zhuǎn)折點(diǎn)”。AI 沒有取代棋手,但徹底改變了他們的訓(xùn)練與思維方式。
如今,頂尖棋手離不開計算機(jī)分析,同樣,未來的數(shù)學(xué)家也將離不開 AI 推理。
今年以來,Google 與 OpenAI 都在推進(jìn)高級數(shù)學(xué) AI 系統(tǒng)。這些系統(tǒng)并未公開發(fā)布,但已在多項競賽中亮相。
兩家公司都報告稱,他們的通用推理模型(并非專門訓(xùn)練的數(shù)學(xué)系統(tǒng))在 國際數(shù)學(xué)奧林匹克(IMO) 和 國際大學(xué)生程序設(shè)計競賽(ICPC) 上拿下金牌。
這意味著,AI 已能與頂尖人類選手同臺競技。Meta、Anthropic 等公司也在開發(fā)自己的數(shù)學(xué)推理框架,希望讓 AI 能夠“像人類一樣思考公式”。
陶哲軒在文章中暗示,AI 在數(shù)理科學(xué)中的潛力被嚴(yán)重低估。
他認(rèn)為,AI 不一定要“發(fā)現(xiàn)新定理”,只要能讓人類更快地驗證假設(shè)、更穩(wěn)地構(gòu)建模型,就已經(jīng)足夠革命性。
以下是原文,由DeepSeek翻譯:
我通過與 AI進(jìn)行一場長時間的交流,成功地找到了一個數(shù)學(xué)問題的答案。
對話記錄:https://chatgpt.com/share/68ded9b1-37dc-800e-b04c-97095c70eb29
MathOverflow原貼:https://mathoverflow.net/questions/501066/is-the-least-common-multiple-sequence-textlcm1-2-dots-n-a-subset-of-t/501125#501125
我此前已經(jīng)做過理論分析,認(rèn)為這個問題的答案應(yīng)當(dāng)是否定的。但要想構(gòu)造出確鑿的反例,還需要一些滿足特定不等式的數(shù)值參數(shù)。起初,我希望讓 AI 生成一段 Python 代碼,用來搜索反例并由我自己運(yùn)行與調(diào)整。結(jié)果發(fā)現(xiàn),這樣的搜索耗時極長,而且最初設(shè)定的參數(shù)范圍幾乎注定會失敗。
于是我改變策略,改為與 AI 進(jìn)行逐步推理的對話,讓它用啟發(fā)式計算的方法幫助我找出可行的參數(shù)范圍。經(jīng)過多輪推演,AI 最終給出了合適的參數(shù)。我隨后獨(dú)立進(jìn)行了驗證(確實使用了它生成的一段 29 行的 Python 程序,但代碼結(jié)構(gòu)簡單、邏輯清晰,我可以直接看懂它在做什么,而且算出的數(shù)值也與此前的啟發(fā)式預(yù)測相吻合)。
在這個過程中,AI 工具大大節(jié)省了我的時間,若完全靠自己完成同樣的任務(wù),恐怕得花上好幾個小時編寫和調(diào)試代碼。AI 能根據(jù)上下文識別出我請求中的若干數(shù)學(xué)錯誤,并在生成代碼前自動修正。事實上,如果沒有 AI 協(xié)助,我大概率根本不會嘗試這種數(shù)值搜索,而是會轉(zhuǎn)而進(jìn)行更抽象的漸近分析。





































