OpenAI「解決」10道數(shù)學(xué)難題?哈薩比斯直呼「尷尬」,LeCun辛辣點(diǎn)評(píng)
這個(gè)周末 AI 圈非常熱鬧,OpenAI 陷入輿論中心,Google、Meta 和 AI 圈多位大佬加入混戰(zhàn)。
一句話概括就是:OpenAI 研究員宣稱 GPT-5 「發(fā)現(xiàn)」了 10 個(gè)懸賞數(shù)學(xué)難題的解決方法,輿論誤以為是 GPT-5 給出了解題方法,結(jié)果被發(fā)現(xiàn)只是檢索到了早已存在的文獻(xiàn),引發(fā)了學(xué)界大佬的群嘲和對(duì)于 AI 夸大宣傳的激烈討論。

故事要從幾條引爆社交平臺(tái)的推文說起。
GPT-5 解決懸賞難題?
10 月 12 日,Sebastien Bubeck 發(fā)推表示 GPT-5 文獻(xiàn)搜索方面超凡脫俗,發(fā)現(xiàn)了 Erd?s 問題 339 已被解決但在官方數(shù)據(jù)庫(kù)中狀態(tài)尚未修改。

10 月 17 日,OpenAI 研究人員 Mark Sellke 轉(zhuǎn)發(fā)此貼更新,表示他和 Mehtaab 使用 GPT-5 模型進(jìn)一步研究,通過數(shù)千次查詢,針對(duì) erdosproblems.com 網(wǎng)站上列為「開放」的 Erd?s 問題進(jìn)行了調(diào)查。

他們聲稱「發(fā)現(xiàn)了」10 個(gè)問題的解決方案(問題編號(hào):223、339、494、515、621、822、883(第 2/2 部分)、903、1043、1079)。同時(shí)他們?cè)诹硗?11 個(gè)問題上也取得了部分進(jìn)展。
OpenAI 首席產(chǎn)品官 Kevin Weil 轉(zhuǎn)發(fā)此貼。

這些問題源自數(shù)學(xué)家 Paul Erd?s 提出的未解決問題列表,該網(wǎng)站由數(shù)學(xué)家 Thomas Bloom 維護(hù)。
OpenAI 的副總裁 Sebastien Bubeck 轉(zhuǎn)發(fā)并宣稱「AI 加速科學(xué)已正式開始」,并順勢(shì)宣布 Mark Sellke 加入 OpenAI。

一時(shí)間,公眾和媒體普遍認(rèn)為 GPT-5 在數(shù)學(xué)推理能力上取得了驚人突破,能夠獨(dú)立解決困擾人類數(shù)學(xué)家數(shù)十年的難題。
反轉(zhuǎn):「這很尷尬」
然而,這場(chǎng)狂歡僅僅持續(xù)了幾個(gè)小時(shí),就迎來了反轉(zhuǎn)。
谷歌 DeepMind 的 CEO Demis Hassabis 在 Sebastien Bubeck 那條「AI 加速科學(xué)」的推文下回復(fù):這很尷尬。

Hassabis 隨后引導(dǎo)公眾關(guān)注該數(shù)學(xué)難題網(wǎng)站維護(hù)者、數(shù)學(xué)家 Thomas Bloom 的澄清。
Thomas Bloom 表示:OpenAI 的表述為「戲劇性的誤解」。網(wǎng)站上將這些問題標(biāo)記為「未解決」,僅僅代表他個(gè)人不知道相關(guān)解答已經(jīng)發(fā)表,并不意味著數(shù)學(xué)界沒有人解決。

換言之,GPT-5 扮演了一個(gè)效率極高的學(xué)術(shù)搜索引擎,而非一個(gè)數(shù)學(xué)家。
Sebastien Bubeck 隨后刪除帖子并道歉,稱「我無意誤導(dǎo)任何人,我認(rèn)為表述很清楚,對(duì)不起」。他強(qiáng)調(diào),AI 在文獻(xiàn)搜索上的作用非常有價(jià)值,因?yàn)椤杆阉魑墨I(xiàn)有多難,我很清楚」,這能加速科學(xué)研究。

Kevin Weil 也刪帖并承認(rèn)「我實(shí)際上誤解了我們的結(jié)果(尷尬)」。Mark Sellke 的更新也是轉(zhuǎn)發(fā)此貼。

Hoisted by their own GPTards
對(duì)此,Lecun 也辛辣點(diǎn)評(píng):(OpenAI)被自己吹捧 GPT 的言論坑慘了(Hoisted by their own GPTards),諷刺其作繭自縛。
注:源自莎士比亞戲劇《哈姆雷特》的著名短語 Hoist with his own petard(被自己的炸藥包給炸飛了),這里 petard(炸藥)改成了 GPTards(-tards 源自英文單詞 retard,意為笨蛋),指代那些盲目崇拜 ChatGPT / AI 的人。

搞笑的是,就在同一天,Lecun 在一篇指出最近的熱門論文《Definition of AGI》中存在虛假引用的帖子下面回復(fù)了相同的一句話。

Gary Marcus 也做出點(diǎn)評(píng):任何期望當(dāng)前范式接近AGI的人都是在癡心妄想。

網(wǎng)友也進(jìn)行了激烈討論,有部分人認(rèn)為 OpenAI 再一次炒作失敗。

不過也有人認(rèn)為,這是一個(gè)有價(jià)值的事情。

陶哲軒的觀點(diǎn)與此類似,他在 Mastodon 上表示,AI 在數(shù)學(xué)中的即時(shí)潛力在于加速文獻(xiàn)搜索等瑣碎任務(wù),而非解決最難的開放問題。他承認(rèn) AI 可能「工業(yè)化」數(shù)學(xué),加速整體進(jìn)展,但強(qiáng)調(diào)人類專家仍需審查、分類和整合 AI 結(jié)果。

- 貼文地址:https://mathstodon.xyz/@tao/115385022005130505
還有人對(duì)「炒作」行為做出了更深層次的解讀。

無論如何,這件事再次警醒我們,在追求技術(shù)突破的道路上,AI 社區(qū)究竟該如何平衡嚴(yán)謹(jǐn)?shù)目茖W(xué)精神與必要的公眾宣傳?



































