「數(shù)學天才」陶哲軒:GPT-4無法攻克一個未解決的數(shù)學問題,但對工作有幫助
當紅炸子雞ChatGPT,也成為數(shù)學天才陶哲軒的研究工具了。
近日,他在網(wǎng)上稱自己發(fā)現(xiàn)了一些ChatGPT的小用例。
首先,它很擅長解析代碼格式的文檔(在這種情況下是#arXiv搜索的API),然后返回一個正確格式的代碼查詢(后來它還提供了一些工作的python代碼,以我要求的方式調(diào)用這個API,盡管我不得不手動安裝一個包來使它運行)。其次,我讓它想出一些,聰明的學生在本科線性代數(shù)課上可能會問的問題(為此我提供了一些樣本題目),它給出了一些很好的例子,讓我對課程可能方向,以及潛在的作業(yè)問題有所啟發(fā)。
總之,我發(fā)現(xiàn)ChatGPT等AI工具雖然不能幫我攻克一個未解決的數(shù)學問題,但對其他工作相關(guān)的問題很有用,盡管事后經(jīng)常需要進行一些手動調(diào)整。
GPT-4和GPT-3.5差別不大
GPT-4是怎樣擅長解析代碼格式的文檔?
陶哲軒讓GPT-4對所有的arXiv文章進行搜索查詢,這些文章的元數(shù)據(jù)是一個給定的關(guān)鍵詞(比如,「Collatz」),并且是在一定的日期范圍內(nèi)提交的(比如,在2011-2016之間)。根據(jù)下面的文檔,這樣的查詢的格式是什么?
對此,GPT-4不僅給出了代碼,還列出了查詢的分類。
網(wǎng)友問,作為一個閱讀工具,給定一篇論文,讓它提出審稿人或演講者可能會問哪些問題?在這一方面GPT-4做得如何?
對此,陶哲軒拿去測評了一番,大贊「確實不錯」。
「這里是最近一篇論文的前幾頁。你能提出一些聽眾在聽關(guān)于這篇論文的講座時可能提出的問題嗎?」
ChatGPT回答「當然,這里有一些數(shù)學家在聽了關(guān)于這篇論文的講座后可能會問的問題」。然后,巴拉巴拉列出了7個問題。
細心網(wǎng)友發(fā)現(xiàn)陶哲軒發(fā)帖的截圖是GPT-4。
便問道,「你認為以前的ChatGPT和基于GPT-4模型的新助手之間有什么區(qū)別?」
陶哲軒稱,「到目前為止,GPT-4的答復稍微有用一些,而且符合我的要求,但我沒有看到質(zhì)量上的重大差別?!?/span>
ChatGPT加入工作流
ChatGPT的誕生,許多人都在驚呼自己的工作要被AI替代了。
就連天才數(shù)學家陶哲軒也上手ChatGPT了。
3月5日,陶哲軒在網(wǎng)上稱自己決定嘗試以不同的方式將AI工具納入我的工作流程。其中就包括GPT-4、DeepL等工具。
在此期間,ChatGPT隱藏功能都被他挖掘了出來,比如尋找公式、解析代碼格式的文檔、改寫論文語句等等。
比如,ChatGPT有時可以在數(shù)學中做一個半成品的語義檢索,也就是用它來生成一些提示。
比如,陶哲軒讓ChatGPT從描述中識別庫默爾定理,它沒能給出正確答案,但根據(jù)它給出的近似答案(Legendre 公式)。
對此,陶哲軒稱,人工智能在數(shù)學中的作用是提供一個初步的近似答案,然后可以結(jié)合傳統(tǒng)搜索引擎輕松找到正確答案。
陶哲軒還發(fā)現(xiàn)了ChatGPT在處理數(shù)學問題時的亮點,能夠識別不同語言的數(shù)學概念音譯版。
另外,可以要求ChatGPT轉(zhuǎn)換從MathSciNet獲得的一堆參考文獻,并在LaTeX書目環(huán)境下將其格式化為\bibitems。
然而ChatGPT 就沒有犯錯的時候嗎?
在一個關(guān)于「素數(shù)是否無窮多」的證明問題中,陶哲軒發(fā)現(xiàn)ChatGPT給出的答案并不是完全正確的。
從另一面看,他發(fā)現(xiàn)ChatGPT給出的論證思路是可以被固定下來的,并且這個思路他之前都從未見過。
復制、粘貼、一鍵完成!
挖掘GPT-4的用例,網(wǎng)友們也是花了不少功夫。
讓GPT-4評審論文不僅合理,而且還能擊中要點。
「作為一個學者,我不知道如何看待這個問題:我把我的一篇舊論文放到GPT-4中(分成兩部分),要求一個經(jīng)濟社會學家進行嚴厲但公平的同行評審?!?/span>
它創(chuàng)造了一個完全合理的同行評審,踩中了我的評審員提出的許多要點。
對許多人來講,想要做什么,直接問GPT-4,「復制、粘貼、一鍵完成!」
就比如用GPT-4做一個復雜的游戲。
網(wǎng)友把GPT-4、Replit、MidJourney、Claude組建成一個人工智能助手團隊,從頭開始創(chuàng)建了一個3D太空跑酷游戲。
然鵝,自己竟對Javascript或3D游戲編程一無所知。