陶哲軒預(yù)測(cè)再成真!AI做出橢圓曲線難題重大發(fā)現(xiàn),華人數(shù)學(xué)家接近千禧年大獎(jiǎng)
用AI研究數(shù)學(xué)領(lǐng)域,最近又有重大發(fā)現(xiàn)了。
這次數(shù)學(xué)家們用AI發(fā)現(xiàn)的,是橢圓曲線中的murmuration(椋鳥群飛)現(xiàn)象。
他們發(fā)現(xiàn),如果以正確的方式觀察,在橢圓曲線中會(huì)出現(xiàn)像飛行中的椋鳥群一般的圖案。

現(xiàn)在,murmuration相關(guān)研究已經(jīng)轟動(dòng)了數(shù)學(xué)圈,每周都有相關(guān)新研究問世。
令人不可思議的是,這個(gè)發(fā)現(xiàn)是由數(shù)個(gè)偶然組成的——
橢圓曲線的數(shù)據(jù),恰巧按照conductor來排序;一個(gè)經(jīng)驗(yàn)不足的本科生,恰巧沒有處理某個(gè)數(shù)值,讓曲線的震蕩極為明顯;按照conductor預(yù)排序的數(shù)據(jù)集,恰巧被人提前做了出來……
任何一個(gè)要素的變動(dòng),都會(huì)導(dǎo)致人類與這一重要的數(shù)學(xué)發(fā)現(xiàn)失之交臂,或許再晚上幾十年……
并且,被陶哲軒認(rèn)證的說法再次被證實(shí):數(shù)學(xué)家們要做好準(zhǔn)備了,AI將在十年內(nèi),趕上甚至超過最優(yōu)秀的人類數(shù)學(xué)家!

七大千禧年難題之一
橢圓曲線,一直是現(xiàn)代數(shù)學(xué)中最迷人的對(duì)象之一。
它看似簡(jiǎn)單,卻是把高中數(shù)學(xué)連接向深?yuàn)W的數(shù)學(xué)研究的一條快速通道。
它是1990年代Andrew Wiles證明費(fèi)馬大定理過程中的核心,還是現(xiàn)代密碼學(xué)的關(guān)鍵工具。

在2000年,克萊數(shù)學(xué)研究所將橢圓曲線統(tǒng)計(jì)特性的一個(gè)猜想,列為七大「千禧年問題」之一,懸賞100萬(wàn)美元的獎(jiǎng)金。

在1960年代,這一猜想被數(shù)學(xué)家Bryan Birch和Peter Swinnerton-Dyer提出,至今尚未得到證明。
因此,深入探索橢圓曲線,已經(jīng)成為了數(shù)學(xué)領(lǐng)域的一項(xiàng)重要的高風(fēng)險(xiǎn)任務(wù)。
果然,有人想到了用AI向橢圓曲線難題發(fā)起了沖擊。
在2022年,數(shù)學(xué)家利用統(tǒng)計(jì)技術(shù)和AI,竟然在橢圓曲線上發(fā)現(xiàn)了一些出乎意料的全新特性!
他們發(fā)現(xiàn):如果以正確的方式觀察,橢圓曲線就能「像椋鳥成群結(jié)隊(duì)一樣飛翔」。

任教于普林斯頓大學(xué)和高級(jí)研究院的數(shù)學(xué)家Peter Sarnak表示:「機(jī)器學(xué)習(xí)總會(huì)給我們帶來一些意料之外的驚喜!」
橢圓曲線上為什么會(huì)出現(xiàn)這些特性呢?剛發(fā)現(xiàn)時(shí),許多數(shù)學(xué)家感到非常困惑。
近期的一些研究發(fā)現(xiàn),這些類似椋鳥群飛翔時(shí)不斷變化的形狀(murmuration),并不僅僅是2022年研究中的特例,而是橢圓曲線普遍的共性。
神奇的橢圓曲線
要弄明白這些模式究竟是什么,我們首先得對(duì)橢圓曲線及其分類有所了解。
橢圓曲線是通過一個(gè)變量(通常用y表示)的平方與另一個(gè)變量(通常用x表示)的三次方之間的關(guān)系來定義的:y^2=x^3+Ax+B,這里的A和B是滿足幾個(gè)簡(jiǎn)單條件的一對(duì)數(shù)值。
橢圓曲線方程定義了一條可以在平面上繪制的曲線,如下所示。

雖然看起來很普通,但對(duì)于數(shù)論學(xué)者來說,橢圓曲線卻是非常強(qiáng)大的工具。
這是因?yàn)椋瑪?shù)論學(xué)者需要在整數(shù)中尋找規(guī)律。他們不喜歡讓變量x和y所有數(shù)字中取值,而是希望將它們限制在特定的數(shù)系中,也即在給定的數(shù)系上定義一個(gè)曲線。
而僅限于有理數(shù)的橢圓曲線,在數(shù)論的研究中格外有用。
普林斯頓數(shù)學(xué)家Sarnak說,「實(shí)數(shù)或復(fù)數(shù)域上的橢圓曲線非常單調(diào),真正有深度的,是定義在有理數(shù)域上的橢圓曲線。」
下面這個(gè)例子,可以證明這一點(diǎn)。
如果我們?cè)跈E圓曲線上任意兩個(gè)有理點(diǎn)之間畫一條直線,那么這條線再次與曲線相交的位置,也會(huì)是有理點(diǎn)。
利用這個(gè)性質(zhì),我們可以在橢圓曲線上定義一種「加法」運(yùn)算,如下圖所示。

在點(diǎn)P和點(diǎn)Q之間畫一條直線,這條直線將與曲線相交于第三點(diǎn)R。(如果這條直線不與曲線相交呢?數(shù)學(xué)家們就會(huì)巧妙地添加一個(gè)「無窮遠(yuǎn)處的點(diǎn)」。)
接下來,就是見證奇跡的時(shí)刻——R沿x軸的鏡像點(diǎn),就是P+Q的和!
結(jié)合這種加法運(yùn)算,曲線的所有解,就形成了一種稱為「群」的數(shù)學(xué)對(duì)象。

而數(shù)學(xué)家正是借助這種方式,來定義曲線的「秩」。
曲線的秩反映了它擁有的有理數(shù)解的數(shù)量:秩為0的曲線只有有限個(gè)解,而那些秩較高的曲線,則有無限個(gè)解。
而這些解之間的加法運(yùn)算關(guān)系,就是用秩來描述的。
秩的概念不是那么容易理解。數(shù)學(xué)家并不總是有辦法計(jì)算出秩的數(shù)值,也不能確定它的最大值能達(dá)到多大。(目前已知的某個(gè)特定曲線的最大精確秩是20。)
而外觀相似的曲線,也可能擁有完全不同的秩。
此外,橢圓曲線還與質(zhì)數(shù)(只能被1和自身整除的數(shù))有著緊密的聯(lián)系。
因此,數(shù)學(xué)家還特意研究了在有限域上的曲線。
有限域是一種圍繞每個(gè)質(zhì)數(shù)定義的循環(huán)算術(shù)系統(tǒng)。
我們可以把有限域想象成一個(gè)時(shí)鐘,其「小時(shí)數(shù)」就等同于該質(zhì)數(shù):到達(dá)這個(gè)質(zhì)數(shù)時(shí)如果你繼續(xù)往后數(shù),數(shù)字就會(huì)從0開始。
例如,在質(zhì)數(shù)7構(gòu)成的有限域中,5加2的結(jié)果是0,5加3的結(jié)果是1。

每個(gè)橢圓曲線,都有一個(gè)稱為a_p的數(shù)列,這個(gè)序列反映了由質(zhì)數(shù)p定義的有限域內(nèi)橢圓曲線的解的數(shù)量。
如果a_p的值較小,曲線的解就更多;反之,a_p的值較大,則解的數(shù)量更少。
盡管計(jì)算曲線的秩相當(dāng)復(fù)雜,但是找出a_p序列卻容易得多。
基于一臺(tái)非常早期的計(jì)算機(jī)上計(jì)算出的成果,數(shù)學(xué)家Birch和Swinnerton-Dyer提出了一個(gè)猜想。
他們認(rèn)為,橢圓曲線的秩與a_p序列之間存在特定的關(guān)系。
誰(shuí)要是能證明他們的猜想是正確的,不僅能贏得一百萬(wàn)美元的獎(jiǎng)金,還將在數(shù)學(xué)史上青史留名。
AI有了驚人發(fā)現(xiàn)
然后,我們就來到了這位華人研究員的故事。
在2020年,英國(guó)皇家學(xué)會(huì)倫敦?cái)?shù)學(xué)科學(xué)研究所的研究員Yang-Hui He(何楊輝),決定借助AI來挑戰(zhàn)橢圓曲線問題。
何教授本科學(xué)的是物理,然后在MIT取得了數(shù)學(xué)物理博士學(xué)位。
但隨著時(shí)間的推移,他對(duì)數(shù)論的興趣與日俱增,并且開始考慮用AI來探索數(shù)字中的未知規(guī)律。
此前,他就已經(jīng)開始利用機(jī)器學(xué)習(xí),對(duì)弦論中廣泛使用的Calabi-Yau流形進(jìn)行分類了。

論文地址:https://arxiv.org/abs/1812.02893
但隨后,他就感覺到了強(qiáng)烈的受挫。
在2020年8月,何楊輝在諾丁漢大學(xué)的一場(chǎng)在線講座中,表達(dá)了自己對(duì)于用AI發(fā)現(xiàn)數(shù)學(xué)新知識(shí)的悲觀看法。
當(dāng)時(shí),他是這么說的:「我沒有任何進(jìn)展,因?yàn)槲也皇沁@一領(lǐng)域的專家。我甚至都沒有找到正確的方法。」
當(dāng)時(shí)的聽眾之一、威斯敏斯特大學(xué)的數(shù)學(xué)家Thomas Oliver回憶道,他之所以認(rèn)為數(shù)論很難,是因?yàn)闊o法簡(jiǎn)單地把機(jī)器學(xué)習(xí)應(yīng)用在數(shù)論研究中。

由左至右:Kyu-Hwan Lee,Thomas Oliver,何楊輝
后來,Thomas Oliver便叫上康涅狄格大學(xué)的數(shù)學(xué)家Kyu-Hwan Lee一同,與何楊輝展開了更深度的合作。
「我們最初的目的,只是想了解一下機(jī)器學(xué)習(xí)是什么,而不是真的去深入研究數(shù)學(xué),」Oliver說?!傅芸?,我們發(fā)現(xiàn)機(jī)器學(xué)習(xí)可以幫我們理解許多問題?!?/span>
Oliver和Lee建議,大家可以用AI研究L函數(shù),即通過序列a_p與橢圓曲線密切相關(guān)的無窮級(jí)數(shù)。
為此,他們利用橢圓曲線及其相關(guān)L函數(shù)的在線數(shù)據(jù)庫(kù)(LMFDB),訓(xùn)練了一個(gè)極其學(xué)習(xí)分類器。
這個(gè)數(shù)據(jù)庫(kù)收錄了超過300萬(wàn)條有理數(shù)范圍內(nèi)的橢圓曲線及其相關(guān)的L函數(shù)。
2020年10月,他們發(fā)表了一篇論文,通過分析L函數(shù)的信息,來預(yù)測(cè)橢圓曲線的特定性質(zhì)。

論文地址:https://arxiv.org/abs/2010.01213
11月,他們?cè)俅伟l(fā)表論文,利用機(jī)器學(xué)習(xí)對(duì)數(shù)論中其他對(duì)象進(jìn)行了分類。

論文地址:https://arxiv.org/abs/2011.08958
到了12月,他們已經(jīng)能夠準(zhǔn)確預(yù)測(cè)橢圓曲線的等級(jí)。

論文地址:https://arxiv.org/abs/2012.04084
但即便如此,三人都搞不明白,為什么機(jī)器學(xué)習(xí)算法會(huì)如此有效。
本科生接手研究
Lee把揭開這一謎團(tuán)的任務(wù),交給自己的本科生Alexey Pozdnyakov。

康涅狄格大學(xué)的本科生Alexey Pozdnyakov是世界上第一個(gè)觀察到這種模式的人
Pozdnyakov是這樣入手的。
LMFDB通過一個(gè)叫做conductor的量,來對(duì)橢圓曲線進(jìn)行分類,這個(gè)量概括了曲線在某些質(zhì)數(shù)上表現(xiàn)不佳的信息。
于是,Pozdnyakov嘗試同時(shí)研究大量具有相似conductor值的曲線,比如conductor值為7,500到10,000之間的所有曲線。
總的來說,這項(xiàng)研究涵蓋了大約10,000條橢圓曲線。其中,有大約一半的秩為0,另一半的秩為1(更高秩的曲線極其罕見)。
接著,Pozdnyakov分別計(jì)算了秩為0和秩為1的曲線的a_p值的平均數(shù),并將這些數(shù)據(jù)繪制成圖。
結(jié)果顯示,這兩組數(shù)據(jù)形成了兩個(gè)截然不同、清晰可辨的波。
而這,就是機(jī)器學(xué)習(xí)能夠準(zhǔn)確預(yù)測(cè)特定曲線等級(jí)的原因。

最初,Pozdnyakov只是很高興自己完成了導(dǎo)師交代的任務(wù)。
Kyu-Hwan教授立刻敏銳地意識(shí)到,這其中絕對(duì)有不尋常的發(fā)現(xiàn)!
當(dāng)Lee教授和Oliver教授知道后,他們也非常驚喜。
Pozdnyakov向他們展示了上面的那張圖,他們立刻聯(lián)想到了鳥群在空中飛行時(shí)形成的圖案。
Kyu-Hwan教授隨后查到,這種現(xiàn)象叫做murmuration。
何教授隨后提議,將論文命名為「橢圓曲線的murmuration」。

論文地址:https://arxiv.org/abs/2204.10140
論文引起強(qiáng)烈反響
2022年4月,他們將論文上傳,分享給一些數(shù)學(xué)家。
大家忐忑地想,或許這個(gè)所謂的發(fā)現(xiàn)早就為人熟知,畢竟曲線實(shí)在太明顯了。
然而,出乎他們意料的是,論文一經(jīng)發(fā)布,立刻引起了數(shù)學(xué)界的轟動(dòng)。
MIT科學(xué)家Andrew Sutherland對(duì)此尤為感興趣。

Andrew Sutherland
作為L(zhǎng)MFDB的管理編輯之一,Sutherland發(fā)現(xiàn),原有的300萬(wàn)條橢圓曲線對(duì)于他的研究目標(biāo)來說,是遠(yuǎn)遠(yuǎn)不夠的。
他希望通過研究更大范圍的conductor,來檢驗(yàn)所謂的「murmuration」是否具有普遍性。
因此,他從另一個(gè)擁有約1.5億條橢圓曲線的龐大數(shù)據(jù)庫(kù)中提取了數(shù)據(jù)。但他對(duì)此仍然不滿足,于是又從另一個(gè)包含3億條橢圓曲線的數(shù)據(jù)庫(kù)中再次提取數(shù)據(jù)。
但是這些還不夠!
最后,Sutherland的數(shù)據(jù)集,包含了超過10億的橢圓曲線。通過這個(gè)數(shù)據(jù)集,繪制出了非常高清的圖像。

他發(fā)現(xiàn),無論是是15000條橢圓曲線,還是100萬(wàn)條,這種「murmuration」始終都會(huì)顯現(xiàn)。
更令人驚訝的是,即使在橢圓曲線涵蓋的質(zhì)數(shù)范圍越來越大時(shí),這種圖形的形狀依然保持不變,這種現(xiàn)象被稱為「尺度不變性」。

Sutherland還發(fā)現(xiàn),這種「murmuration」不僅存在于橢圓曲線中,也會(huì)出現(xiàn)在更一般的L函數(shù)中。
他將這些發(fā)現(xiàn)發(fā)送給了滑鐵盧大學(xué)的Michael Rubinstein教授和Sarnak教授。
他對(duì)此百思不得其解:「如果這背后有一個(gè)已知的原因,我相信你們一定能告訴我」。

然而,他們對(duì)此也一無所知。
新公式誕生,數(shù)學(xué)圈被引爆
2023年8月,何楊輝、Lee和Oliver在布朗大學(xué)的計(jì)算與實(shí)驗(yàn)數(shù)學(xué)研究所(ICERM)舉辦了一場(chǎng)專門探討murmuration的研討會(huì),并吸引了包括Sarnak和Rubinstein在內(nèi)的眾多學(xué)者參與。
會(huì)上,Sarnak的學(xué)生Nina Zubrilina介紹了自己在模形式中,針對(duì)murmuration的研究成果。模形式是一種特殊的復(fù)函數(shù),它們與橢圓曲線相似,都有對(duì)應(yīng)的L函數(shù)。

Zubrilina發(fā)現(xiàn),在conductor較大的模形式中,murmuration呈現(xiàn)出一種趨向于集中成一條清晰的曲線,而非分散的模式。
隨后,她在2023年發(fā)表的一篇論文中,證明了這種murmuration遵循一個(gè)明確的公式。

論文地址:https://arxiv.org/abs/2310.07681
Sarnak對(duì)此評(píng)價(jià)道:「Nina的重大貢獻(xiàn)在于她提出了一個(gè)『Zubrilina murmuration密度公式』。她運(yùn)用了高深的數(shù)學(xué)知識(shí),證明了一個(gè)與數(shù)據(jù)完美吻合的精確公式?!?/span>
盡管這個(gè)公式相當(dāng)復(fù)雜,但Sarnak認(rèn)為它是一種重要的新型函數(shù),甚至可以和定義微分方程解的艾里函數(shù)相媲美——后者定義了在物理學(xué)中各種情況下使用的微分方程的解,從光學(xué)到量子力學(xué)。

而Zubrilina公式的提出,直接引爆了這個(gè)領(lǐng)域,現(xiàn)在幾乎每周都有相關(guān)的新論文發(fā)布。
Sarnak解釋說,這些研究主要是采用Zubrilina的方法,進(jìn)一步探討murmuration的不同方面。
Jonathan Bober、Andrew Booker和Min Lee來自布里斯托大學(xué),他們與ICERM的David Lowry-Duda合作,在一篇10月份的論文中證明了模形式存在一種不同的murmuration。
此外,Kyu-Hwan Lee、Oliver和Pozdnyakov還證明了在被稱為狄利克雷特征的對(duì)象中存在murmuration,這些對(duì)象與L函數(shù)有著密切的聯(lián)系。
數(shù)學(xué)的重大發(fā)現(xiàn),有很多「偶然」
如今回想起來,對(duì)于這一發(fā)現(xiàn)背后所需的重大運(yùn)氣,Sutherland仍然會(huì)不住感慨。
如果當(dāng)初,橢圓曲線的數(shù)據(jù)沒有按照conductor來排序,那么murmuration可能就不會(huì)被發(fā)現(xiàn)。
「他們很幸運(yùn)地使用了LMFDB中已經(jīng)按conductor預(yù)排序的數(shù)據(jù),這是關(guān)聯(lián)橢圓曲線和對(duì)應(yīng)模形式的關(guān)鍵,但這并不是顯而易見的……兩個(gè)方程式看似相似的曲線,其conductor卻可能大相徑庭?!?/span>
例如,方程y^2=x^3–11x+6的conductor是17,而將減號(hào)改為加號(hào)后,y^2=x^3+11x+6的conductor則為100,736。
不僅如此,murmuration的發(fā)現(xiàn),也在一定程度上多虧了本科生Pozdnyakov的經(jīng)驗(yàn)不足。
「如果沒有他,我們可能不會(huì)發(fā)現(xiàn)這一點(diǎn),」Oliver說,「因?yàn)閷<彝ǔ?huì)把a(bǔ)_p的絕對(duì)值歸一化為1。但他沒有這樣做……因此,振蕩才變得非常明顯。」
Oliver指出,AI算法用于按等級(jí)排序橢圓曲線的統(tǒng)計(jì)模式,存在于一個(gè)具有數(shù)百維的參數(shù)空間中——這對(duì)人類來說太復(fù)雜了,難以在腦海中排序,更不用說可視化了。
雖然是機(jī)器學(xué)習(xí)首先發(fā)現(xiàn)了這些隱藏的振蕩,但數(shù)學(xué)家們直到后來才明白,這些振蕩實(shí)際上就是murmuration。
Yang-Hui He 何楊輝
何楊輝是一位杰出的數(shù)學(xué)物理學(xué)家,目前是倫敦?cái)?shù)學(xué)科學(xué)研究所的研究員,以及牛津大學(xué)默頓學(xué)院的導(dǎo)師。
與此同時(shí),何教授還在倫敦大學(xué)城市學(xué)院擔(dān)任數(shù)學(xué)客座教授,在南開大學(xué)擔(dān)任長(zhǎng)江學(xué)著講座教授,并且還是STEMM全球科學(xué)協(xié)會(huì)主席。
何教授的研究工作橫跨量子場(chǎng)理論、弦理論、代數(shù)幾何和數(shù)論等多個(gè)領(lǐng)域,并深入探索AI和機(jī)器學(xué)習(xí)在這些問題中的應(yīng)用,是利用AI進(jìn)行純數(shù)學(xué)研究的領(lǐng)域先驅(qū)之一。
目前,何教授已發(fā)表超過200篇科學(xué)論文,并定期舉行公開講座。此外,他還積極參與科普活動(dòng),擔(dān)任BMUCO顧問和One Garden研究員,致力于將科學(xué)知識(shí)普及給更廣泛的公眾。

何楊輝在1975年9月出生于中國(guó)蕪湖,在中國(guó)和澳大利亞度過了他的小學(xué)時(shí)光,隨后在澳大利亞和加拿大完成了高中學(xué)業(yè)。
1996年,何楊輝以最高榮譽(yù)(summa cum laude,同時(shí)獲得Allen Shenstone獎(jiǎng)和Kusaka Memorial獎(jiǎng))從普林斯頓大學(xué)獲得物理學(xué)學(xué)士學(xué)位,并同時(shí)取得了應(yīng)用數(shù)學(xué)和工程物理的雙重證書。
緊接著,他在1997年以優(yōu)異的成績(jī)從劍橋大學(xué)獲得了碩士學(xué)位,并在2002年在麻省理工學(xué)院理論物理中心完成了他的博士學(xué)位研究(獲得了美國(guó)國(guó)家科學(xué)基金會(huì)獎(jiǎng)學(xué)金和麻省理工學(xué)院總統(tǒng)獎(jiǎng))。
完成在賓夕法尼亞大學(xué)的博士后工作后,何楊輝加入牛津大學(xué),擔(dān)任FitzJames研究員和英國(guó)STFC高級(jí)研究員。






































