AI破解50年未解數(shù)學(xué)難題!南大校友用OpenAI模型完成首個(gè)非平凡數(shù)學(xué)證明
就在剛剛,AI完成了首個(gè)非平凡研究數(shù)學(xué)證明!
完成這項(xiàng)研究的,是美國紐約布魯克海文國家實(shí)驗(yàn)室凝聚態(tài)物理與材料科學(xué)分部的一位華人學(xué)者Weiguo Yin。
論文地址:https://arxiv.org/abs/2503.23758
在這項(xiàng)研究中,作者在一維J_1-J_2 q態(tài)Potts模型,通過引入最大對稱子空間(MSS)方法,對其精確求解。
具體來說,作者將q^2×q^2的傳遞矩陣進(jìn)行塊對角化。
而q=3的情況,正是基于OpenAI的最新推理模型o3-mini-high來精確求解的。
在AI的幫助下,研究者成功證明,模型可以映射為一維q態(tài)Potts模型,其中J_2作為最近鄰相互作用,J_1則作為有效的磁場,這一結(jié)果擴(kuò)展了之前在q=2,即Ising模型的證明。
注意,這個(gè)問題,在數(shù)學(xué)界有50年沒有解決。
論文引用了關(guān)于J_1?J_2伊辛模型(即q=2的Potts模型)的工作,這些工作可以追溯到1969年和1970年。
而o3-mini-high幫忙完成的這項(xiàng)證明,為眾多懸而未決的物理問題(層狀材料中原子或電子順序堆疊的問題,以及非常規(guī)超導(dǎo)體中常見的T_c-拱形相的形成等),提供了全新的見解。
AI模型在科學(xué)研究中的巨大潛力,也再一次被證實(shí)!
Weiguo于2004年加入布魯克海文國家實(shí)驗(yàn)室擔(dān)任研究員,并于2006年晉升為助理物理學(xué)家,2008年晉升為副物理學(xué)家,2011年晉升為物理學(xué)家。
他的專長在于結(jié)合第一性原理、有效哈密頓量和機(jī)器學(xué)習(xí)方法,研究強(qiáng)關(guān)聯(lián)體系、挫敗磁性、超導(dǎo)性、多鐵性、混合的3d-5d化合物、拓?fù)洳牧虾头瞧胶鈶B(tài)。
1998年,他獲得南京大學(xué)的博士學(xué)位,并榮獲2000年國家優(yōu)秀博士學(xué)位論文獎。
五十年未解的數(shù)學(xué)難題,被AI解決了
在凝聚態(tài)物理、材料科學(xué)、量子信息學(xué)和微電子學(xué)等研究領(lǐng)域中,發(fā)現(xiàn)新的相和相變是一個(gè)核心挑戰(zhàn)。
挫敗磁體中存在許多不尋常的相,這些磁體通常用伊辛模型(Ising model)或量子海森堡模型(quantum Heisenberg model)來描述。
統(tǒng)計(jì)力學(xué)的第三個(gè)基本模型是q狀態(tài)Potts模型。
它是伊辛模型(q=2)的推廣,可以作為研究從離散(伊辛)對稱性到連續(xù)(海森堡)對稱性轉(zhuǎn)變的有效中介。
特別是,一維J_1-J_2 Potts模型可能與眾多問題相關(guān),這些問題涵蓋了從層狀材料中原子或電子有序的面外堆疊,如1T-TaS_2 中的「大衛(wèi)之星」電荷密度波,到每個(gè)時(shí)間步都有多種選擇的時(shí)間序列問題,如乒乓球訓(xùn)練設(shè)計(jì)。
1T-TaS2中的「大衛(wèi)之星」電荷密度波相關(guān)論文插圖
一維J_1-J_2 Potts模型
盡管一維和二維的J_1-J_2伊辛模型和海森堡模型已被廣泛研究,但只有一維J_1-J_2伊辛模型通過轉(zhuǎn)移矩陣法得到了精確解。
對于一維J_1-J_2 Potts模型,至今仍沒有精確的解析解。
因?yàn)楫?dāng)q=3時(shí),該模型已經(jīng)展現(xiàn)出與q=2(即伊辛模型)不同的基態(tài)相行為(見下圖),因此精確求解任意q的模型具有基礎(chǔ)性的重要性。
伊辛模型:不同的基態(tài)相行為
挑戰(zhàn)在于轉(zhuǎn)移矩陣的階數(shù)迅速增加,階數(shù)為q^2。
可想而知,q=3時(shí)的9×9矩陣已經(jīng)很難進(jìn)行解析求解,而q=10^10時(shí)的10^10×10^10矩陣,即使是數(shù)值計(jì)算也無能為力。
先前的研究將任務(wù)轉(zhuǎn)化為數(shù)值計(jì)算有效的q×q矩陣,采用整數(shù)q形式的轉(zhuǎn)移矩陣法,或連續(xù)q形式的轉(zhuǎn)移矩陣。
盡管物理學(xué)的透明度較低,但仍然無法得到精確的解析結(jié)果。
因此,對于一維J_1-J_2 Potts模型,至今仍然缺乏其中豐富相行為的直觀理解。
OpenAI o3-mini的創(chuàng)舉:非平凡證明
最近的兩個(gè)發(fā)展為這一長期未解問題提供了新的視角。
第一個(gè)發(fā)展是通過基于對稱性的塊對角化,將裝飾伊辛梯形的4×4轉(zhuǎn)移矩陣簡化為有效的2×2矩陣。
這些發(fā)現(xiàn)為一維挫敗Potts模型找到精確解,可能成為這一重要新方向的里程碑。
第二個(gè)發(fā)展是OpenAI最新的推理模型o3-mini-high,推導(dǎo)出了一個(gè)優(yōu)雅的方程,在外部磁場下,可以確定裝飾伊辛模型中UNPC的臨界溫度。
論文鏈接:https://arxiv.org/abs/2502.11270
因此,作者受到啟發(fā),逐步提示AI推理模型,去處理整數(shù)q形式的轉(zhuǎn)移矩陣。
盡管AI的回答中有不少錯(cuò)誤,針對q=3的情況,最終找到了一種基于對稱性的塊對角化方法,可以將一維J_1-J_2三狀態(tài)Potts模型的9×9轉(zhuǎn)移矩陣解析地簡化為有效的2×2矩陣。
對于一般的q,關(guān)鍵的對稱性是q個(gè)Potts狀態(tài)的全排列對稱性。
換句話說,哈密頓量(因此在整數(shù)q形式中的轉(zhuǎn)移矩陣)在任何對標(biāo)簽{1,2,3,...,q}的排列下都是不變的;它的對稱群是Sq。
雖然AI未能進(jìn)一步推進(jìn),但警告說隨著q的增大,排列的數(shù)量急劇增加。
然而,q=2和q=3的精確結(jié)果,特別是兩者都?xì)w結(jié)為2×2矩陣,啟發(fā)了作者:
由于在熱力學(xué)極限下只有轉(zhuǎn)移矩陣的最大特征值(λ)才重要,因此任務(wù)簡化為識別包含λ的對稱分離子空間。
隨后,作者發(fā)現(xiàn)這個(gè)子空間由兩個(gè)最大對稱向量張成,因?yàn)樗修D(zhuǎn)移矩陣元素都是正的,這使得最終得到了一個(gè)解析的2×2矩陣。
因此,任意q的一維J_1-J_2 Potts模型的精確解,就這樣被找到了,而且過程出奇的簡單!
o3-mini-high具體起了什么作用
下面我們就來看看,o3-mini-high是如何在這項(xiàng)研究中推導(dǎo)出關(guān)鍵方程,對q=3的情況精確求解,從而確定了裝飾伊辛模型中UNPC的臨界溫度的。
首先,o3-mini-high證明,根據(jù)其知識,1D J_1-J_2 Potts模型尚未被精確求解。
接著,模型被提示使用1D J_1-J_2三態(tài)Potts模型的之字形梯形版本。
在這種情況下,AI正確地給出了以下哈密頓量表達(dá)式:
隨后,AI正確地生成了以下傳遞矩陣的表達(dá)式。
其中,(a, b)是由一對自旋組成的「梯級」?fàn)顟B(tài),(a', b')是鄰近梯級狀態(tài)。
假設(shè)一組梯級狀態(tài)按以下順序排列:(1, 1), (1, 2), (1, 3), (2, 1), (2, 2), (2, 3), (3, 1), (3, 2), (3, 3)。
若使用簡寫符號,則傳遞矩陣可以明確地表達(dá)為如下形式。
對于上面這個(gè)T'矩陣,AI被提示說,一定要確保,從而糾正它的錯(cuò)誤,并且識別出S_3的對稱群。
然后,AI被提示將T'進(jìn)行塊對角化。
它發(fā)現(xiàn),T'可以通過變換下列這個(gè)矩陣來進(jìn)行塊對角化,從而得到。
因此,得到的塊對角化傳遞矩陣的前2×2塊由
給出,其較大的特征值是λ,即傳遞矩陣T'的最大特征值。
最后,AI被提示生成上述對話的原生Wolfram Mathematica 14.2代碼。
這個(gè)任務(wù)在幾秒鐘內(nèi)就完成了,幾乎不需要修正。
然而,AI卻未能生成適用于一般q的可用Mathematica代碼。
相反,它警告說,隨著q的增加,S_q對稱群中的排列數(shù)會急劇增加。
當(dāng)被進(jìn)一步要求時(shí),AI創(chuàng)建了一些假M(fèi)athematica函數(shù),并表示「這些函數(shù)可能值得實(shí)現(xiàn)」。
五十年數(shù)學(xué)難題的精確解
考慮以下哈密頓量[圖1(a)]:
為了構(gòu)建轉(zhuǎn)移矩陣,研究者使用了重疊對的形式化方法來處理方程(1),每個(gè)單位格有一個(gè)自旋,得到轉(zhuǎn)移矩陣T。
同時(shí)使用該模型的等效鋸齒梯形表示,其中每個(gè)單位格有兩個(gè)自旋來獲得T′。
而且要滿足T′=T^2。
在熱力學(xué)極限N→∞時(shí),配分函數(shù)為
其中λ是轉(zhuǎn)移矩陣T的最大特征值。
每個(gè)自旋的自由能由下式給出:
其中,β=1/(k_BT),T是絕對溫度,k_B是玻爾茲曼常數(shù)。
由此得到的變換矩陣是一個(gè)q^2×2矩陣,它將q^2×q轉(zhuǎn)移矩陣T投影到與其余部分解耦的2×2塊矩陣T_2,并且該矩陣由于不同的對稱性,得到如下方程4:
需要注意的是,最大對稱子空間意味著u、v和w的表達(dá)式可以通過組合分析直接得到。
轉(zhuǎn)移矩陣T的最大特征值是T_2的較大特征值,為
方程(4)的簡潔性為理解一維J_1-J_2 Potts模型中的豐富相行為提供了直觀的視角。
圖1:(a)單鏈J_1?J_2 Potts模型的示意圖和(b)其等效的鋸齒梯形表示。圖中的小球代表具有q個(gè)狀態(tài)的自旋。橙色的鍵表示最近鄰相互作用J_1,綠色的鍵表示次近鄰相互作用J_2
Potts模型的歷史性進(jìn)展
為了深入理解這些豐富的相圖,首先分析基態(tài)的相行為。
在T=0時(shí),對于所有q值,一維J_1-J_2 Potts模型有三個(gè)相,這些相由兩個(gè)臨界點(diǎn)(CPs)分開,這些臨界點(diǎn)由方程(4)中u、w、v的相對大小決定。
對于q=2(即伊辛模型),與q≥3情況有兩個(gè)方面的不同:
(1)q=2的兩個(gè)臨界點(diǎn)是對稱相關(guān)的,位于J_1=±2,而對于q≥3,它們位于J_1=0和J_1=2。
(2)對于q=2,三個(gè)相沒有宏觀的簡并性,而對于q≥3,存在一個(gè)或兩個(gè)具有殘余熵的非平凡狀態(tài)。
圖3總結(jié)了左側(cè)和中間相以及兩個(gè)臨界點(diǎn)(CPs)殘余熵的q依賴關(guān)系。
對于小的q,臨界點(diǎn)的殘余熵(虛線)明顯大于相鄰相的殘余熵(實(shí)線)。
因此,每個(gè)臨界點(diǎn)在J_1?T相圖中隨著溫度升高發(fā)展出V形區(qū)域(圖2左,q=2,3,4)。
兩個(gè)臨界點(diǎn)的V形區(qū)域匯聚在一起,形成一個(gè)類似T_c圓頂?shù)膮^(qū)域,代表q≥3的中間隨機(jī)二聚化相。
當(dāng)系統(tǒng)靠近臨界點(diǎn)時(shí),它并不遵循常規(guī)的現(xiàn)象——即轉(zhuǎn)變到具有更高宏觀簡并性的相,而是轉(zhuǎn)變到臨界點(diǎn)發(fā)展的V形區(qū)域,這也在熵的T曲線中表現(xiàn)為平坦區(qū)域(圖2右q=2,3,4),此時(shí)熵值等于對應(yīng)臨界點(diǎn)的殘余熵。
圖2:q=2,3,4和10^6的相圖
圖2左:在J_1?T平面上,歸一化熵2S(J_1,T)/ln(q)的密度圖。
圖2右:在臨界點(diǎn)附近,選定J_1值的2S(J_1,T)/ln(q)的溫度依賴性。?J_2=1被設(shè)定為能量單位。
另一方面,圖3顯示,對于大的q,臨界點(diǎn)的殘余熵(虛線)趨近于其相鄰相的殘余熵(實(shí)線),最終變得無法區(qū)分——不再有V形的臨界點(diǎn)區(qū)域(圖2左,q=10^6)。
圖3:對于q≥3,在J_1的四個(gè)不同區(qū)域下,零溫度歸一化熵2S(J_1,0)/ln?q的依賴關(guān)系
當(dāng)系統(tǒng)靠近相邊界時(shí),它似乎遵循常規(guī)的現(xiàn)象,即轉(zhuǎn)變到具有更高宏觀簡并性的相。
特別是,當(dāng)J_1>2時(shí),低溫鐵磁相將經(jīng)歷一個(gè)兩步的相交叉:首先轉(zhuǎn)變到中間的隨機(jī)二聚化相,然后轉(zhuǎn)變到左側(cè)的順磁相。
Tc圓頂是非常規(guī)超導(dǎo)性(如銅氧化物、鐵基超導(dǎo)體、扭曲雙層石墨烯等)中的一個(gè)關(guān)鍵現(xiàn)象。
它已被解釋為(i)一種預(yù)形成的有序狀態(tài),隨著相位相干性的逐漸建立,或(ii)兩種競爭相的結(jié)果。
目前通過q依賴性出現(xiàn)和消失的類似圓頂?shù)慕Y(jié)構(gòu),這一結(jié)構(gòu)由相的兩個(gè)臨界點(diǎn)的殘余熵的相對強(qiáng)度控制,為形成圓頂形相提供了另一種可能性。
AI輔助科學(xué)研究,潛力巨大
總而言之,用簡單的話概括就是,一維J_1-J_2 q狀態(tài)Potts模型得到了精確解,其中的關(guān)鍵在于發(fā)現(xiàn)q^2×q^2轉(zhuǎn)移矩陣的最大特征值位于一個(gè)2×2的最大對稱子空間。
而且維J_1-J_2 q狀態(tài)Potts模型被證明與一維q狀態(tài)Potts模型等價(jià),其中J_2充當(dāng)最近鄰(NN)相互作用,J_1充當(dāng)磁場。
模型的基態(tài)被發(fā)現(xiàn)包含三個(gè)相,這些相由兩個(gè)臨界點(diǎn)分開,對于所有q值均如此。
兩個(gè)臨界點(diǎn)的殘余熵的相對強(qiáng)度,隨著q變大而變大。
對于小q和大q出現(xiàn)和消失的類似圓頂?shù)碾S機(jī)二聚化相,新研究提供了一種新的形成圓頂形相的機(jī)制。
而這項(xiàng)研究之所以能完成,都是基于o3-mini-high精確解決了q=3的情況。
這也提示我們,AI提供的廣泛信息中,能給研究者提供充分的洞察和激勵,盡管它的結(jié)論可能并不完美。
就在最近,諾獎得主、GoogleDeepMind CEO Demis Hassabis 評論AlphaFold時(shí)這樣表示:通過AI,人類現(xiàn)在可以在一年內(nèi)完成10億年的博士研究時(shí)間。
可以想見,未來AI輔助做出的科研突破還將層出不窮。