三體人有救了!深度學(xué)習(xí)解決三體難題
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)
過去的十年里,深度學(xué)習(xí)助推了多個(gè)領(lǐng)域的最新發(fā)展。Deepmind在蛋白質(zhì)折疊預(yù)測上的首次驚艷亮相,以及斯坦福大學(xué)學(xué)生研究蛋白質(zhì)復(fù)合體結(jié)合的項(xiàng)目,都是使用深度學(xué)習(xí)進(jìn)行細(xì)微研究的例子。
然而不止于此,深度學(xué)習(xí)的應(yīng)用已經(jīng)蔓延到了浩瀚宇宙之中。還記得連強(qiáng)大的三體人都對付不了的三個(gè)太陽嘛?沒錯(cuò),人工智能解決了。當(dāng)然不止這一項(xiàng)應(yīng)用,關(guān)于宇宙的研究包羅萬象。
本文將從機(jī)器學(xué)習(xí)和基礎(chǔ)科學(xué)的角度對項(xiàng)目的描述和影響進(jìn)行評分,不過,本文將根據(jù)主觀趣味性來判斷,而不是引用指標(biāo)。
來看看當(dāng)AI在更遠(yuǎn)的天際之中是如何大展身手的吧!
人工智能解決宇宙學(xué)中的三體問題
1. (Green等,2019) 概述:
總結(jié):訓(xùn)練多層感知器來預(yù)測簡單三體問題模擬中的未來狀態(tài)。
描述:4/3 三倍espressos。簡要來說,這個(gè)項(xiàng)目包含從可以解決困擾艾薩克·牛頓的復(fù)雜三體問題的人工智能,到以億倍速度解決三體問題的神經(jīng)網(wǎng)絡(luò)。
圖源:ambrozewicz
此描述源于研究論文中的描述性方法,這種方法似乎是經(jīng)過精確設(shè)計(jì)的,目的是讓專業(yè)領(lǐng)域之外的讀者在驚嘆不已。由于同時(shí)掌握深度學(xué)習(xí)和n體軌道力學(xué)的人寥寥可數(shù),因此讀者很容易被陌生的細(xì)節(jié)吸引而錯(cuò)過重點(diǎn)。
- 影響(機(jī)器學(xué)習(xí)):3/10致密層。在大卷積神經(jīng)網(wǎng)絡(luò)無處不在的時(shí)代,使用深度多層感知器是很有趣的。
- 影響(物理學(xué)):3/n個(gè)大質(zhì)量物體。
- 模型:具有ReLU激活的10層全連接神經(jīng)網(wǎng)絡(luò)。
- 輸入:三體之一的起始位置和目標(biāo)時(shí)間t。
- 輸出:三個(gè)粒子中的兩個(gè)在時(shí)間t的狀態(tài)。第三個(gè)粒子位置是由坐標(biāo)參考系體現(xiàn)的。
- 代碼:https://github.com/pgbreen/NVM (僅使用預(yù)先訓(xùn)練的模型權(quán)重進(jìn)行推斷)
2. 詳解人工智能如何解決宇宙學(xué)中的三體問題
在經(jīng)典軌道力學(xué)中,預(yù)測由兩個(gè)引力物體組成的單獨(dú)系統(tǒng)的未來狀態(tài)是比較容易的。再加上一個(gè)額外的物體,就有了著名的三體問題。
這是一個(gè)經(jīng)典的例子,說明了在一個(gè)看似簡單的系統(tǒng)的動(dòng)態(tài)相互作用中,混沌是如何出現(xiàn)的?;煦缦到y(tǒng)的一個(gè)特征是它們對初始條件表現(xiàn)出極端的敏感性,而且它們的行為似乎是隨機(jī)的。
這些狀態(tài)是很難預(yù)測的,而且混沌系統(tǒng)演化的時(shí)間越長,預(yù)測就越困難,因?yàn)橹暗腻e(cuò)誤會不斷累積。這就是為什么智能體在實(shí)心磁極上學(xué)習(xí)比在連接磁極上學(xué)習(xí)要容易得多:
像雙擺這樣的混沌系統(tǒng)很難預(yù)測和控制
就像強(qiáng)化學(xué)習(xí)智能體奮力控制雙擺一樣,科學(xué)家們也發(fā)現(xiàn)很難預(yù)測像三體問題那樣的混沌系統(tǒng)的未來狀態(tài)。想靠蠻力計(jì)算?不是不行,但并不總是清楚需要多少數(shù)值精度,而且可能消耗大量資源。
本文作者使用一個(gè)10層的多層感知器從三體軌道問題預(yù)測未來的狀態(tài)。訓(xùn)練數(shù)據(jù)由一個(gè)名為Brutus的蠻力數(shù)值模擬器計(jì)算。
筆者很喜歡看到“老式”的多層感知器,如果能欣賞在不同的訓(xùn)練超參數(shù)和不同的架構(gòu)下使用的代碼會很有趣。不幸的是,可用的公共代碼不提供任何訓(xùn)練工具。
筆者同意最近的懷疑論,因?yàn)檫@篇論文的聲明是由一個(gè)非常狹窄和簡化的用例支持的,不太可能輕易地推廣到更復(fù)雜的情況。但要補(bǔ)充的是,結(jié)果并不像他們所宣傳的那樣夸張。
當(dāng)模型被訓(xùn)練用以預(yù)測更遠(yuǎn)的未來時(shí),其性能顯著下降,平均絕對誤差范圍約為0.01至0.2。當(dāng)所討論的無單位數(shù)幾乎總是在-1和+1之間時(shí),這些誤差就很大。訓(xùn)練網(wǎng)絡(luò)進(jìn)一步預(yù)測未來也會導(dǎo)致訓(xùn)練集的過擬合,這個(gè)問題在討論中沒有提到。
圖源:radiichina
最有價(jià)值的領(lǐng)域:用深度學(xué)習(xí)發(fā)現(xiàn)更多系外行星
1. (Dattilo等,2019)概述機(jī)器學(xué)習(xí)如何幫助發(fā)現(xiàn)新行星
總結(jié):開普勒太空望遠(yuǎn)鏡在2013年發(fā)生故障,導(dǎo)致產(chǎn)生了大量噪音數(shù)據(jù)。研究人員訓(xùn)練出了AstroNet-K2,作為之前模型AstroNet的修改版本,利用新的噪音數(shù)據(jù),并發(fā)現(xiàn)了兩顆新的系外行星。這些行星通過后續(xù)觀測得到了驗(yàn)證。
- 描述:1/3三倍espressos。《麻省理工學(xué)院技術(shù)評論》的文章是合理的,沒有對該項(xiàng)目做出夸大或不切實(shí)際的評價(jià),但有時(shí)卻忽略了AstroNet-K2是基于一年前發(fā)布的AstroNet項(xiàng)目。
- 影響(機(jī)器學(xué)習(xí)):4/8卷積濾波器。AstroNet和AstroNet-K2之間的差異似乎在于超參數(shù)搜索和不同的數(shù)據(jù)集。
- 影響(系外行星天文學(xué)):AstroNet-K2發(fā)現(xiàn)了2/1076個(gè)已知[超級地球]
- (https://en.wikipedia.org/wiki/File:Size_of_Kepler_Planet_Candidates.jpg),并通過其他觀測得到驗(yàn)證。筆者認(rèn)為這個(gè)從本科開始的研究項(xiàng)目取得了非常有意義的成果。
- 模型:兩個(gè)獨(dú)立的卷積臂從輸入數(shù)據(jù)中提取特征。這些卷積層的輸出被輸入至四個(gè)完全連接的層,再輸出最終預(yù)測。輸入:開普勒望遠(yuǎn)鏡K2運(yùn)行的一維光曲線。
- 輸出:給定信號由凌日系外行星引發(fā)的概率。
- 代碼:https://github.com/aedattilo/models_K2
2. 詳解機(jī)器學(xué)習(xí)如何發(fā)現(xiàn)新行星
開普勒望遠(yuǎn)鏡是一臺天基望遠(yuǎn)鏡,旨在研究太陽系外的行星,也就是系外行星。1995年,迪迪埃·奎洛茲和米歇爾·馬約爾發(fā)現(xiàn)了第一顆圍繞著像我們這樣的恒星運(yùn)行的系外行星,并因此獲得了2019年諾貝爾物理學(xué)獎(jiǎng)。
圖源:unsplash
2009年開普勒發(fā)射后的十多年,已知系外行星總數(shù)還不到400顆。這架現(xiàn)已停用的望遠(yuǎn)鏡于2009年開始運(yùn)行,并發(fā)現(xiàn)了1000多顆新的系外行星,直到一個(gè)用于精確指向的反應(yīng)輪部件于2013年失效。這標(biāo)志著任務(wù)的主要階段結(jié)束。
一些巧妙的修改使望遠(yuǎn)鏡開始了第二個(gè)數(shù)據(jù)采集階段,稱為K2。來自K2的數(shù)據(jù)噪音較大,且僅限于80天或更短的連續(xù)觀察。
要在數(shù)千個(gè)假設(shè)的行星信號中識別有希望的候選行星,這些限制是很大的挑戰(zhàn),卷積神經(jīng)網(wǎng)絡(luò)(AstroNet)曾很好地處理過這項(xiàng)任務(wù),該網(wǎng)絡(luò)處理的是開普勒原始數(shù)據(jù)收集階段的數(shù)據(jù)。
得克薩斯大學(xué)奧斯汀分校的研究人員決定嘗試同樣的方法,并從AstroNet-K2的架構(gòu)中衍生出AstroNet-K2,對K2行星信號進(jìn)行排序。
經(jīng)過訓(xùn)練,AstroNet-K2在測試集中識別已確認(rèn)系外行星的準(zhǔn)確率達(dá)到98%,假陽性率很低。作者認(rèn)為這種性能足以用作需要人工跟蹤的分析工具,但還無法完全實(shí)現(xiàn)自動(dòng)化。論文如是說:
雖然我們網(wǎng)絡(luò)的性能還未完全達(dá)到產(chǎn)生全自動(dòng)和統(tǒng)一的行星候選表所需的水平,但它可以作為一個(gè)概念的證明。—— (Dattilo等,2019)
這篇文章賦予了AstroNet-K2人們夢寐以求的“最佳價(jià)值”獎(jiǎng),因?yàn)樗鼘?shí)現(xiàn)了一項(xiàng)重大的科學(xué)成果。與本文清單上其他兩個(gè)更多是概念性演示的項(xiàng)目不同,這一項(xiàng)目促成了實(shí)際的科學(xué)進(jìn)展,在已知系外行星目錄中增加了兩個(gè)新的確認(rèn)條目:EPIC246151543b和EPIC 246078672b。
除了K2數(shù)據(jù)的內(nèi)在挑戰(zhàn)外,因火星穿過觀測窗口,以及安全模式事件導(dǎo)致了5天的數(shù)據(jù)缺失,行星的信號更加混亂。
圖源:unsplash
這是一個(gè)很好的有效機(jī)器學(xué)習(xí)的例子:作者們采用了一個(gè)已有良好記錄的卷積神經(jīng)網(wǎng)絡(luò),并對其進(jìn)行了修改,使其在給定的數(shù)據(jù)上表現(xiàn)良好,在不重新發(fā)明的情況下,從一次艱難的觀察運(yùn)行中添加了一些新的發(fā)現(xiàn)。
值得注意的是,這項(xiàng)研究的主要作者AnneDattilo在完成這項(xiàng)工作時(shí)還是一名本科生。對于一個(gè)本科生的研究項(xiàng)目來說,這個(gè)結(jié)果已經(jīng)很好了。
作者使用了開放源碼軟件以及先前開發(fā)的架構(gòu),突出表明深度學(xué)習(xí)正處于高級準(zhǔn)備階段。這項(xiàng)技術(shù)還沒有完全成熟到無處不在的地步,但是工具已經(jīng)準(zhǔn)備好,隨時(shí)可以應(yīng)用。
CosmoGAN:引力透鏡的生成對抗網(wǎng)絡(luò)法
1. (Mustafa等,2019)概述
總結(jié):宇宙中有一些丟失的質(zhì)量,我們稱之為暗物質(zhì)。來自這些缺失質(zhì)量的引力使光線彎曲,宇宙學(xué)家可以根據(jù)光線被扭曲的方式來推測暗物質(zhì)的位置。
深層卷積生成對抗性網(wǎng)絡(luò)擅長制作逼真的圖像,這些研究人員對其進(jìn)行訓(xùn)練來制作與暗物質(zhì)分布相關(guān)聯(lián)的數(shù)據(jù)的圖像。
- 描述:1/3三倍espressos?;旧夏苷业降年P(guān)于這篇論文的所有新聞報(bào)道都來自于勞倫斯伯克利國家實(shí)驗(yàn)室的報(bào)道,這項(xiàng)工作就是在這一實(shí)驗(yàn)室開展的。因此,這些報(bào)道并不會過分夸張或離奇,盡管對CosmoGAN實(shí)際用途的描述是模糊的(但這篇論文在這方面也不是很清楚)。筆者最喜歡的標(biāo)題是宇宙科學(xué)家用神經(jīng)網(wǎng)絡(luò)簡單地構(gòu)建暗物質(zhì)地圖。
- 影響(機(jī)器學(xué)習(xí)):6/64個(gè)潛在空間隨機(jī)變量。這是一個(gè)普通DCGAN,被訓(xùn)練用于模擬引力弱透鏡數(shù)據(jù)。
- 影響(宇宙學(xué)):10個(gè)中有1個(gè)的質(zhì)量是不可觀測的。
- 模型:CosmoGAN是一個(gè)DCGAN。每個(gè)網(wǎng)絡(luò)有4層,但是由于卷積濾波器較少,生成器具有比鑒別器(440萬)多約3倍的參數(shù)(1230萬)。參數(shù)視差是為了穩(wěn)定訓(xùn)練,保持鑒別器不偏離生成器。
- 輸入:64單位潛矢量(生成器),由CosmoGAN生成和模擬的(數(shù)值物理模擬器)弱透鏡收斂圖的二維圖像,可以對應(yīng)暗物質(zhì)分布(鑒別器),并與暗物質(zhì)分布(鑒別器)進(jìn)行比較。
- 輸出:可能的收斂圖(生成器),或給定圖像是真實(shí)(模擬)收斂圖(鑒別器)的概率
- 代碼:https://github.com/MustafaMustafa/cosmoGAN
2. 詳解生成對抗性網(wǎng)絡(luò)如何促成更好的引力透鏡
暗物質(zhì)是一種比較神秘的物質(zhì)形式,它占(普遍認(rèn)為)宇宙質(zhì)量的相當(dāng)大比例(約85%)。
“暗”指的是這種形式的物質(zhì)在正常觀測中是看不見的,而只能從引力效應(yīng)中推斷出來,就像Vera Rubin在20世紀(jì)60年代觀測到的銀河系旋轉(zhuǎn)速度的差異一樣。
研究暗物質(zhì)的一個(gè)基本可觀測因素是引力透鏡效應(yīng),在引力透鏡效應(yīng)中,大質(zhì)量物體會扭曲來自更遙遠(yuǎn)物體的光線。當(dāng)透鏡效應(yīng)是由不可見的暗物質(zhì)引起時(shí),這就成為一個(gè)困難的反問題,需要大量模擬來解決。
圖源:unsplash
“如果你想從頭開始做一個(gè)蘋果派,你必須先發(fā)明宇宙”(Carl Sagan, Cosmos,《Carl Sagan, 宇宙》)。研究暗物質(zhì)的存在也是一樣的:基于引力透鏡觀測建立暗物質(zhì)圖的標(biāo)準(zhǔn)方法是創(chuàng)造一個(gè)(虛擬的)宇宙。
眾所周知,創(chuàng)造宇宙需要非常昂貴的計(jì)算費(fèi)用,同時(shí),為了檢驗(yàn)一個(gè)高度模擬的宇宙是否與觀測結(jié)果一致,會大大限制所能完成的科學(xué)工作量。
當(dāng)數(shù)據(jù)非常豐富,而足夠的計(jì)算量卻很少時(shí),科學(xué)家們就會尋找方法來開發(fā)能夠解釋這些數(shù)據(jù)的替代模型,而不必每次都建立一個(gè)全新的宇宙。CosmoGAN就是這樣一種方法,它利用現(xiàn)代深度學(xué)習(xí)生成網(wǎng)絡(luò)來估算引力透鏡數(shù)據(jù)的收斂圖。
自Goodfellow等人在2014年提出生成對抗網(wǎng)絡(luò)以來,它已經(jīng)取得了長足的進(jìn)步。GAN框架是生成模型的一個(gè)(現(xiàn)在相當(dāng)多樣化的)利基,它將生成網(wǎng)絡(luò)與鑒別或偽造檢測網(wǎng)絡(luò)相較。這兩個(gè)網(wǎng)絡(luò)相互對抗,產(chǎn)生越來越真實(shí)的合成數(shù)據(jù),而鑒別器在檢測偽造方面也越來越好。
這種交互提供了純GAN訓(xùn)練循環(huán)中唯一必需的訓(xùn)練信號(盡管conditionalGANs這樣的變體可能會使用額外的數(shù)據(jù)),因此,在GAN訓(xùn)練中平衡兩個(gè)網(wǎng)絡(luò)是一門藝術(shù),而眾所周知,當(dāng)這種平衡不均衡時(shí),GAN容易出現(xiàn)不穩(wěn)定的問題。
GANs十分難于訓(xùn)練和解釋,但計(jì)算宇宙學(xué)家中有很多人參與了相關(guān)實(shí)踐,這可能會讓人有點(diǎn)驚訝。然而,CosmoGAN的范圍相當(dāng)有限。生成器學(xué)習(xí)模擬統(tǒng)計(jì)上真實(shí)的收斂映射圖像,但這些與潛在空間中的隨機(jī)輸入無關(guān)。
在這種情況下,像古老的edges2cats演示背后的pix2pix方案這樣的conditionalGAN更有意義。這就是說,生成一張收斂圖是有用的,該圖可以合理地解釋給定天文圖像中的透鏡現(xiàn)象,這可以通過額外的觀測得到驗(yàn)證。
還有,生成器產(chǎn)生的收斂圖是2維的,但暗物質(zhì)實(shí)際上會分布在3維。作者們表示,其中一些局限性將在未來的工作中得到解決。
例如,一個(gè)“可控GAN(controllable GAN)”的提法聽起來與上面提到的conditionalGAN類似,而且他們確實(shí)打算為體積暗物質(zhì)分布制作一個(gè)3維版本。如果是這樣的話,這個(gè)項(xiàng)目中的85%目前還無法觀察到。
毫無疑問,這三項(xiàng)應(yīng)用讓我們看到了機(jī)器學(xué)習(xí)在宇宙學(xué)中的無限潛力,它們帶來了不可思議的發(fā)現(xiàn)和突破。事實(shí)上這并不難,不需要大膽地探索沒有科學(xué)家去過的地方,只是巧妙地實(shí)施一種經(jīng)過驗(yàn)證的技術(shù),適應(yīng)并應(yīng)用于一個(gè)新的數(shù)據(jù)集,就能有發(fā)現(xiàn),即使這只是使用模擬數(shù)據(jù)的概念探索。
但另一個(gè)問題是過度夸張,無論是媒體報(bào)道還是論文中的描述,這樣夸張的描述給AI的發(fā)展造成困擾。過度的描述會造成非生產(chǎn)性的反饋循環(huán),會導(dǎo)致經(jīng)濟(jì)/技術(shù)泡沫和研究資源的低效分配。這一點(diǎn)亟需被注意起來。