Nature論文驗(yàn)證xAI目標(biāo),人類認(rèn)知AI探索宇宙本質(zhì),馬斯克:別說了我打錢!
馬老板前幾天剛剛官宣了他的AI公司xAI,要利用AI探索宇宙的本質(zhì)。
好巧不巧,就在馬老板到處搖人攢xAI的時(shí)候,科學(xué)界好像也和他心有靈犀,在Nature上發(fā)了一篇堪稱「xAI目標(biāo)的可行性報(bào)告」的論文。
論文地址:https://www.nature.com/articles/s41562-023-01648-z#auth-Jamshid-Sourati
這篇名為「用人類意識(shí)加持的AI加速科學(xué)發(fā)展」的論文,用科學(xué)嚴(yán)謹(jǐn)?shù)姆椒ㄗ屗匈|(zhì)疑馬老板在畫大餅的人暫時(shí)閉了嘴。
馬老板看過之后,估計(jì)心里就十個(gè)字,打錢*5!
論文作者芝加哥大學(xué)的James Evans教授用一句話總結(jié)了這篇論文:
如果人類(用AI)增強(qiáng)了對(duì)自己在做什么的認(rèn)知,就可以改進(jìn)預(yù)測(cè),并超越自身,從而加速科學(xué)的發(fā)展!
AI批評(píng)家馬庫(kù)斯也轉(zhuǎn)發(fā)了這篇論文,希望人們能從對(duì)大模型的狂熱中勻出點(diǎn)關(guān)注度給其他的AI相關(guān)進(jìn)展。
就像馬斯克在xAI的誓師大會(huì)上提到的。
如果未來出現(xiàn)的AGI不能幫助人類對(duì)一些困擾人類的本源問題做出解答,那它就不配被稱為AGI。
同樣,AI技術(shù)如果只是幫大學(xué)生糊弄下期末作業(yè),不能幫助人類拓寬認(rèn)知邊界,那和英偉達(dá)的顯卡只用來打游戲,卻不用來訓(xùn)練AI一樣,暴殄天物!
論文內(nèi)容概述
具體來說,研究人員想要探索如何將人類意識(shí)與人工智能模型相結(jié)合來加速科學(xué)發(fā)展。
通過實(shí)驗(yàn)和數(shù)據(jù)集對(duì)比后,發(fā)現(xiàn)人工智能模型可以模擬人類科學(xué)家的推論,從而預(yù)測(cè)未來的發(fā)現(xiàn),也能產(chǎn)生有價(jià)值的補(bǔ)充假設(shè),還能幫助科學(xué)家避開那些沒有前景的研究。
根據(jù)已發(fā)表的科學(xué)發(fā)現(xiàn)進(jìn)行訓(xùn)練的AI模型,已經(jīng)在材料科學(xué)領(lǐng)域幫助發(fā)明了有價(jià)值的材料,或者是在醫(yī)學(xué)領(lǐng)域發(fā)現(xiàn)了靶向療法。
但這樣的AI只針對(duì)已有的科學(xué)發(fā)現(xiàn)進(jìn)行了訓(xùn)練,沒有結(jié)合更加專業(yè)的科學(xué)家認(rèn)知。
研究人員在論文中表明,通過在人類專家可認(rèn)知的推理上訓(xùn)練無監(jiān)督模型來整合人類專業(yè)知識(shí)的分布,可以顯著提高(高達(dá)400%)AI對(duì)未來科學(xué)發(fā)現(xiàn)的預(yù)測(cè)能力。
這樣的方法大大超越了僅針對(duì)具體研究?jī)?nèi)容進(jìn)行訓(xùn)練的AI預(yù)測(cè)。
尤其是在相關(guān)文獻(xiàn)和成果比較稀少的領(lǐng)域,這個(gè)方法的效果尤為明顯。
這類模型成功地預(yù)測(cè)了科學(xué)家將會(huì)做出的預(yù)測(cè)。
而且研究人員通過這個(gè)方式對(duì)「外星人」假設(shè)進(jìn)行了科學(xué)的預(yù)測(cè)。
而如果沒有AI的幫助,人類在短期之內(nèi)是不可能解決這類假設(shè)的。
研究人員相信,具有人類意識(shí)的人工智能能夠加速人類的發(fā)現(xiàn)或探索人類的盲點(diǎn),使人類能夠快速地大幅拓展科學(xué)的邊界。
具體來說,研究人員首先將科學(xué)發(fā)現(xiàn)定義為:
首次報(bào)告現(xiàn)有材料與明確定義的屬性之間的關(guān)系。
例如,「萬古霉素可用于治療肺炎」,其中萬古霉素是材料,有效治療肺炎是屬性。
然后,研究人員的方法利用了對(duì)候選發(fā)現(xiàn)中涉及的每個(gè)主題集結(jié)的人類科學(xué)家分布的確定量,利用無監(jiān)督流形學(xué)習(xí)(unsupervised manifold learning)的技術(shù),結(jié)合可以獲取到的出版物原始數(shù)據(jù)進(jìn)行分析。
研究人員擴(kuò)展了這種研究方法,用來識(shí)別更廣泛的材料及其功能屬性的矩陣,預(yù)測(cè)了治療一百多種不同人類疾病的數(shù)千種藥物的發(fā)現(xiàn),其中包括針對(duì)COVID-19的疫苗和療法。
研究方法
每個(gè)發(fā)科學(xué)現(xiàn)的預(yù)測(cè)實(shí)驗(yàn)包括一個(gè)目標(biāo)屬性和一組材料,其中材料由一個(gè)預(yù)測(cè)器進(jìn)行評(píng)分,并選擇得分最高的50種材料作為預(yù)測(cè)結(jié)果。
每個(gè)預(yù)測(cè)器通過計(jì)算材料與屬性之間的相似度來對(duì)個(gè)別材料進(jìn)行評(píng)分。
基于研究人員的超圖(Hepergraph)的預(yù)測(cè)器使用的相似性度量包括材料節(jié)點(diǎn)和屬性節(jié)點(diǎn)之間具有一個(gè)和兩個(gè)中間作者節(jié)點(diǎn)的轉(zhuǎn)移概率(因此是兩步和三步的轉(zhuǎn)移,即s=2和s=3),以及在deepwalk嵌入空間中的余弦相似度。
前者可以通過貝葉斯規(guī)則計(jì)算,無需生成隨機(jī)游走(randam walk),但后者需要在研究人員的超圖上顯式生成一組隨機(jī)行走序列。
基于內(nèi)容的復(fù)制基線中的相似性度量是在在預(yù)測(cè)年份之前產(chǎn)生的出文獻(xiàn)語料庫(kù)上訓(xùn)練的Word2Vec模型的嵌入空間中的余弦相似度。
每個(gè)屬性和潛在材料集合的出版物語料庫(kù)和真實(shí)發(fā)現(xiàn)結(jié)果的準(zhǔn)備方式各不相同。
用超圖來將人類專家進(jìn)行整合
研究人員通過構(gòu)建一個(gè)基于研究出版物的超圖(Hypergraph)來對(duì)科學(xué)家集體和認(rèn)知上可訪問的推論分布進(jìn)行共同建模。
超圖是一個(gè)廣義的圖,其中一條邊連接的是一組節(jié)點(diǎn)而不是節(jié)點(diǎn)對(duì)。
研究人員的研究超圖是混合的,其中的節(jié)點(diǎn)不僅對(duì)應(yīng)于標(biāo)題或摘要中提到的材料和屬性,還包括研究它們的科學(xué)家(如下圖)。
圖片
在構(gòu)建研究超圖之后,研究人員通過在其上生成隨機(jī)游走序列來識(shí)別認(rèn)知上可訪問的推斷。
這些游走為人類科學(xué)家提供了推理路徑,并追蹤發(fā)現(xiàn)了足以為前沿研究提供的各種專業(yè)知識(shí)的混合路徑。
如果一個(gè)科學(xué)家在先前的研究中使用過鉛鈦酸鉛(PbTiO3)這種鐵電材料(可逆的電極化現(xiàn)象,用于傳感器中),那么在研究具有價(jià)值的材料性質(zhì)(例如鐵電性)時(shí),這個(gè)科學(xué)家更有可能考慮鉛鈦酸鉛是否具有鐵電性,而沒有研究經(jīng)驗(yàn)的科學(xué)家則不太可能這樣做。
如果這個(gè)科學(xué)家后來與之前曾經(jīng)研究過亞硝酸鈉(NaNO2)這種鐵電材料的另一個(gè)科學(xué)家合作發(fā)表論文,那么通過對(duì)話,這個(gè)科學(xué)家更有可能想象亞硝酸鈉是否具有這種屬性,而沒有這種個(gè)人聯(lián)系的科學(xué)家則不太可能這樣做。
通過這種方式,研究人員的研究超圖上的隨機(jī)游走密度與認(rèn)知上的合理性和通過對(duì)話獲得的推論密度成比例。
如果兩個(gè)文獻(xiàn)沒有共著的科學(xué)家,那么在研究超圖中,隨機(jī)游走就很少會(huì)將其橋接。
就像一位科學(xué)家很少會(huì)考慮將一個(gè)只有一個(gè)領(lǐng)域重視的屬性,但與另一個(gè)完全不相干的領(lǐng)域所了解的材料聯(lián)系起來一樣(如下圖)。
研究人員假設(shè),識(shí)別周圍具有高人類專家密度的主題將會(huì)為研究人員提供近期發(fā)現(xiàn)的有價(jià)值的信息信號(hào)。
就超圖中在它們之間移動(dòng)所需的步數(shù)而言,這些主題在超圖中相隔甚遠(yuǎn),需要許多步才能在它們之間游走。但是如果中間步驟在社會(huì)中交叉足夠密集,且便于談話和協(xié)作,那么隨機(jī)游走和科學(xué)思維可以輕松地在它們之間旅行(上圖)。
為了生成每個(gè)隨機(jī)游走序列,模型 (i) 以一個(gè)有價(jià)值的屬性(例如鐵電性)作為序列中的第一個(gè)節(jié)點(diǎn)開始游走,(ii) 隨機(jī)選擇提到該屬性的一篇文章(超邊),(iii) 從那篇文章中隨機(jī)選擇一個(gè)材料或作者作為下一個(gè)節(jié)點(diǎn),然后通過隨機(jī)選擇與新選擇的材料或作者有關(guān)的另一篇文章開始第二步,并重復(fù)這個(gè)馬爾可夫過程 (Markov process)預(yù)定次數(shù)(如下圖)。
圖片
每一步隨機(jī)游走都可以看作是對(duì)人類行為的模擬:
作者-作者步模擬了兩個(gè)專家合作者之間的網(wǎng)絡(luò)或談話;
作者-材料或作者-屬性步表示作者對(duì)他們研究和發(fā)表過的所選材料/屬性非常熟悉;
材料/屬性-材料/屬性步抓住了這種轉(zhuǎn)變可能通過讀取一系列科學(xué)文章而為人類科學(xué)家實(shí)現(xiàn)的可能性。
但由于某些學(xué)科間的協(xié)作特性,研究超圖中的作者節(jié)點(diǎn)遠(yuǎn)遠(yuǎn)多于材料。為了補(bǔ)償這種不平衡,研究人員設(shè)計(jì)了一個(gè)非均勻采樣分布,其參數(shù)化由α決定。
α粗略地確定了結(jié)果序列中的材料與作者節(jié)點(diǎn)的比例。具體地,當(dāng)從一篇論文中采樣一個(gè)節(jié)點(diǎn)時(shí)(例如上述(iii)中),定義α以使選擇材料的概率是選擇作者的α倍(如下圖)。
圖片
較大的α值會(huì)導(dǎo)致更頻繁地對(duì)材料進(jìn)行采樣,模擬研究人員將主要通過研究和閱讀來發(fā)現(xiàn)新的科學(xué)可能性;
α值越小,作者選擇的頻率越高,這意味著研究主要通過社會(huì)網(wǎng)絡(luò)、交流對(duì)話和與該領(lǐng)域的其他人協(xié)作進(jìn)行發(fā)現(xiàn)。
在混合超圖上進(jìn)行的隨機(jī)游走會(huì)在節(jié)點(diǎn)之間誘導(dǎo)有意義的鄰近關(guān)系:
兩個(gè)作者之間的鄰近關(guān)系暗示著他們具有相似的研究興趣和經(jīng)歷;
一個(gè)材料與一個(gè)屬性之間的鄰近關(guān)系反映了該材料可能具有該屬性的可能性,也反映了一位科學(xué)家可能會(huì)通過研究經(jīng)驗(yàn)、相關(guān)閱讀或社會(huì)互動(dòng)而熟悉該材料的可能性;
一個(gè)材料與一位科學(xué)家之間的鄰近關(guān)系評(píng)估了其是否已經(jīng)或?qū)⒁煜つ欠N材料的可能性;
兩個(gè)材料之間的鄰近關(guān)系暗示著它們可能是替代品、互補(bǔ)品,或者共享另一種更微妙的關(guān)系,如相互作用或比較。
最后,一個(gè)材料與一個(gè)屬性之間的鄰近關(guān)系會(huì)揭示該科學(xué)家可能會(huì)發(fā)現(xiàn)和發(fā)表該材料(如下圖)。
通過這種方式,超圖誘導(dǎo)的鄰近關(guān)系結(jié)合了文獻(xiàn)中潛在的物理和材料屬性,也結(jié)合了人類科學(xué)家的分布。
這使研究人員能預(yù)測(cè)那些科學(xué)家的推斷并預(yù)測(cè)即將到來的發(fā)現(xiàn)。
人類科學(xué)家的分布能從科學(xué)家們出席會(huì)議和調(diào)查他們的領(lǐng)域中,尋找到有前途的新方向。
為了預(yù)測(cè)具有重要屬性材料的潛在發(fā)現(xiàn),研究人員利用隨機(jī)游走誘導(dǎo)的節(jié)點(diǎn)相似性指標(biāo)來捕獲目標(biāo)屬性與候選材料之間的相關(guān)性。
這些指標(biāo)在屬性/材料節(jié)點(diǎn)對(duì)之間進(jìn)行評(píng)估,反映了相應(yīng)節(jié)點(diǎn)的人類可推斷相關(guān)性,并對(duì)候選材料進(jìn)行排序,報(bào)告那些推斷擁有該屬性排名最高的材料。
這種簡(jiǎn)單的度量利用局部超圖結(jié)構(gòu)來估計(jì)隨機(jī)步行者在固定步數(shù)(用s表示)內(nèi)通過中間作者節(jié)點(diǎn)從屬性節(jié)點(diǎn)移動(dòng)到材料的過渡概率。
研究人員使用貝葉斯規(guī)則來計(jì)算這些概率,而無需實(shí)際運(yùn)行隨機(jī)游走采樣器(如下圖)。
在這里,只需要考慮兩步和三步轉(zhuǎn)移(s=2和s=3)。然而,研究的主要指標(biāo)選擇基于一個(gè)流行的無監(jiān)督神經(jīng)網(wǎng)絡(luò)嵌入算法(deepwalk),它是在研究生成的隨機(jī)游走上進(jìn)行估計(jì)的。
雖然基于文本嵌入,主要捕獲的是詞之間的語義相關(guān)性,但此研究方法能夠保留所有節(jié)點(diǎn)之間的超圖鄰近關(guān)系,同時(shí)還能獲得詞向量。
因此結(jié)果可以用來測(cè)量每個(gè)材料相對(duì)于目標(biāo)屬性的人類認(rèn)知可及性。
因?yàn)橥茢喑霭l(fā)現(xiàn)涉及的相關(guān)材料,研究人員在從隨機(jī)游走序列中排除了作者,并將訓(xùn)練后的deepwalk嵌入模型(下圖)。
結(jié)果嵌入空間中的余弦相似度可以用作相關(guān)性指標(biāo)。
研究人員使用這兩個(gè)相關(guān)性指標(biāo):轉(zhuǎn)移概率和deepwalk相似度,作為選擇最有可能出現(xiàn)為下一個(gè)發(fā)現(xiàn)的材料的雙重標(biāo)準(zhǔn)。
另外,研究還訓(xùn)練了更深的圖卷積神經(jīng)網(wǎng)絡(luò)。這確認(rèn)了從deepwalk獲得的結(jié)果模式。
總的來說,研究通過構(gòu)建包含多類節(jié)點(diǎn)的超圖,在上面模擬科學(xué)家行為,來捕捉科學(xué)認(rèn)知和協(xié)作的特點(diǎn),從而預(yù)測(cè)科學(xué)發(fā)現(xiàn)。
這項(xiàng)研究不僅考慮節(jié)點(diǎn)內(nèi)容,也考慮科學(xué)家分布,能使模型結(jié)果更符合人類思維。
參與人類發(fā)現(xiàn)的成果
為了證明人類專家的計(jì)算能力,研究人員使用轉(zhuǎn)移概率和deepwalk指標(biāo)來構(gòu)建兩個(gè)替代的發(fā)現(xiàn)預(yù)測(cè)器。
這些算法通過嵌入人類感知的超圖,根據(jù)給定預(yù)測(cè)年份(例如2001年)之前發(fā)表的文獻(xiàn)來評(píng)估焦點(diǎn)屬性與每個(gè)候選材料的相關(guān)性。
研究人員將他們的預(yù)測(cè)與隨機(jī)基線和精確復(fù)制的先前工作生成的預(yù)測(cè)進(jìn)行對(duì)比,這些預(yù)測(cè)使用基于科學(xué)文獻(xiàn)文本內(nèi)容的詞嵌入,而不考慮人類科學(xué)家的分布。
這項(xiàng)準(zhǔn)備工作通過Word2Vec模型的余弦相似性來衡量屬性/材料的相關(guān)性,該模型是根據(jù)預(yù)測(cè)年之前發(fā)表的科學(xué)文章的內(nèi)容進(jìn)行訓(xùn)練的。
研究人員的實(shí)驗(yàn)和評(píng)估框架與本研究的設(shè)置相同,以便于精確復(fù)制。
每個(gè)評(píng)估的算法都會(huì)根據(jù)超圖或Word2Vec相似性度量選擇與焦點(diǎn)屬性最相似的50種材料,并將它們報(bào)告為發(fā)現(xiàn)預(yù)測(cè)。
研究人員根據(jù)預(yù)測(cè)年份與發(fā)現(xiàn)和發(fā)布的材料的重疊來評(píng)估預(yù)測(cè)質(zhì)量。
能源相關(guān)材料預(yù)測(cè)
在研究人員的第一組實(shí)驗(yàn)中,他們針對(duì)10萬種候選無機(jī)化合物考慮了熱電、鐵電和光伏容量的寶貴電化學(xué)特性。
在同一數(shù)據(jù)集(有關(guān)無機(jī)材料的150萬篇科學(xué)文章)上,研究團(tuán)隊(duì)針對(duì)2001 年所有三個(gè)屬性的預(yù)測(cè)進(jìn)行了預(yù)測(cè)實(shí)驗(yàn),預(yù)測(cè)未來的發(fā)現(xiàn)作為當(dāng)代科學(xué)家公開研究的函數(shù)。
他們計(jì)算了預(yù)測(cè)年份之后的年度精度,直到2018年底(下圖1)并以累積方式將其可視化(下圖2)。結(jié)果表明,考慮到人類科學(xué)家分布的預(yù)測(cè)對(duì)所有屬性和材料的預(yù)測(cè)平均優(yōu)于基線100%。
圖1
藥物重新利用的預(yù)測(cè)
研究人員使用相同的方法來探索約4K種FDA批準(zhǔn)的現(xiàn)有藥物的重新利用,以治療100種重要的人類疾病。
他們使用生物醫(yī)學(xué)研究的MEDLINE數(shù)據(jù)庫(kù)文獻(xiàn)并將預(yù)測(cè)年份設(shè)置為2001年(下圖)。
事實(shí)真相的發(fā)現(xiàn)是基于比較毒理學(xué)數(shù)據(jù)庫(kù)(CTD)的專家管理者建立的藥物與疾病的關(guān)聯(lián),該數(shù)據(jù)庫(kù)記錄了化學(xué)品影響人類健康的能力。
下圖報(bào)告了預(yù)測(cè)年份18年后的預(yù)測(cè)精度,揭示了在研究人員的無監(jiān)督超圖(unsupervized hypergraph)嵌入中考慮生物醫(yī)學(xué)專家的分布如何產(chǎn)生,比僅考慮研究?jī)?nèi)容的相同模型高43%的預(yù)測(cè)精度。
研究人員發(fā)現(xiàn)他們的人類感知預(yù)測(cè)精度與文獻(xiàn)中的藥物出現(xiàn)頻率之間存在很強(qiáng)的相關(guān)性(r=0.74,p<0.001),這意味著研究人員的方法最適合先前研究中經(jīng)常提到相關(guān)藥物的疾病。
COVID-19治療和疫苗預(yù)測(cè)
研究人員還考慮了治療或預(yù)防SARS-CoV-2感染的療法和疫苗。
這里,預(yù)測(cè)年定為2020年(下圖),全球范圍內(nèi)開始認(rèn)真尋找相關(guān)藥物和疫苗。
繼先前研究之后,如果一種療法能夠匯集和COVID-19臨床案例相關(guān)的實(shí)質(zhì)性證據(jù),那么研究人員考慮認(rèn)為這種療法與COVID-19相關(guān)。
如下圖所示的結(jié)果表明,通過轉(zhuǎn)移概率和基于深度游走(deepwalk)的指標(biāo)做出的預(yù)測(cè),分別有36%和38%的預(yù)測(cè),被專家在預(yù)測(cè)日期后12個(gè)月內(nèi)進(jìn)行了大規(guī)模的臨床試驗(yàn)來進(jìn)行評(píng)估(即到2020年12月為止),到2021年7月底,這一比例進(jìn)一步增加到42%。
這比僅由科學(xué)內(nèi)容加持的AI模型生成的候選發(fā)現(xiàn)的精確度高出350至400%(第一次發(fā)現(xiàn)后的精確度為10%,到2021年7月精確度為12%)。
這些COVID-19預(yù)測(cè)的成功表明,對(duì)COVID療法和疫苗的快節(jié)奏研究如何提高了科學(xué)家先前研究經(jīng)驗(yàn)和網(wǎng)絡(luò)的重要性。
針對(duì)人類的預(yù)測(cè)
研究人員的預(yù)測(cè)模型利用發(fā)現(xiàn)的專家分布,成功改進(jìn)了發(fā)現(xiàn)預(yù)測(cè)。
為了證明這一點(diǎn),研究人員考慮了從預(yù)測(cè)年份開始科學(xué)家做出發(fā)現(xiàn)所需的時(shí)間。
認(rèn)知上接近研究特定屬性的研究人員社區(qū)的材料會(huì)受到更多關(guān)注,并且它們與該屬性的關(guān)系可能比遠(yuǎn)離社區(qū)的材料更早被調(diào)查、發(fā)現(xiàn)和發(fā)布。
換句話說,發(fā)現(xiàn)的「等待時(shí)間」應(yīng)該與認(rèn)識(shí)到某個(gè)屬性和候選材料的專家群體的規(guī)模成反比。
研究者通過將屬性/材料對(duì)之間的人類專家密度定義為兩組人類專家的杰卡德(Jaccard)指數(shù)來衡量這一群體的規(guī)模:在最近的文獻(xiàn)中提到該屬性的人和提到每種候選材料的人(下圖),這個(gè)圖衡量了社區(qū)研究屬性和質(zhì)量之間的重疊百分比。
對(duì)于前面提到的所有三種電化學(xué)特性、COVID-19療法和疫苗,以及上面考慮的100種疾病中的大多數(shù),研究發(fā)現(xiàn)日期和專家密度之間的相關(guān)性是負(fù)的、顯著的和實(shí)質(zhì)性的(如下圖)。
這一結(jié)果證實(shí)了研究人員的假設(shè),即受到更大量專家關(guān)注的材料會(huì)更早被發(fā)現(xiàn)。
研究人員的預(yù)測(cè)模型有效地利用過去文獻(xiàn)的超圖來合并展示了這些人類專家密度(下圖)。
基于嵌入鄰近度可以得出類似的結(jié)果如:
下圖說明了研究人員的預(yù)測(cè)如何聚集在人類專家及其研究的材料的聯(lián)合嵌入空間中的密度峰值上。
這進(jìn)一步證明,研究人員的關(guān)注人類專家的方法可能會(huì)選中更容易被該領(lǐng)域的專家接觸到的科學(xué)發(fā)現(xiàn)。
對(duì)于補(bǔ)充人類發(fā)現(xiàn)的成果
研究人員可以利用人類認(rèn)知可用性模型不僅可以接近和模仿,還可以回避沒有前景的研究和補(bǔ)充人類專家的分布。
人類的概念聯(lián)系是由先前的發(fā)現(xiàn)及其發(fā)現(xiàn)者引導(dǎo)的(如下圖)。
為了構(gòu)建具有人類意識(shí)的AI,提出科學(xué)家不可能想象的概念聯(lián)系,研究人員使用混合超圖中作者互連的概念節(jié)點(diǎn)對(duì)之間的最短路徑距離(SPD),來反轉(zhuǎn)了測(cè)量人類認(rèn)知可認(rèn)識(shí)性的方法。
為了排除缺乏科學(xué)前景的候選假設(shè),研究人員將認(rèn)知不可用性與科學(xué)合理性信號(hào)結(jié)合起來。
該信號(hào)可以由已發(fā)表的研究文獻(xiàn)的內(nèi)容提供,并通過無監(jiān)督的知識(shí)嵌入模型進(jìn)行量化。
或者說,科學(xué)合理性的信號(hào)可以從理論驅(qū)動(dòng)的材料特性模型中得出。
在這里,研究中的算法使用無監(jiān)督的知識(shí)嵌入,保留理論驅(qū)動(dòng)的屬性模擬來評(píng)估預(yù)測(cè)結(jié)果的價(jià)值和人類互補(bǔ)性。
具體來說,研究人員使用該假設(shè)中涉及的材料和屬性節(jié)點(diǎn)的嵌入向量之間的余弦相似性來預(yù)測(cè)任何給定假設(shè)的科學(xué)價(jià)值。
下圖概述了研究人員的算法方法,以此識(shí)別科學(xué)上合理且人類無法認(rèn)知或互補(bǔ)的發(fā)現(xiàn)。
以從文獻(xiàn)中提取出一個(gè)候選材料池為開頭,研究人員在先前的分析基礎(chǔ)上以集成的方式計(jì)算人類可訪問性和科學(xué)合理性信號(hào),以生成類似人類的預(yù)測(cè)。
在之前的文獻(xiàn)中使用無監(jiān)督詞嵌入模型,以嵌入內(nèi)的余弦距離來衡量科學(xué)相關(guān)性。
評(píng)估發(fā)現(xiàn)的預(yù)測(cè)
研究人員的人類感知模型旨在讓他們能夠調(diào)整預(yù)測(cè)與近期人類發(fā)現(xiàn)的相似程度。
隨著增加??,算法會(huì)避免人類可訪問的位于高專家密度區(qū)域內(nèi)的推論,并專注于跨越學(xué)科鴻溝并逃避人類注意力的候選材料和屬性。
結(jié)果強(qiáng)烈證實(shí)了研究預(yù)期,即以較高??值推斷的材料不太容易被人類科學(xué)家發(fā)現(xiàn)(下圖)。
此外,距離超圖中給定屬性較遠(yuǎn)的材料預(yù)計(jì)在較長(zhǎng)時(shí)間內(nèi)對(duì)于該屬性附近的科學(xué)家來說仍然無法認(rèn)知(如下圖)。
該領(lǐng)域的研究人員需要更多的時(shí)間來彌合將不熟悉的材料與有價(jià)值的屬性分開的知識(shí)差距。
在最終發(fā)現(xiàn)的推論中,研究人員測(cè)量了發(fā)現(xiàn)等待時(shí)間,并期望隨著預(yù)測(cè)從負(fù)(人類競(jìng)爭(zhēng))??值轉(zhuǎn)向正(人類互補(bǔ))??值,觀察到等待時(shí)間的增加趨勢(shì)。
每個(gè)??值生成50個(gè)假設(shè)并評(píng)估結(jié)果預(yù)測(cè)表明,對(duì)于大多數(shù)目標(biāo)屬性,當(dāng)增加??時(shí),平均發(fā)現(xiàn)等待時(shí)間顯著增加(如下圖)。
評(píng)估沒有發(fā)現(xiàn)的預(yù)測(cè)
為了評(píng)估研究人員的算法預(yù)測(cè)的科學(xué)價(jià)值,包括那些在研究期間尚未發(fā)現(xiàn)的預(yù)測(cè),還需要現(xiàn)有文獻(xiàn)之外的數(shù)據(jù)。
對(duì)于較大的??值,此類假設(shè)必然會(huì)涵蓋絕大多數(shù)情況。
如果科學(xué)是一個(gè)有效的市場(chǎng),并且專家以最佳方式追求科學(xué)質(zhì)量,那么在人類回避的高??假設(shè)中,將觀察到科學(xué)承諾和功效成比例下降。
另一方面,如果科學(xué)家們沿著科學(xué)可能性的前沿聚集在一起,并且其持續(xù)努力產(chǎn)生的邊際回報(bào)遞減,那么在超越這些前沿時(shí),可能會(huì)觀察到希望的增加。
為了驗(yàn)證這一點(diǎn),研究人員將平均理論得分的變化與各種??值生成的假設(shè)的可發(fā)現(xiàn)性進(jìn)行了對(duì)比。
如下圖(第一行)所示,可發(fā)現(xiàn)性在??從負(fù)值到正值轉(zhuǎn)變附近下降,但其衰減比平均理論分?jǐn)?shù)急劇得多,直到接近?? = 0.4時(shí)才會(huì)崩潰。
這適用于電化學(xué)特性和大多數(shù)疾病。某些個(gè)別疾病的結(jié)果可以在上圖的第二行中看到。
如下圖所示,本節(jié)中考慮的絕大多數(shù)屬性都會(huì)產(chǎn)生大量且顯著的正期望差距。
在此基礎(chǔ)上,研究人員使用概率模型來評(píng)估他們的算法與科學(xué)界對(duì)??的任何值的預(yù)測(cè)的互補(bǔ)性。
這是通過顯式計(jì)算聯(lián)合概率來完成的,即隨機(jī)選擇的預(yù)測(cè)在所需屬性方面是合理的,并且超出了當(dāng)前科學(xué)家的研究范圍。
這些概率指定了在增強(qiáng)人類集體預(yù)測(cè)方面平衡利用和探索的最佳??。
下圖的結(jié)果表明最佳點(diǎn)因不同屬性而異,但可以將范圍0.2-0.3區(qū)分為最一致有希望的區(qū)間。
在此期間,盡管假設(shè)不太可能來自科學(xué)界,但很可能產(chǎn)生成功的科學(xué)結(jié)果。
結(jié)論和討論
這項(xiàng)研究證明了在人工智能系統(tǒng)中結(jié)合人類意識(shí),能夠加速實(shí)現(xiàn)對(duì)未來的發(fā)現(xiàn)。
研究中的人工智能模型通過直接預(yù)測(cè)人類發(fā)現(xiàn)和將要做出這些發(fā)現(xiàn)的人類專家,使預(yù)測(cè)精度提高了400%。
這些發(fā)現(xiàn)支持了超圖中所描繪的人類經(jīng)驗(yàn)和社會(huì)之間的聯(lián)系在推動(dòng)科學(xué)進(jìn)步中的影響。
此外,通過調(diào)整研究中的算法來避免群體性思維,得到了前景廣闊但在未來數(shù)年內(nèi)如果沒有機(jī)器的幫助則不太可能被想象、追求或發(fā)表的假設(shè)。
通過識(shí)別和糾正由領(lǐng)域界限和制度化教育形成的人類注意力的集體模式,這些模型補(bǔ)充了當(dāng)代科學(xué)界的研究。
這表明研究人員專家意識(shí)超圖中的連接性不僅對(duì)預(yù)測(cè)和加速人類在近期的發(fā)現(xiàn)有用,而且對(duì)推斷只能在遙遠(yuǎn)的未來才能被科學(xué)家想象的顛覆性發(fā)現(xiàn)也有用。
研究人員還成功揭示了人類科學(xué)機(jī)構(gòu)對(duì)科學(xué)發(fā)現(xiàn)的影響,這些機(jī)構(gòu)將使科學(xué)家聚集在可能發(fā)現(xiàn)的前沿共同體中。
而研究中提出的「外星人」或人類與人工智能互補(bǔ)假設(shè)的成功,表明科學(xué)部門和學(xué)科的設(shè)置實(shí)質(zhì)上限制了富有成效的探索。并指出人類能夠通過重塑科學(xué)教育以實(shí)現(xiàn)和發(fā)現(xiàn)改善人類預(yù)測(cè)的機(jī)會(huì)。
在這個(gè)研究分析過程中,強(qiáng)調(diào)了人工智能結(jié)合人類個(gè)體和社會(huì)因素來補(bǔ)充而不是取代人類專業(yè)知識(shí)的力量。
人工智能可以設(shè)計(jì)為與科學(xué)界共同發(fā)展的系統(tǒng)和工具,而不是與之對(duì)抗的威脅。事實(shí)上,人工智能的加入能夠幫助擴(kuò)大人類想象力和科學(xué)探索的邊界。