2024諾貝爾化學(xué)獎得主:「模型幻覺」給我無限創(chuàng)造力
萬萬沒想到,一直備受批評的AI「幻覺」問題,竟然在科學(xué)領(lǐng)域具有極大的應(yīng)用價值?
就在最近,計算機科學(xué)家Amy McGovern表示:「公眾認為這完全是壞事。但實際上,它為科學(xué)家提供了新的靈感,讓他們得以探索一些原本可能不會想到的思路?!?/span>
AI「幻覺」可以幫助科學(xué)家通過測試「夢幻式」的新概念,來追蹤癌癥、設(shè)計藥物、發(fā)明醫(yī)療設(shè)備并揭示氣象現(xiàn)象
AI「幻覺」激發(fā)科學(xué)創(chuàng)造力
科學(xué)在人們心中的形象冷靜而理性。
然而,在科學(xué)發(fā)現(xiàn)的早期階段,往往充滿了直覺和大膽的猜想。正如科學(xué)哲學(xué)家Paul Feyerabend所言,這是一種「無拘無束」的探索狀態(tài)。
如今,AI的「幻覺」正在重新激發(fā)科學(xué)的創(chuàng)造力。
這種技術(shù)加速了科學(xué)家和發(fā)明家提出新想法并驗證其是否符合現(xiàn)實的過程。
這可以被視為科學(xué)方法的加速版。以往需要數(shù)年完成的任務(wù),現(xiàn)在可能在幾天、幾小時甚至幾分鐘內(nèi)實現(xiàn)。
有時候,甚至幫助科學(xué)家加速了研究周期,開辟了全新的研究領(lǐng)域。
麻省理工學(xué)院教授James J. Collins說:「我們正在探索」。他最近稱贊AI的「幻覺」加速了他對新型抗生素的研究進展?!肝覀冏屇P吞岢鐾耆路f的分子。」
科學(xué)家向生成式計算機模型輸入特定主題的信息,然后讓機器對主題進行重新加工,從而產(chǎn)生AI的「幻覺」。
結(jié)果可能有細微的偏差,也可能超越現(xiàn)實。有時,它們會帶來重大發(fā)現(xiàn)。
「幻覺」帶來的諾貝爾化學(xué)獎
去年十月,華盛頓大學(xué)的David Baker因其開創(chuàng)性的蛋白質(zhì)研究獲得了諾貝爾化學(xué)獎。這些復(fù)雜的分子是生命活動的關(guān)鍵動力。
諾貝爾委員會稱贊他發(fā)現(xiàn)了快速構(gòu)建完全不同于自然界中蛋白質(zhì)的新方法,并稱其成就「幾乎不可能」。
在獎項宣布前的一次采訪中,Baker博士將AI的「突發(fā)想象」描述為「從零開始設(shè)計蛋白質(zhì)」的關(guān)鍵。
他補充說,這項新技術(shù)幫助他的實驗室獲得了約100項專利,其中許多用于醫(yī)療用途。一個專利用于一種新的癌癥治療方法,另一個旨在支持全球抗擊病毒感染的工作。他還創(chuàng)辦或協(xié)助創(chuàng)立了超過20家生物技術(shù)公司。
他說:「發(fā)展速度非常快,即使是專門研究蛋白質(zhì)的科學(xué)家,也不了解目前的進展有多大?!?/span>
他的實驗室設(shè)計了多少種蛋白質(zhì)?
他回答道:「一千萬種, 而且都是全新的。它們在自然界中并不存在?!?/span>
諾貝爾獎獲得者Baker博士對「幻覺」采取了直截了當(dāng)?shù)膽B(tài)度。
在2021年, 他在Nature上發(fā)表了一篇論文,標(biāo)題為《通過深度網(wǎng)絡(luò)幻覺進行從頭蛋白質(zhì)設(shè)計》(De novo protein design by deep network hallucination)。
論文地址:https://www.nature.com/articles/s41586-021-04184-w
標(biāo)題中的「從零(De novo)」一詞源自拉丁文,意為「從零開始」,與1980年代初科學(xué)家開始修改自然界已知蛋白質(zhì)結(jié)構(gòu)的做法形成了鮮明對比。
2003年,Baker博士及其同事實現(xiàn)了一個更宏偉的目標(biāo):從零構(gòu)建世界上第一個全新蛋白質(zhì)。
他們將其命名為Top7。這一成就被視為一項重要的突破,因為蛋白質(zhì)的復(fù)雜性堪稱驚人。
專家將DNA的結(jié)構(gòu)比作一串珍珠,而將大型蛋白質(zhì)的結(jié)構(gòu)比作糾結(jié)的毛球。即使是詳細的圖示,也只能粗略地表現(xiàn)蛋白質(zhì)的復(fù)雜結(jié)構(gòu)。
在流感病毒表面的血凝素蛋白的棱周圍會形成一種粘合劑蛋白,針對這些易受攻擊的點可以阻止病菌附著在肺部和其他地方的細胞上
隨著AI發(fā)展成為一種強大的新技術(shù),Baker博士開始思考它是否能夠加速從零開始的蛋白質(zhì)設(shè)計。
他在2021年的論文中提到,新方法受到了谷歌DeepDream模型的啟發(fā)。
DeepDream模型可以將現(xiàn)有圖像轉(zhuǎn)化為迷幻風(fēng)格,創(chuàng)造全新的視覺內(nèi)容。
當(dāng)人們看滿月時看到一個人的臉,這被稱為「空想性錯覺」(pareidolia),即一種將模糊圖案轉(zhuǎn)化為有意義圖像的感知現(xiàn)象。DeepDream正是利用了這種特性來創(chuàng)造超現(xiàn)實的圖像。
Baker博士的計劃是測試AI是否可以將這種「空想性錯覺」應(yīng)用于模糊的氨基酸集合——氨基酸是蛋白質(zhì)的基本構(gòu)建塊。
他的團隊將隨機的氨基酸序列輸入一個經(jīng)過訓(xùn)練的模型,而該模型能識別真實蛋白質(zhì)的結(jié)構(gòu)特征。
結(jié)果大大超出了預(yù)期。
論文指出,測試運行生成了數(shù)千種虛擬蛋白質(zhì),并將其比作互聯(lián)網(wǎng)中泛濫的貓圖片。
論文寫道:「就像由深度網(wǎng)絡(luò)幻覺生成的貓圖像可以清晰地被識別為貓一樣。這些人工蛋白質(zhì)結(jié)構(gòu)與天然結(jié)構(gòu)相似,但并不完全相同?!?/span>
隨后,貝克團隊嘗試將這些虛擬的蛋白質(zhì)轉(zhuǎn)化為現(xiàn)實——這一過程類似于讓電子貓變?yōu)檎鎸嵈嬖诘纳镓?。首先,團隊將這些虛擬分子的結(jié)構(gòu)信息作為藍圖,用以生產(chǎn)形成基因的DNA鏈。接著,正如2021年的論文所述,當(dāng)這些基因被插入微生物體內(nèi)后,這些微生物成功產(chǎn)生了129種從未在科學(xué)或自然界中發(fā)現(xiàn)的新蛋白質(zhì)。
2022年初,Baker博士將這一成就描述為「AI加速從零蛋白質(zhì)設(shè)計的首次實證」。
在他于2022年和2023年發(fā)表的后續(xù)論文中,「幻覺」一詞仍然出現(xiàn)在標(biāo)題中。
擴散模型帶來蛋白質(zhì)催化劑
Baker博士表示,他的實驗室最近在創(chuàng)意生成方面取得了新突破,采用了一種稱為擴散(diffusion)的AI方法。這也是DALL-E和Sora等流行視覺生成器的核心技術(shù)。
Baker博士稱贊擴散技術(shù)在設(shè)計新蛋白質(zhì)方面比「幻覺」更高效, 他說:「速度更快,成功率也更高?!?/span>
近年來,一些分析人士擔(dān)心科學(xué)正在走向衰退。他們指出,過去幾十年來,突破性發(fā)現(xiàn)的數(shù)量正在減少。
AI的支持者則認為,創(chuàng)造性爆發(fā)正在扭轉(zhuǎn)這一趨勢。
在設(shè)計領(lǐng)域,Baker博士及其同事看到一波波蛋白質(zhì)催化劑即將誕生。這些催化劑可能幫助收集太陽能、將老舊工廠改造成高效節(jié)能設(shè)施,并為構(gòu)建一個可持續(xù)的新世界提供支持。
Baker團隊的成員Ian C. Haydon認為這種加速仍在繼續(xù)并表示「這令人難以置信?!?/span>
「幻覺」是天才的表現(xiàn)
谷歌旗下AI公司DeepMind科學(xué)部負責(zé)人Pushmeet Kohli在一次采訪中稱贊了「幻覺」在促進科學(xué)發(fā)現(xiàn)方面的作用。
不久前,他的兩位同事與David Baker博士共同分享了2024年的諾貝爾化學(xué)獎。
Pushmeet Kohli表示:「我們擁有一項能夠展現(xiàn)創(chuàng)造力的驚人工具」。
Pushmeet Kohli博士舉了一個例子,說明了這種工具的創(chuàng)造力。
2016年,DeepMind的計算機在圍棋比賽中擊敗了世界冠軍。
這場比賽的轉(zhuǎn)折點是第37步,發(fā)生在比賽的早期階段。
Kohli博士回憶道:「我們一開始以為那是個錯誤。但隨著比賽的進行,人們意識到那是一種天才的表現(xiàn)。因為,這些模型能夠產(chǎn)生非常新穎的見解。」
他認同AI在加速生物科學(xué)的發(fā)展:「接下來的幾年中會出現(xiàn)許多令人驚嘆的成果」。
他認為,AI正在解鎖生命最深層的奧秘,并為治愈疾病、改善健康和延長壽命奠定了強大的新基礎(chǔ)。
他說:「一旦我們破譯并真正理解生命的語言,那將是奇跡」。
更多的「幻覺」
另一方面,曼哈頓紀(jì)念斯隆凱特琳癌癥中心實驗室負責(zé)人Harini Veeraraghavan,在一篇關(guān)于利用AI改善模糊醫(yī)學(xué)圖像的論文中提到了「幻覺」一詞。
這篇論文的標(biāo)題部分直接寫道「幻覺MRI」。
論文地址:https://pmc.ncbi.nlm.nih.gov/articles/PMC7225573/pdf/nihms-1586979.pdf
德克薩斯大學(xué)奧斯汀分校的研究人員也接受了這一術(shù)語。他們的一篇論文標(biāo)題寫道:「從幻覺中學(xué)習(xí)」,討論如何改進機器人導(dǎo)航。
論文地址:https://www.cs.utexas.edu/~xiao/papers/hallucination.pdf
「幻覺」設(shè)計的新事物需要驗證
盡管AI「幻覺」在科學(xué)發(fā)現(xiàn)中的吸引力巨大,但一些科學(xué)家認為這一術(shù)語具有誤導(dǎo)性。
他們認為,生成式AI模型的「想象」并非完全虛幻,而是具有一定實現(xiàn)可能性的,就像科學(xué)方法早期階段的假設(shè)一樣。因此,他們認為「幻覺」一詞不夠準(zhǔn)確,并傾向于避免使用。
此外,「幻覺」一詞還因其與迷幻藥(如LSD)導(dǎo)致的幻覺聯(lián)想而受到質(zhì)疑。迷幻藥在過去曾讓許多嚴(yán)肅的科學(xué)研究裹足不前。
最后,在科學(xué)和醫(yī)學(xué)交流中,AI生成的信息可能被錯誤信息所混淆,就像像聊天機器人的回復(fù)那樣,這也讓「幻覺」一詞更加備受爭議。
今年七月,白宮發(fā)布了一份關(guān)于促進公眾信任AI研究的報告,其中唯一提到「幻覺」的部分是關(guān)于如何減少它們的存在。
諾貝爾獎委員會似乎也遵循了這一思路。在對Baker博士工作的詳細評價中,沒有提及AI「幻覺」。相反,在新聞稿中,僅稱贊了他的團隊「創(chuàng)造了一種又一種富有想象力的蛋白質(zhì)」。
科學(xué)界的部分機構(gòu)似乎越來越傾向于將「幻覺」視為一個不宜提及的詞匯。
盡管如此,專家們在紐約時報的采訪中指出,科學(xué)AI的「想象」相比聊天機器人等的「幻覺」具有顯著優(yōu)勢。
最根本的一點是,這種創(chuàng)造性爆發(fā)基于自然和科學(xué)的硬性事實,而非人類語言的歧義或互聯(lián)網(wǎng)中的偏見和虛假信息。
「幻覺」并不可靠
加州理工學(xué)院的數(shù)學(xué)與計算機科學(xué)教授Anima Anandkumar表示:「我們正在教授AI物理學(xué)」。她曾擔(dān)任AI芯片領(lǐng)先制造商英偉達的AI研究主管。
Anandkumar博士補充說,對于科學(xué)而言,基于可靠事實的物理學(xué)基礎(chǔ)可以帶來高度準(zhǔn)確的結(jié)果。
她指出,聊天機器人的大語言模型無法實際驗證其陳述和斷言的正確性。
她強調(diào),最終的驗證來自科學(xué)家將這些AI生成的構(gòu)想與物理現(xiàn)實的具體細節(jié)進行比較。
她談到AI的成果時說道:「你需要對其進行測試,AI靠『幻覺』設(shè)計的新事物需要經(jīng)過驗證。」
最近, Anandkumar博士及其同事利用AI的「幻覺」幫助設(shè)計了一種全新的導(dǎo)管。
這種導(dǎo)管可以顯著減少細菌污染——這一全球性問題每年導(dǎo)致數(shù)百萬例尿路感染。
她表示,團隊的AI模型設(shè)計了數(shù)千種導(dǎo)管幾何形狀,并最終選出其中最有效的一種。
這種新導(dǎo)管的內(nèi)壁上覆蓋著鋸齒狀突起,能夠防止細菌附著并向上游移動,從而感染患者的膀胱。Anandkumar博士提到,該團隊正在討論這種設(shè)備的商業(yè)化。
與其他科學(xué)家一樣, Anandkumar博士表示她不喜歡「幻覺」這個術(shù)語。
她的團隊在關(guān)于新導(dǎo)管的論文中避免使用該詞。
「幻覺」是概率分布?
Amy McGovern博士是AI研究所的負責(zé)人,也是俄克拉荷馬大學(xué)氣象學(xué)和計算機科學(xué)的教授。
她認為AI的「幻覺」或許更適合被稱為「概率分布」——這是科學(xué)領(lǐng)域一個傳統(tǒng)的術(shù)語。
她補充道,天氣研究人員現(xiàn)在經(jīng)常使用AI來創(chuàng)建數(shù)千種細微的預(yù)測變化或概率范圍。這些豐富的想象幫助他們發(fā)現(xiàn)了可能引發(fā)極端事件(如致命熱浪)的意外因素。
她認為這是一種非常有價值的工具。