AI卷翻科研!DeepMind 36頁報(bào)告:全球?qū)嶒?yàn)室被「AI科學(xué)家」指數(shù)級(jí)接管
過去兩年,AI主打用戶增長,成功實(shí)現(xiàn)了大眾化普及。畢竟,拉新才是商業(yè)王道。
然而,如今AI日常的應(yīng)用已經(jīng)快卷到天花板了。對(duì)于世界上絕大多數(shù)人的普通查詢,許多LLM都能給出相當(dāng)不錯(cuò)的回答。
速度、流暢性已經(jīng)足夠滿足絕大多數(shù)用戶的需求。即便再優(yōu)化,提升空間也有限——畢竟這類問題的技術(shù)難度不高。
或許,未來真正值得關(guān)注的是科學(xué)和工程領(lǐng)域。
OpenAI科學(xué)家Jason Wei最近發(fā)帖預(yù)測:在接下來的一年內(nèi),AI的關(guān)注重點(diǎn)可能會(huì)從日常使用轉(zhuǎn)向科學(xué)領(lǐng)域。

他認(rèn)為,未來五年,AI關(guān)注的重點(diǎn)將轉(zhuǎn)向硬核領(lǐng)域——用AI加速科學(xué)和工程。因?yàn)檫@才是真正推動(dòng)技術(shù)進(jìn)步的引擎。
普通用戶的簡單問題,改進(jìn)空間已經(jīng)不大了。
但每個(gè)科學(xué)前沿領(lǐng)域都有巨大的改進(jìn)空間,而AI正好可以發(fā)力,去致力于解決那些能推動(dòng)科技飛躍的「1%的頂尖問題」。
AI不僅有回答這些問題的潛力,還能激發(fā)人們?nèi)ニ伎几蟮奶魬?zhàn)。
而且,AI的進(jìn)展還能加速AI本身的研究,幫助自己變得更強(qiáng)。AI的進(jìn)步是復(fù)利的,可謂是正反饋之王。
說白了,未來五年就是「AI科學(xué)家」、「AI工程師」的時(shí)代。
DeepMind最近發(fā)的一篇論文也暗示了這一趨勢:全球各地的實(shí)驗(yàn)室里,科學(xué)家們對(duì)AI的使用正以指數(shù)級(jí)增長。

報(bào)告地址:https://storage.googleapis.com/deepmind-media/DeepMind.com/Assets/Docs/a-new-golden-age-of-discovery_nov-2024.pdf
AI加速科學(xué)創(chuàng)新發(fā)現(xiàn)的黃金時(shí)代
如今,每三位博士后研究員中就有一位使用大語言模型來協(xié)助完成文獻(xiàn)綜述、編程和文章撰寫等工作。
今年的諾貝爾化學(xué)獎(jiǎng)也出乎了所有人的意料,頒發(fā)給了AlphaFold 2的發(fā)明人Demis Hassabis和John Jumper。同時(shí),這也啟發(fā)了大量科學(xué)家將AI應(yīng)用到自己的科學(xué)領(lǐng)域中,以求得更多的創(chuàng)新性發(fā)現(xiàn)。

過去半世紀(jì),科學(xué)家人數(shù)猛增,僅美國就翻了七倍多,但科技帶來的社會(huì)進(jìn)步卻放緩了。
原因之一是,現(xiàn)代科學(xué)家面臨的規(guī)模和復(fù)雜性挑戰(zhàn)越來越棘手。
不過,深度學(xué)習(xí)擅長搞定這種復(fù)雜局面,還能大幅壓縮科學(xué)發(fā)現(xiàn)的時(shí)間成本。
比如,傳統(tǒng)X射線晶體學(xué)花幾年、燒10萬美元搞定一個(gè)蛋白質(zhì)結(jié)構(gòu),而AlphaFold直接免費(fèi)給你2億種預(yù)測,秒殺傳統(tǒng)方法。
五大機(jī)遇
對(duì)于在不同科學(xué)研究階段難以突破研究瓶頸的科學(xué)家們來講,把握住使用AI的關(guān)鍵機(jī)遇,或許就能促進(jìn)誕生強(qiáng)有力的新發(fā)現(xiàn)。

五個(gè)能夠利用AI來促進(jìn)科研的機(jī)遇
1. 知識(shí)——改變科學(xué)家獲取和傳遞知識(shí)的方式
科學(xué)家要想推動(dòng)新發(fā)現(xiàn),必須掌握一套日益專業(yè)化且指數(shù)增長的知識(shí)體系。
這種「知識(shí)負(fù)擔(dān)」讓顛覆性發(fā)現(xiàn)越來越倚重年長科學(xué)家和頂尖大學(xué)的跨學(xué)科團(tuán)隊(duì),同時(shí)也導(dǎo)致小團(tuán)隊(duì)獨(dú)立撰寫論文的比例持續(xù)下滑。
而且,大多數(shù)科學(xué)成果仍以晦澀難懂、英語為主的論文形式分享,限制了政策制定者、企業(yè)和公眾的關(guān)注與興趣。
如今,科學(xué)家和公眾都能借助LLM破局。
例如,有團(tuán)隊(duì)用谷歌Gemini一天內(nèi)從20萬篇論文中提煉出相關(guān)見解;普通人也可用LLM輕松摘要和問答,獲取專業(yè)學(xué)術(shù)知識(shí),瞬間拉近與前沿科學(xué)的距離。
2. 數(shù)據(jù)——生成、提取和標(biāo)注大型科學(xué)數(shù)據(jù)集
盡管我們處于數(shù)據(jù)爆炸時(shí)代,許多自然和社會(huì)領(lǐng)域中,科學(xué)數(shù)據(jù)卻嚴(yán)重匱乏,如土壤、深海、大氣層和非正式經(jīng)濟(jì)。
AI正助力改變這一現(xiàn)狀。它能減少在DNA測序、檢測樣本中具體細(xì)胞類型或捕捉動(dòng)物聲音時(shí)可能發(fā)生的噪聲和錯(cuò)誤。
科學(xué)家們還可以利用LLM越來越強(qiáng)的多模態(tài)能力,從科學(xué)出版物、檔案文件以及視頻圖像等資源中提取非結(jié)構(gòu)化的科學(xué)數(shù)據(jù),并將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)集,以做后續(xù)研究。
AI還可以幫助為科學(xué)數(shù)據(jù)添加科學(xué)家所需的輔助信息。例如,至少三分之一的微生物蛋白質(zhì)在執(zhí)行功能中的細(xì)節(jié)未能被可靠地注釋。
經(jīng)過可靠性評(píng)估驗(yàn)證的AI模型也可以作為新的合成科學(xué)數(shù)據(jù)的來源。例如,AlphaProteo蛋白質(zhì)設(shè)計(jì)模型是在AlphaFold 2中超過1億個(gè)AI生成的蛋白質(zhì)結(jié)構(gòu)以及蛋白質(zhì)數(shù)據(jù)庫中的實(shí)驗(yàn)結(jié)構(gòu)上進(jìn)行訓(xùn)練的。
3. 實(shí)驗(yàn)——模擬、加速并指導(dǎo)復(fù)雜實(shí)驗(yàn)
科學(xué)實(shí)驗(yàn)常因成本高昂、復(fù)雜且耗時(shí)難以執(zhí)行。還有一些實(shí)驗(yàn)因?yàn)檠芯咳藛T無法獲得所需的設(shè)施、人力或?qū)嶒?yàn)材料而無法進(jìn)行。
核聚變就是一個(gè)典型例子。它有望提供一種幾乎無限、無排放的能源來源,并可能支持諸如海水淡化等高能耗的創(chuàng)新性大規(guī)模應(yīng)用。但控制等離子體所需的托卡馬克反應(yīng)堆復(fù)雜昂貴。ITER原型從2013年建造,預(yù)計(jì)2030年代中期才開始實(shí)驗(yàn)。
AI可通過模擬加速實(shí)驗(yàn)進(jìn)程。
一種方法是利用強(qiáng)化學(xué)習(xí)智能體來對(duì)物理系統(tǒng)進(jìn)行模擬。例如,研究者與洛桑聯(lián)邦理工合作,用強(qiáng)化學(xué)習(xí)控制托卡馬克等離子體形狀,這一方法還可用于粒子加速器、望遠(yuǎn)鏡等設(shè)施。
在不同學(xué)科中,利用AI模擬實(shí)驗(yàn)的方式可能各不相同,但一個(gè)共同點(diǎn)是,這些模擬通常用于指導(dǎo)和優(yōu)化現(xiàn)實(shí)實(shí)驗(yàn),而非完全替代它們。
以基因研究為例,普通人平均有9000多個(gè)錯(cuò)義變異,大多無害,但少數(shù)會(huì)致病?,F(xiàn)實(shí)中,僅能逐個(gè)測試蛋白質(zhì)的影響。而AlphaMissense能快速分類7100萬潛在變異中的89%,幫助科學(xué)家聚焦高風(fēng)險(xiǎn)變異,加速疾病研究。

AlphaMissense對(duì)所有可能的7100萬個(gè)錯(cuò)義變體的致病性的預(yù)測
4. 模型——建模復(fù)雜系統(tǒng)及其組件之間的相互作用
1960年,諾貝爾獎(jiǎng)得主物理學(xué)家Eugene Wigner感嘆數(shù)學(xué)方程在模擬自然現(xiàn)象(如行星運(yùn)動(dòng))中「出乎意料的有效性」。

但面對(duì)生物學(xué)、經(jīng)濟(jì)學(xué)、天氣等復(fù)雜系統(tǒng),傳統(tǒng)方程模型漸顯乏力,因?yàn)檫@些系統(tǒng)充滿動(dòng)態(tài)性、隨機(jī)性,還常伴涌現(xiàn)和混沌,難以預(yù)測和控制。這些方程能提供非常有用但并不完美的近似,且運(yùn)行這些方法也需要高昂的計(jì)算成本。
AI卻能從復(fù)雜數(shù)據(jù)中挖掘規(guī)律。例如,谷歌的深度學(xué)習(xí)系統(tǒng)能快速預(yù)測未來10天天氣,速度與準(zhǔn)確性雙殺傳統(tǒng)數(shù)值模型。

同時(shí),AI還能幫減緩氣候問題,如用AI預(yù)測潮濕區(qū)域的出現(xiàn)時(shí)間和位置,幫助飛行員避開會(huì)加劇全球變暖的凝結(jié)尾跡。
即便AI十分強(qiáng)大,它更多是豐富而非取代傳統(tǒng)的復(fù)雜系統(tǒng)建模。
例如,基于智能體的建模通過模擬個(gè)體行為者(如企業(yè)和消費(fèi)者)之間的交互,來理解這些交互如何影響更大、更復(fù)雜的系統(tǒng)(如社會(huì)經(jīng)濟(jì))。
在傳統(tǒng)方法中,科學(xué)家需要事先規(guī)定這些智能體的行為方式。
如今,科學(xué)家可以利用大語言模型創(chuàng)建更靈活的生成式智能體,這些智能體能夠進(jìn)行溝通和行動(dòng),例如搜索信息或購買,同時(shí)還能對(duì)這些行動(dòng)進(jìn)行推理和記憶。
科學(xué)家還可以利用強(qiáng)化學(xué)習(xí)研究這些智能體如何在更動(dòng)態(tài)的模擬中學(xué)習(xí)和調(diào)整其行為,例如對(duì)于新的能源價(jià)格或疫情響應(yīng)政策的反應(yīng)。
5. 解決方案——為大規(guī)模搜索空間問題提出解決方案
很多重要的科學(xué)問題都伴隨著許多幾乎無法理解的潛在解決方案。
比如,生物學(xué)家和化學(xué)家需要確定分子(如蛋白質(zhì))的結(jié)構(gòu)、特性和功能,才能設(shè)計(jì)出用作抗體藥物、降解塑料的酶或新型材料的一些新分子。
然而,要設(shè)計(jì)一種小分子藥物,科學(xué)家需要面對(duì)超過10^60種潛在選擇;要設(shè)計(jì)一種由400種標(biāo)準(zhǔn)氨基酸組成的蛋白質(zhì),則需要面對(duì)20^400種選擇。
這種大規(guī)模搜索空間不僅限于分子,還廣泛存在于許多科學(xué)問題中,比如尋找數(shù)學(xué)問題的最佳證明、計(jì)算機(jī)芯片的最佳設(shè)計(jì)架構(gòu)等。
傳統(tǒng)上,科學(xué)家依賴直覺、試錯(cuò)法、迭代或暴力計(jì)算的某種組合來尋找最佳分子、證明或算法。然而,這些方法難以充分遍歷龐大的搜索空間,從而無法發(fā)現(xiàn)更優(yōu)的解決方案。
如今,AI能夠更好地探索這些龐大的搜索空間,同時(shí)更快地聚焦于最有可能可行且有效的解決方案。
今年7月,AlphaProof和AlphaGeometry2成功解決了國際數(shù)學(xué)奧林匹克競賽中六道題目中的四道。它們利用Gemini大語言模型架構(gòu),為給定的數(shù)學(xué)問題生成大量潛在解決方案,并結(jié)合基于數(shù)學(xué)邏輯的系統(tǒng),迭代地實(shí)現(xiàn)接近最可能正確的候選解決方案。
AI科學(xué)家還是AI賦能的科學(xué)家?
即便AI系統(tǒng)的能力在不斷提升,其最大的邊際效益依舊會(huì)源于將其應(yīng)用在能夠突顯其相對(duì)優(yōu)勢的場景之中。
比如快速從海量數(shù)據(jù)集中快速提取信息的能力,以及幫助解決科學(xué)進(jìn)步中的真正瓶頸問題;而非企圖讓人類科學(xué)家已擅長的任務(wù)實(shí)現(xiàn)自動(dòng)化。
隨著AI推動(dòng)科學(xué)變得更經(jīng)濟(jì)高效,社會(huì)對(duì)于科學(xué)和科學(xué)家的需求也會(huì)隨之增加。
和其他行業(yè)不同,科學(xué)的需求幾乎是無限的,而科技也并不會(huì)降低對(duì)科學(xué)家的需求。新的進(jìn)展總會(huì)在科學(xué)的版圖上開拓出全新的、難以預(yù)測的領(lǐng)域,AI亦是如此。
正如司馬賀所設(shè)想的那樣,AI系統(tǒng)自身也是科學(xué)研究的對(duì)象,科學(xué)家會(huì)在評(píng)估和闡釋其科學(xué)能力以及開發(fā)新型人類-AI 科學(xué)系統(tǒng)方面起到主導(dǎo)作用。
關(guān)鍵要素
這一部分,文章深入探討了實(shí)現(xiàn)「AI for Science」的幾個(gè)關(guān)鍵因素,并將其歸納為一個(gè)「AI for Science生產(chǎn)函數(shù)」的模型。
模型展示了如何利用AI推動(dòng)科學(xué)研究和創(chuàng)新的不同階段以及需要關(guān)注的核心內(nèi)容。
從科學(xué)研究的問題選擇(Problem selection)、模型評(píng)估(Evaluations)開始,通過計(jì)算資源(Compute)和數(shù)據(jù)(Data)這些基礎(chǔ)設(shè)施的支持,在開展研究過程中注重組織模式設(shè)計(jì)(Organizational design)和跨學(xué)科(Interdisciplinarity),形成成果,并最終通過采納(Adoption)將研究成果轉(zhuǎn)化為實(shí)際影響。底部的合作(Partnerships)、安全與責(zé)任(Safety & responsibility)貫穿始終,確保整個(gè)流程高效且符合道德規(guī)范。

雖然很多要素看起來直觀,但DeepMind的論文揭示了一些在實(shí)踐中重要的經(jīng)驗(yàn)教訓(xùn)。
1. 問題選擇
科學(xué)進(jìn)步的關(guān)鍵是找到真正值得解決的問題。
在DeepMind,科學(xué)團(tuán)隊(duì)通常會(huì)先評(píng)估一個(gè)研究問題是否足夠重要,是否值得投入大量時(shí)間和資源。
DeepMind的CEO Demis Hassabis提出過一個(gè)思維模型:將整個(gè)科學(xué)視為一棵知識(shí)之樹。
那么,最重要的是找到樹的根——像蛋白質(zhì)結(jié)構(gòu)預(yù)測、量子化學(xué)這些基礎(chǔ)性的「根源問題」,它們一旦得到解決,就能開枝散葉,解鎖全新的研究和應(yīng)用。
而在這些問題當(dāng)中,要判斷AI是否能帶來增益,我們需要尋找具備特定特征的問題,例如巨大的組合搜索空間、大量數(shù)據(jù),以及可用于衡量性能的明確目標(biāo)函數(shù)。
許多最近的突破,就來自于重要科學(xué)問題和成熟AI方法的碰撞。
例如,DeepMind在核聚變研究的進(jìn)展就得益于新發(fā)布的強(qiáng)化學(xué)習(xí)算法——最大后驗(yàn)策略優(yōu)化(maximum a posteriori policy optimization)。
選對(duì)問題很重要,但問題的難度也得剛好。一個(gè)適合AI的問題,通常是能夠產(chǎn)生中間結(jié)果的問題。
如果問題太難,就沒法產(chǎn)生足夠的反饋推動(dòng)進(jìn)展。要做到這一點(diǎn),需要靠需要直覺與實(shí)驗(yàn)的結(jié)合。
2. 模型評(píng)估
科學(xué)AI研究中,模型的評(píng)估方法也很重要。
科學(xué)家常常通過基準(zhǔn)測試、指標(biāo)和競賽等評(píng)估方法來評(píng)估AI模型的科學(xué)能力。
如果設(shè)計(jì)得當(dāng),這些評(píng)估方法不僅可以用來跟蹤進(jìn)展,還能激發(fā)方法創(chuàng)新,激活研究人員對(duì)科學(xué)問題的興趣。
不同的情況需要不同的評(píng)估方法。
比如,DeepMind的天氣預(yù)測團(tuán)隊(duì)最初用基于幾個(gè)關(guān)鍵變量(如地表溫度)的「進(jìn)展指標(biāo)」來提升模型表現(xiàn)。
當(dāng)模型達(dá)到一定性能水平時(shí),他們采用了一個(gè)更全面的評(píng)估方法,其中包括1300多個(gè)指標(biāo)。這些指標(biāo)的設(shè)計(jì)受歐洲中期天氣預(yù)報(bào)中心(ECMWF)評(píng)價(jià)評(píng)分卡啟發(fā)。
團(tuán)隊(duì)也發(fā)現(xiàn)AI模型有時(shí)會(huì)在某些指標(biāo)上「作弊」,比如「雙重懲罰」問題——「模糊」預(yù)測(如預(yù)測降雨在較大地理區(qū)域內(nèi)發(fā)生)比「精準(zhǔn)」預(yù)測(如預(yù)測暴風(fēng)雨的位置略微偏離實(shí)際位置)受到的懲罰更少。
為進(jìn)一步驗(yàn)證,團(tuán)隊(duì)還評(píng)估了模型在下游任務(wù)中的實(shí)用性,例如預(yù)測氣旋路徑的能力,以及表征可能導(dǎo)致洪水的「大氣河流」(集中濕氣的狹窄帶)的強(qiáng)度。
最具影響力的科學(xué)AI評(píng)估方法通常是社區(qū)主導(dǎo)的,比如蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽(CASP)。
該競賽自1994年由John Moult教授和Krzysztof Fidelis教授發(fā)起,每兩年舉行一次。CASP的目標(biāo)是通過測試各參賽團(tuán)隊(duì)的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的準(zhǔn)確性,推動(dòng)相關(guān)領(lǐng)域的技術(shù)創(chuàng)新,并加深對(duì)蛋白質(zhì)折疊和結(jié)構(gòu)的理解。
不過,這也帶來了基準(zhǔn)可能「泄露」到AI模型訓(xùn)練數(shù)據(jù)中的風(fēng)險(xiǎn),讓模型「作弊」,從而降低基準(zhǔn)用于跟蹤模型進(jìn)展的效用。
「作弊」問題暫時(shí)沒有完美的解決方案,但至少需要定期更新基準(zhǔn),鼓勵(lì)更開放的第三方評(píng)估和競賽。
3. 計(jì)算資源
計(jì)算資源是AI和科學(xué)發(fā)展的核心引擎,但也是節(jié)能減排的焦點(diǎn)之一。
AI實(shí)驗(yàn)室和政策制定者需要從長遠(yuǎn)視角平衡模型需求與效率提升。
比如,蛋白質(zhì)設(shè)計(jì)模型小巧高效,而大語言模型訓(xùn)練時(shí)計(jì)算密集,但微調(diào)和推理時(shí)所需計(jì)算量則比較少;通過優(yōu)化數(shù)據(jù)或?qū)⒋竽P汀刚麴s」成小模型,也可以進(jìn)一步降低計(jì)算成本。
同時(shí),也需要對(duì)比AI與其他科學(xué)方法的資源消耗。
例如,AI驅(qū)動(dòng)的天氣預(yù)測模型盡管訓(xùn)練耗費(fèi)資源,但整體效率可能優(yōu)于傳統(tǒng)方法。實(shí)證數(shù)據(jù)的持續(xù)跟蹤可以幫助明確這些趨勢,并為未來計(jì)算需求的規(guī)劃提供依據(jù)。
此外,計(jì)算戰(zhàn)略不應(yīng)僅關(guān)注芯片供應(yīng)的充足性,更需優(yōu)先建設(shè)關(guān)鍵基礎(chǔ)設(shè)施和提升工程技能,以保障資源訪問和系統(tǒng)可靠性。然而,學(xué)術(shù)界和公共研究機(jī)構(gòu)在這些方面往往資源不足,需要更多支持。
4. 數(shù)據(jù)
像計(jì)算資源一樣,數(shù)據(jù)是科學(xué)AI發(fā)展的基礎(chǔ)設(shè)施,需要持續(xù)開發(fā)、維護(hù)和更新。
人們常著眼于政策制定者推動(dòng)的新數(shù)據(jù)集創(chuàng)建。
例如,2012年奧巴馬政府啟動(dòng)的材料項(xiàng)目繪制了無機(jī)晶體圖譜,為DeepMind最近的GNoME項(xiàng)目預(yù)測220萬種新材料提供了數(shù)據(jù)支持。
但許多科學(xué)AI突破往往來自更有機(jī)的數(shù)據(jù)涌現(xiàn),這些數(shù)據(jù)得益于有遠(yuǎn)見的個(gè)人或小團(tuán)隊(duì)的努力。
像當(dāng)時(shí)Broad研究所的Daniel MacArthur領(lǐng)導(dǎo)開發(fā)的gnomAD遺傳變異數(shù)據(jù)集,為DeepMind的AlphaMissense項(xiàng)目提供了基礎(chǔ)。
還有,數(shù)學(xué)工具Lean最初由Leonardo de Moura開發(fā),如今已成AI數(shù)學(xué)模型(如AlphaProof)的重要訓(xùn)練資源。
這些案例說明,除了自上而下的戰(zhàn)略規(guī)劃,還需要激勵(lì)研究者在數(shù)據(jù)收集、整理和共享中扮演更積極的角色。
當(dāng)前,許多濕實(shí)驗(yàn)室的實(shí)驗(yàn)數(shù)據(jù)因缺乏資金支持而被丟棄;而蛋白質(zhì)數(shù)據(jù)銀行(PDB)的高質(zhì)量數(shù)據(jù)則受益于期刊要求和專業(yè)數(shù)據(jù)整理員制定的統(tǒng)一標(biāo)準(zhǔn)。相比之下,基因組數(shù)據(jù)的整理因標(biāo)準(zhǔn)不一,則常需額外整合和清洗。
此外,還有許多高質(zhì)量數(shù)據(jù)集完全未被利用,比如因許可限制無法公開的生物多樣性數(shù)據(jù),或幾十年核聚變實(shí)驗(yàn)的歷史數(shù)據(jù)。這些瓶頸無論是由于缺乏資源、時(shí)間,還是由于數(shù)據(jù)禁運(yùn)期,都會(huì)阻礙AI在科學(xué)領(lǐng)域的潛力釋放。
5. 組織模式設(shè)計(jì)
學(xué)術(shù)界偏自下而上,工業(yè)界偏自上而下,但頂尖實(shí)驗(yàn)室往往能找到二者間的平衡。
像貝爾實(shí)驗(yàn)室和施樂帕洛阿爾托研究中心的黃金年代,就以自由探索的研究模式著稱。這也為DeepMind的創(chuàng)立提供了靈感。
最近,一批新興科學(xué)機(jī)構(gòu)試圖從這些例子中汲取經(jīng)驗(yàn),復(fù)刻這種研究模式。它們希望推動(dòng)更多高風(fēng)險(xiǎn)、高回報(bào)的研究,削減官僚主義,為科學(xué)家提供更好的激勵(lì)。
這些機(jī)構(gòu)致力于解決一些科學(xué)中規(guī)模過大、學(xué)術(shù)界無法承擔(dān),但在工業(yè)界又不夠盈利的問題,例如擴(kuò)展Lean證明助手,這一工具對(duì)AI數(shù)學(xué)研究至關(guān)重要。
這些機(jī)構(gòu)的核心目標(biāo)在于,將自上而下的協(xié)調(diào)與對(duì)科學(xué)家自下而上的賦能相結(jié)合。既不能完全依賴科學(xué)家自由發(fā)揮(可能導(dǎo)致效率低下或研究方向分散),也不能強(qiáng)行控制每一步(會(huì)扼殺創(chuàng)造力)。
理想狀態(tài)下,機(jī)構(gòu)為科學(xué)家提供清晰的目標(biāo)、資源和支持,但具體的研究方法和過程由科學(xué)家自己主導(dǎo)。
找到這種平衡不僅能吸引頂尖研究領(lǐng)導(dǎo)者,也是成功的關(guān)鍵。Demis Hassabis稱之為協(xié)調(diào)尖端研究的核心秘訣。
這種平衡同樣適用于具體項(xiàng)目。比如在DeepMind,研究常在「探索」?fàn)顟B(tài)(團(tuán)隊(duì)尋找新想法)和「利用」?fàn)顟B(tài)(團(tuán)隊(duì)專注于工程和性能擴(kuò)展)兩種模式間切換。
掌握模式切換時(shí)機(jī)和調(diào)整團(tuán)隊(duì)節(jié)奏,是一門藝術(shù)。
6. 跨學(xué)科
跨學(xué)科合作是破解科學(xué)難題的鑰匙,卻常被學(xué)科壁壘卡住。
科學(xué)AI的研究往往需要多學(xué)科起步,但真正的突破來自跨學(xué)科的深度融合。這不僅是把人湊在一起,而是讓團(tuán)隊(duì)共同開發(fā)共享的方法和思想。
比如,DeepMind的Ithaca項(xiàng)目用AI修復(fù)受損的古希臘銘文。為了成功,AI研究負(fù)責(zé)人要鉆研銘文學(xué),而銘文學(xué)家也需要理解AI模型,因?yàn)橹庇X對(duì)這一工作至關(guān)重要。
培養(yǎng)這種團(tuán)隊(duì)動(dòng)態(tài)需要正確的激勵(lì)機(jī)制。團(tuán)隊(duì)能做到這一點(diǎn),靠的是專注于解決問題,而不是搶論文署名——這也是AlphaFold 2成功的關(guān)鍵。
這種專注在工業(yè)實(shí)驗(yàn)室更易實(shí)現(xiàn),也凸顯了長期公共研究資金的重要性——它需要擺脫對(duì)發(fā)表壓力的過度依賴。
為了實(shí)現(xiàn)真正的跨學(xué)科合作,組織還需要為能夠幫助融合學(xué)科的人創(chuàng)造角色和職業(yè)路徑。
在DeepMind,研究工程師推動(dòng)研究與工程的良性循環(huán),項(xiàng)目經(jīng)理加強(qiáng)團(tuán)隊(duì)協(xié)作并連接不同項(xiàng)目。DeepMind還優(yōu)先招募擅長發(fā)現(xiàn)學(xué)科交叉的人,并鼓勵(lì)科學(xué)家和工程師定期更換項(xiàng)目。
關(guān)鍵是打造一種文化——好奇心驅(qū)動(dòng)、尊重差異、敢于爭論。經(jīng)濟(jì)歷史學(xué)家Joel Mokyr稱這種文化為「爭議性」(contestability):不同背景的研究者能公開探討,彼此批評(píng)又共同進(jìn)步。
這種文化的實(shí)踐可以通過定期舉辦跨學(xué)科研討會(huì)、開放討論平臺(tái)以及鼓勵(lì)團(tuán)隊(duì)內(nèi)外互動(dòng)來實(shí)現(xiàn)。

這段修復(fù)的銘文(IG I3 4B)記錄了一項(xiàng)與雅典衛(wèi)城相關(guān)的法令,時(shí)間可追溯至公元前485年至484年
7. 采用
科學(xué)AI工具如AlphaFold既專業(yè)化又通用:它們專注少量任務(wù),卻服務(wù)廣泛科學(xué)界,從研究疾病到改進(jìn)漁業(yè)。
然而,科學(xué)進(jìn)展轉(zhuǎn)化為實(shí)際應(yīng)用并不簡單。例如,疾病的病原理論(germ-theory)從提出到被廣泛接受經(jīng)歷了漫長的時(shí)間,而科學(xué)突破所催生的下游產(chǎn)品(如新型抗生素)也常常由于缺乏合適的市場激勵(lì)而未能得到充分開發(fā)。
為了促進(jìn)模型的落地應(yīng)用,我們?cè)诳茖W(xué)家采用與商業(yè)目標(biāo)、安全風(fēng)險(xiǎn)等因素之間尋找平衡,并設(shè)立了一個(gè)專門的影響力加速器(Impact Accelerator),以推動(dòng)研究的落地應(yīng)用,并鼓勵(lì)社會(huì)公益方向的合作。
要讓科學(xué)家更容易用上新工具,集成流程必須簡單。
在AlphaFold 2開發(fā)中,我們不僅開源代碼,還聯(lián)合EMBL-EBI創(chuàng)建數(shù)據(jù)庫,供計(jì)算資源有限的科學(xué)家輕松查詢2億種蛋白質(zhì)結(jié)構(gòu)。
AlphaFold 3進(jìn)一步擴(kuò)展了功能,但預(yù)測需求激增。為此,我們推出AlphaFold Server,科學(xué)家可按需生成結(jié)構(gòu)。
同時(shí),科學(xué)界還自發(fā)開發(fā)工具如ColabFold,顯示對(duì)多樣化需求的重視及培養(yǎng)科學(xué)界計(jì)算能力的重要性。

迄今為止,來自全球190多個(gè)國家的超過200萬用戶已訪問AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫,瀏覽了700多萬個(gè)結(jié)構(gòu)
科學(xué)家信任AI模型,才會(huì)用它。推廣關(guān)鍵在于明確模型的用途和局限。
比如,在AlphaFold開發(fā)中,我們?cè)O(shè)計(jì)了不確定性指標(biāo),通過直觀可視化展示模型對(duì)預(yù)測的信心,并與EMBL-EBI合作推出培訓(xùn)模塊,指導(dǎo)如何解讀置信度并用實(shí)際案例強(qiáng)化信任。
類似地,Med-Gemini系統(tǒng)在健康問答上表現(xiàn)優(yōu)異。它通過生成多條推理鏈評(píng)估答案分歧計(jì)算不確定性。當(dāng)不確定性高時(shí),自動(dòng)調(diào)用網(wǎng)絡(luò)搜索整合最新信息。
這種方法既提升了可靠性,也讓科學(xué)家對(duì)決策過程一目了然,信任倍增。

Med-Gemini-3D能夠?yàn)镃T掃描生成報(bào)告,這比標(biāo)準(zhǔn)X光成像復(fù)雜得多。在此示例中,Med-Gemini-3D的報(bào)告正確地包含了原始放射科醫(yī)生報(bào)告中遺漏的一處病變(用綠色標(biāo)出)
8. 合作
科學(xué)AI離不開多領(lǐng)域協(xié)作,公共和私營部門的合作尤為關(guān)鍵。
從數(shù)據(jù)集創(chuàng)建到成果共享,這種合作貫穿項(xiàng)目全程。
比如,AI模型設(shè)計(jì)的新材料是否可行,需要資深材料科學(xué)家的評(píng)估;DeepMind設(shè)計(jì)的抗SARS-CoV-2蛋白質(zhì),能否如預(yù)期結(jié)合目標(biāo),也需與克里克研究所合作進(jìn)行濕實(shí)驗(yàn)驗(yàn)證。甚至在數(shù)學(xué)領(lǐng)域,F(xiàn)unSearch解決Cap Set問題,也得益于數(shù)學(xué)家Jordan Ellenberg的專業(yè)指導(dǎo)。
鑒于工業(yè)實(shí)驗(yàn)室在推動(dòng)AI發(fā)展中的核心作用,以及對(duì)豐富領(lǐng)域知識(shí)的需求,公共與私營部門的合作在推動(dòng)科學(xué)AI前沿發(fā)展方面的重要性將日益凸顯。為此,必須加大對(duì)公私合作的支持,比如為大學(xué)和研究機(jī)構(gòu)與企業(yè)的聯(lián)合團(tuán)隊(duì)提供更多資金。
但合作不簡單。各方需盡早就目標(biāo)和關(guān)鍵問題達(dá)成一致:研究成果歸屬、是否發(fā)表論文、數(shù)據(jù)和模型是否開源、適用的許可協(xié)議等,都可能引發(fā)爭議。這些分歧通常反映了雙方不同的激勵(lì),但成功合作往往建立在清晰的價(jià)值互換之上。
比如,AlphaFold蛋白質(zhì)數(shù)據(jù)庫能覆蓋200萬用戶,正是因?yàn)榻Y(jié)合了我們的AI模型與EMBL-EBI的生物數(shù)據(jù)管理專長。這種優(yōu)勢互補(bǔ)式合作,不僅高效,還能讓AI潛力最大化。















 
 
 












 
 
 
 