偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<wbr id="bwlf6"></wbr>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

AI卷翻科研！DeepMind 36頁報(bào)告：全球?qū)嶒?yàn)室被「AI科學(xué)家」指數(shù)級(jí)接管

作者：新智元 2024-11-27 14:35:00

人工智能新聞

OpenAI科學(xué)家Jason Wei預(yù)測，未來一年內(nèi)，AI重點(diǎn)將從推廣大眾需求轉(zhuǎn)為促進(jìn)科學(xué)發(fā)現(xiàn)，無獨(dú)有偶，DeepMind剛剛發(fā)布的36頁報(bào)告也揭示出：全球?qū)嶒?yàn)室AI使用正在指數(shù)級(jí)增長，AI for Science真正的黃金時(shí)代即將來臨。

過去兩年，AI主打用戶增長，成功實(shí)現(xiàn)了大眾化普及。畢竟，拉新才是商業(yè)王道。

然而，如今AI日常的應(yīng)用已經(jīng)快卷到天花板了。對(duì)于世界上絕大多數(shù)人的普通查詢，許多LLM都能給出相當(dāng)不錯(cuò)的回答。

速度、流暢性已經(jīng)足夠滿足絕大多數(shù)用戶的需求。即便再優(yōu)化，提升空間也有限——畢竟這類問題的技術(shù)難度不高。

或許，未來真正值得關(guān)注的是科學(xué)和工程領(lǐng)域。

OpenAI科學(xué)家Jason Wei最近發(fā)帖預(yù)測：在接下來的一年內(nèi)，AI的關(guān)注重點(diǎn)可能會(huì)從日常使用轉(zhuǎn)向科學(xué)領(lǐng)域。

他認(rèn)為，未來五年，AI關(guān)注的重點(diǎn)將轉(zhuǎn)向硬核領(lǐng)域——用AI加速科學(xué)和工程。因?yàn)檫@才是真正推動(dòng)技術(shù)進(jìn)步的引擎。

普通用戶的簡單問題，改進(jìn)空間已經(jīng)不大了。

但每個(gè)科學(xué)前沿領(lǐng)域都有巨大的改進(jìn)空間，而AI正好可以發(fā)力，去致力于解決那些能推動(dòng)科技飛躍的「1%的頂尖問題」。

AI不僅有回答這些問題的潛力，還能激發(fā)人們?nèi)ニ伎几蟮奶魬?zhàn)。

而且，AI的進(jìn)展還能加速AI本身的研究，幫助自己變得更強(qiáng)。AI的進(jìn)步是復(fù)利的，可謂是正反饋之王。

說白了，未來五年就是「AI科學(xué)家」、「AI工程師」的時(shí)代。

DeepMind最近發(fā)的一篇論文也暗示了這一趨勢：全球各地的實(shí)驗(yàn)室里，科學(xué)家們對(duì)AI的使用正以指數(shù)級(jí)增長。

報(bào)告地址：https://storage.googleapis.com/deepmind-media/DeepMind.com/Assets/Docs/a-new-golden-age-of-discovery_nov-2024.pdf

AI加速科學(xué)創(chuàng)新發(fā)現(xiàn)的黃金時(shí)代

如今，每三位博士后研究員中就有一位使用大語言模型來協(xié)助完成文獻(xiàn)綜述、編程和文章撰寫等工作。

今年的諾貝爾化學(xué)獎(jiǎng)也出乎了所有人的意料，頒發(fā)給了AlphaFold 2的發(fā)明人Demis Hassabis和John Jumper。同時(shí)，這也啟發(fā)了大量科學(xué)家將AI應(yīng)用到自己的科學(xué)領(lǐng)域中，以求得更多的創(chuàng)新性發(fā)現(xiàn)。

過去半世紀(jì)，科學(xué)家人數(shù)猛增，僅美國就翻了七倍多，但科技帶來的社會(huì)進(jìn)步卻放緩了。

原因之一是，現(xiàn)代科學(xué)家面臨的規(guī)模和復(fù)雜性挑戰(zhàn)越來越棘手。

不過，深度學(xué)習(xí)擅長搞定這種復(fù)雜局面，還能大幅壓縮科學(xué)發(fā)現(xiàn)的時(shí)間成本。

比如，傳統(tǒng)X射線晶體學(xué)花幾年、燒10萬美元搞定一個(gè)蛋白質(zhì)結(jié)構(gòu)，而AlphaFold直接免費(fèi)給你2億種預(yù)測，秒殺傳統(tǒng)方法。

五大機(jī)遇

對(duì)于在不同科學(xué)研究階段難以突破研究瓶頸的科學(xué)家們來講，把握住使用AI的關(guān)鍵機(jī)遇，或許就能促進(jìn)誕生強(qiáng)有力的新發(fā)現(xiàn)。

五個(gè)能夠利用AI來促進(jìn)科研的機(jī)遇

1. 知識(shí)——改變科學(xué)家獲取和傳遞知識(shí)的方式

科學(xué)家要想推動(dòng)新發(fā)現(xiàn)，必須掌握一套日益專業(yè)化且指數(shù)增長的知識(shí)體系。

這種「知識(shí)負(fù)擔(dān)」讓顛覆性發(fā)現(xiàn)越來越倚重年長科學(xué)家和頂尖大學(xué)的跨學(xué)科團(tuán)隊(duì)，同時(shí)也導(dǎo)致小團(tuán)隊(duì)獨(dú)立撰寫論文的比例持續(xù)下滑。

而且，大多數(shù)科學(xué)成果仍以晦澀難懂、英語為主的論文形式分享，限制了政策制定者、企業(yè)和公眾的關(guān)注與興趣。

如今，科學(xué)家和公眾都能借助LLM破局。

例如，有團(tuán)隊(duì)用谷歌Gemini一天內(nèi)從20萬篇論文中提煉出相關(guān)見解；普通人也可用LLM輕松摘要和問答，獲取專業(yè)學(xué)術(shù)知識(shí)，瞬間拉近與前沿科學(xué)的距離。

2. 數(shù)據(jù)——生成、提取和標(biāo)注大型科學(xué)數(shù)據(jù)集

盡管我們處于數(shù)據(jù)爆炸時(shí)代，許多自然和社會(huì)領(lǐng)域中，科學(xué)數(shù)據(jù)卻嚴(yán)重匱乏，如土壤、深海、大氣層和非正式經(jīng)濟(jì)。

AI正助力改變這一現(xiàn)狀。它能減少在DNA測序、檢測樣本中具體細(xì)胞類型或捕捉動(dòng)物聲音時(shí)可能發(fā)生的噪聲和錯(cuò)誤。

科學(xué)家們還可以利用LLM越來越強(qiáng)的多模態(tài)能力，從科學(xué)出版物、檔案文件以及視頻圖像等資源中提取非結(jié)構(gòu)化的科學(xué)數(shù)據(jù)，并將其轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)集，以做后續(xù)研究。

AI還可以幫助為科學(xué)數(shù)據(jù)添加科學(xué)家所需的輔助信息。例如，至少三分之一的微生物蛋白質(zhì)在執(zhí)行功能中的細(xì)節(jié)未能被可靠地注釋。

經(jīng)過可靠性評(píng)估驗(yàn)證的AI模型也可以作為新的合成科學(xué)數(shù)據(jù)的來源。例如，AlphaProteo蛋白質(zhì)設(shè)計(jì)模型是在AlphaFold 2中超過1億個(gè)AI生成的蛋白質(zhì)結(jié)構(gòu)以及蛋白質(zhì)數(shù)據(jù)庫中的實(shí)驗(yàn)結(jié)構(gòu)上進(jìn)行訓(xùn)練的。

3. 實(shí)驗(yàn)——模擬、加速并指導(dǎo)復(fù)雜實(shí)驗(yàn)

科學(xué)實(shí)驗(yàn)常因成本高昂、復(fù)雜且耗時(shí)難以執(zhí)行。還有一些實(shí)驗(yàn)因?yàn)檠芯咳藛T無法獲得所需的設(shè)施、人力或?qū)嶒?yàn)材料而無法進(jìn)行。

核聚變就是一個(gè)典型例子。它有望提供一種幾乎無限、無排放的能源來源，并可能支持諸如海水淡化等高能耗的創(chuàng)新性大規(guī)模應(yīng)用。但控制等離子體所需的托卡馬克反應(yīng)堆復(fù)雜昂貴。ITER原型從2013年建造，預(yù)計(jì)2030年代中期才開始實(shí)驗(yàn)。

AI可通過模擬加速實(shí)驗(yàn)進(jìn)程。

一種方法是利用強(qiáng)化學(xué)習(xí)智能體來對(duì)物理系統(tǒng)進(jìn)行模擬。例如，研究者與洛桑聯(lián)邦理工合作，用強(qiáng)化學(xué)習(xí)控制托卡馬克等離子體形狀，這一方法還可用于粒子加速器、望遠(yuǎn)鏡等設(shè)施。

在不同學(xué)科中，利用AI模擬實(shí)驗(yàn)的方式可能各不相同，但一個(gè)共同點(diǎn)是，這些模擬通常用于指導(dǎo)和優(yōu)化現(xiàn)實(shí)實(shí)驗(yàn)，而非完全替代它們。

以基因研究為例，普通人平均有9000多個(gè)錯(cuò)義變異，大多無害，但少數(shù)會(huì)致病?，F(xiàn)實(shí)中，僅能逐個(gè)測試蛋白質(zhì)的影響。而AlphaMissense能快速分類7100萬潛在變異中的89%，幫助科學(xué)家聚焦高風(fēng)險(xiǎn)變異，加速疾病研究。

AlphaMissense對(duì)所有可能的7100萬個(gè)錯(cuò)義變體的致病性的預(yù)測

4. 模型——建模復(fù)雜系統(tǒng)及其組件之間的相互作用

1960年，諾貝爾獎(jiǎng)得主物理學(xué)家Eugene Wigner感嘆數(shù)學(xué)方程在模擬自然現(xiàn)象（如行星運(yùn)動(dòng)）中「出乎意料的有效性」。

但面對(duì)生物學(xué)、經(jīng)濟(jì)學(xué)、天氣等復(fù)雜系統(tǒng)，傳統(tǒng)方程模型漸顯乏力，因?yàn)檫@些系統(tǒng)充滿動(dòng)態(tài)性、隨機(jī)性，還常伴涌現(xiàn)和混沌，難以預(yù)測和控制。這些方程能提供非常有用但并不完美的近似，且運(yùn)行這些方法也需要高昂的計(jì)算成本。

AI卻能從復(fù)雜數(shù)據(jù)中挖掘規(guī)律。例如，谷歌的深度學(xué)習(xí)系統(tǒng)能快速預(yù)測未來10天天氣，速度與準(zhǔn)確性雙殺傳統(tǒng)數(shù)值模型。

同時(shí)，AI還能幫減緩氣候問題，如用AI預(yù)測潮濕區(qū)域的出現(xiàn)時(shí)間和位置，幫助飛行員避開會(huì)加劇全球變暖的凝結(jié)尾跡。

即便AI十分強(qiáng)大，它更多是豐富而非取代傳統(tǒng)的復(fù)雜系統(tǒng)建模。

例如，基于智能體的建模通過模擬個(gè)體行為者（如企業(yè)和消費(fèi)者）之間的交互，來理解這些交互如何影響更大、更復(fù)雜的系統(tǒng)（如社會(huì)經(jīng)濟(jì)）。

在傳統(tǒng)方法中，科學(xué)家需要事先規(guī)定這些智能體的行為方式。

如今，科學(xué)家可以利用大語言模型創(chuàng)建更靈活的生成式智能體，這些智能體能夠進(jìn)行溝通和行動(dòng)，例如搜索信息或購買，同時(shí)還能對(duì)這些行動(dòng)進(jìn)行推理和記憶。

科學(xué)家還可以利用強(qiáng)化學(xué)習(xí)研究這些智能體如何在更動(dòng)態(tài)的模擬中學(xué)習(xí)和調(diào)整其行為，例如對(duì)于新的能源價(jià)格或疫情響應(yīng)政策的反應(yīng)。

5. 解決方案——為大規(guī)模搜索空間問題提出解決方案

很多重要的科學(xué)問題都伴隨著許多幾乎無法理解的潛在解決方案。

比如，生物學(xué)家和化學(xué)家需要確定分子（如蛋白質(zhì)）的結(jié)構(gòu)、特性和功能，才能設(shè)計(jì)出用作抗體藥物、降解塑料的酶或新型材料的一些新分子。

然而，要設(shè)計(jì)一種小分子藥物，科學(xué)家需要面對(duì)超過10^60種潛在選擇；要設(shè)計(jì)一種由400種標(biāo)準(zhǔn)氨基酸組成的蛋白質(zhì)，則需要面對(duì)20^400種選擇。

這種大規(guī)模搜索空間不僅限于分子，還廣泛存在于許多科學(xué)問題中，比如尋找數(shù)學(xué)問題的最佳證明、計(jì)算機(jī)芯片的最佳設(shè)計(jì)架構(gòu)等。

傳統(tǒng)上，科學(xué)家依賴直覺、試錯(cuò)法、迭代或暴力計(jì)算的某種組合來尋找最佳分子、證明或算法。然而，這些方法難以充分遍歷龐大的搜索空間，從而無法發(fā)現(xiàn)更優(yōu)的解決方案。

如今，AI能夠更好地探索這些龐大的搜索空間，同時(shí)更快地聚焦于最有可能可行且有效的解決方案。

今年7月，AlphaProof和AlphaGeometry2成功解決了國際數(shù)學(xué)奧林匹克競賽中六道題目中的四道。它們利用Gemini大語言模型架構(gòu)，為給定的數(shù)學(xué)問題生成大量潛在解決方案，并結(jié)合基于數(shù)學(xué)邏輯的系統(tǒng)，迭代地實(shí)現(xiàn)接近最可能正確的候選解決方案。

AI科學(xué)家還是AI賦能的科學(xué)家？

即便AI系統(tǒng)的能力在不斷提升，其最大的邊際效益依舊會(huì)源于將其應(yīng)用在能夠突顯其相對(duì)優(yōu)勢的場景之中。

比如快速從海量數(shù)據(jù)集中快速提取信息的能力，以及幫助解決科學(xué)進(jìn)步中的真正瓶頸問題；而非企圖讓人類科學(xué)家已擅長的任務(wù)實(shí)現(xiàn)自動(dòng)化。

隨著AI推動(dòng)科學(xué)變得更經(jīng)濟(jì)高效，社會(huì)對(duì)于科學(xué)和科學(xué)家的需求也會(huì)隨之增加。

和其他行業(yè)不同，科學(xué)的需求幾乎是無限的，而科技也并不會(huì)降低對(duì)科學(xué)家的需求。新的進(jìn)展總會(huì)在科學(xué)的版圖上開拓出全新的、難以預(yù)測的領(lǐng)域，AI亦是如此。

正如司馬賀所設(shè)想的那樣，AI系統(tǒng)自身也是科學(xué)研究的對(duì)象，科學(xué)家會(huì)在評(píng)估和闡釋其科學(xué)能力以及開發(fā)新型人類-AI 科學(xué)系統(tǒng)方面起到主導(dǎo)作用。

關(guān)鍵要素

這一部分，文章深入探討了實(shí)現(xiàn)「AI for Science」的幾個(gè)關(guān)鍵因素，并將其歸納為一個(gè)「AI for Science生產(chǎn)函數(shù)」的模型。

模型展示了如何利用AI推動(dòng)科學(xué)研究和創(chuàng)新的不同階段以及需要關(guān)注的核心內(nèi)容。

從科學(xué)研究的問題選擇（Problem selection）、模型評(píng)估（Evaluations）開始，通過計(jì)算資源（Compute）和數(shù)據(jù)（Data）這些基礎(chǔ)設(shè)施的支持，在開展研究過程中注重組織模式設(shè)計(jì)（Organizational design）和跨學(xué)科（Interdisciplinarity），形成成果，并最終通過采納（Adoption）將研究成果轉(zhuǎn)化為實(shí)際影響。底部的合作（Partnerships）、安全與責(zé)任（Safety & responsibility）貫穿始終，確保整個(gè)流程高效且符合道德規(guī)范。

雖然很多要素看起來直觀，但DeepMind的論文揭示了一些在實(shí)踐中重要的經(jīng)驗(yàn)教訓(xùn)。

1. 問題選擇

科學(xué)進(jìn)步的關(guān)鍵是找到真正值得解決的問題。

在DeepMind，科學(xué)團(tuán)隊(duì)通常會(huì)先評(píng)估一個(gè)研究問題是否足夠重要，是否值得投入大量時(shí)間和資源。

DeepMind的CEO Demis Hassabis提出過一個(gè)思維模型：將整個(gè)科學(xué)視為一棵知識(shí)之樹。

那么，最重要的是找到樹的根——像蛋白質(zhì)結(jié)構(gòu)預(yù)測、量子化學(xué)這些基礎(chǔ)性的「根源問題」，它們一旦得到解決，就能開枝散葉，解鎖全新的研究和應(yīng)用。

而在這些問題當(dāng)中，要判斷AI是否能帶來增益，我們需要尋找具備特定特征的問題，例如巨大的組合搜索空間、大量數(shù)據(jù)，以及可用于衡量性能的明確目標(biāo)函數(shù)。

許多最近的突破，就來自于重要科學(xué)問題和成熟AI方法的碰撞。

例如，DeepMind在核聚變研究的進(jìn)展就得益于新發(fā)布的強(qiáng)化學(xué)習(xí)算法——最大后驗(yàn)策略優(yōu)化（maximum a posteriori policy optimization）。

選對(duì)問題很重要，但問題的難度也得剛好。一個(gè)適合AI的問題，通常是能夠產(chǎn)生中間結(jié)果的問題。

如果問題太難，就沒法產(chǎn)生足夠的反饋推動(dòng)進(jìn)展。要做到這一點(diǎn)，需要靠需要直覺與實(shí)驗(yàn)的結(jié)合。

2. 模型評(píng)估

科學(xué)AI研究中，模型的評(píng)估方法也很重要。

科學(xué)家常常通過基準(zhǔn)測試、指標(biāo)和競賽等評(píng)估方法來評(píng)估AI模型的科學(xué)能力。

如果設(shè)計(jì)得當(dāng)，這些評(píng)估方法不僅可以用來跟蹤進(jìn)展，還能激發(fā)方法創(chuàng)新，激活研究人員對(duì)科學(xué)問題的興趣。

不同的情況需要不同的評(píng)估方法。

比如，DeepMind的天氣預(yù)測團(tuán)隊(duì)最初用基于幾個(gè)關(guān)鍵變量（如地表溫度）的「進(jìn)展指標(biāo)」來提升模型表現(xiàn)。

當(dāng)模型達(dá)到一定性能水平時(shí)，他們采用了一個(gè)更全面的評(píng)估方法，其中包括1300多個(gè)指標(biāo)。這些指標(biāo)的設(shè)計(jì)受歐洲中期天氣預(yù)報(bào)中心（ECMWF）評(píng)價(jià)評(píng)分卡啟發(fā)。

團(tuán)隊(duì)也發(fā)現(xiàn)AI模型有時(shí)會(huì)在某些指標(biāo)上「作弊」，比如「雙重懲罰」問題——「模糊」預(yù)測（如預(yù)測降雨在較大地理區(qū)域內(nèi)發(fā)生）比「精準(zhǔn)」預(yù)測（如預(yù)測暴風(fēng)雨的位置略微偏離實(shí)際位置）受到的懲罰更少。

為進(jìn)一步驗(yàn)證，團(tuán)隊(duì)還評(píng)估了模型在下游任務(wù)中的實(shí)用性，例如預(yù)測氣旋路徑的能力，以及表征可能導(dǎo)致洪水的「大氣河流」（集中濕氣的狹窄帶）的強(qiáng)度。

最具影響力的科學(xué)AI評(píng)估方法通常是社區(qū)主導(dǎo)的，比如蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽（CASP）。

該競賽自1994年由John Moult教授和Krzysztof Fidelis教授發(fā)起，每兩年舉行一次。CASP的目標(biāo)是通過測試各參賽團(tuán)隊(duì)的蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的準(zhǔn)確性，推動(dòng)相關(guān)領(lǐng)域的技術(shù)創(chuàng)新，并加深對(duì)蛋白質(zhì)折疊和結(jié)構(gòu)的理解。

不過，這也帶來了基準(zhǔn)可能「泄露」到AI模型訓(xùn)練數(shù)據(jù)中的風(fēng)險(xiǎn)，讓模型「作弊」，從而降低基準(zhǔn)用于跟蹤模型進(jìn)展的效用。

「作弊」問題暫時(shí)沒有完美的解決方案，但至少需要定期更新基準(zhǔn)，鼓勵(lì)更開放的第三方評(píng)估和競賽。

3. 計(jì)算資源

計(jì)算資源是AI和科學(xué)發(fā)展的核心引擎，但也是節(jié)能減排的焦點(diǎn)之一。

AI實(shí)驗(yàn)室和政策制定者需要從長遠(yuǎn)視角平衡模型需求與效率提升。

比如，蛋白質(zhì)設(shè)計(jì)模型小巧高效，而大語言模型訓(xùn)練時(shí)計(jì)算密集，但微調(diào)和推理時(shí)所需計(jì)算量則比較少；通過優(yōu)化數(shù)據(jù)或?qū)⒋竽Ｐ汀刚麴s」成小模型，也可以進(jìn)一步降低計(jì)算成本。

同時(shí)，也需要對(duì)比AI與其他科學(xué)方法的資源消耗。

例如，AI驅(qū)動(dòng)的天氣預(yù)測模型盡管訓(xùn)練耗費(fèi)資源，但整體效率可能優(yōu)于傳統(tǒng)方法。實(shí)證數(shù)據(jù)的持續(xù)跟蹤可以幫助明確這些趨勢，并為未來計(jì)算需求的規(guī)劃提供依據(jù)。

此外，計(jì)算戰(zhàn)略不應(yīng)僅關(guān)注芯片供應(yīng)的充足性，更需優(yōu)先建設(shè)關(guān)鍵基礎(chǔ)設(shè)施和提升工程技能，以保障資源訪問和系統(tǒng)可靠性。然而，學(xué)術(shù)界和公共研究機(jī)構(gòu)在這些方面往往資源不足，需要更多支持。

4. 數(shù)據(jù)

像計(jì)算資源一樣，數(shù)據(jù)是科學(xué)AI發(fā)展的基礎(chǔ)設(shè)施，需要持續(xù)開發(fā)、維護(hù)和更新。

人們常著眼于政策制定者推動(dòng)的新數(shù)據(jù)集創(chuàng)建。

例如，2012年奧巴馬政府啟動(dòng)的材料項(xiàng)目繪制了無機(jī)晶體圖譜，為DeepMind最近的GNoME項(xiàng)目預(yù)測220萬種新材料提供了數(shù)據(jù)支持。

但許多科學(xué)AI突破往往來自更有機(jī)的數(shù)據(jù)涌現(xiàn)，這些數(shù)據(jù)得益于有遠(yuǎn)見的個(gè)人或小團(tuán)隊(duì)的努力。

像當(dāng)時(shí)Broad研究所的Daniel MacArthur領(lǐng)導(dǎo)開發(fā)的gnomAD遺傳變異數(shù)據(jù)集，為DeepMind的AlphaMissense項(xiàng)目提供了基礎(chǔ)。

還有，數(shù)學(xué)工具Lean最初由Leonardo de Moura開發(fā)，如今已成AI數(shù)學(xué)模型（如AlphaProof）的重要訓(xùn)練資源。

這些案例說明，除了自上而下的戰(zhàn)略規(guī)劃，還需要激勵(lì)研究者在數(shù)據(jù)收集、整理和共享中扮演更積極的角色。

當(dāng)前，許多濕實(shí)驗(yàn)室的實(shí)驗(yàn)數(shù)據(jù)因缺乏資金支持而被丟棄；而蛋白質(zhì)數(shù)據(jù)銀行（PDB）的高質(zhì)量數(shù)據(jù)則受益于期刊要求和專業(yè)數(shù)據(jù)整理員制定的統(tǒng)一標(biāo)準(zhǔn)。相比之下，基因組數(shù)據(jù)的整理因標(biāo)準(zhǔn)不一，則常需額外整合和清洗。

此外，還有許多高質(zhì)量數(shù)據(jù)集完全未被利用，比如因許可限制無法公開的生物多樣性數(shù)據(jù)，或幾十年核聚變實(shí)驗(yàn)的歷史數(shù)據(jù)。這些瓶頸無論是由于缺乏資源、時(shí)間，還是由于數(shù)據(jù)禁運(yùn)期，都會(huì)阻礙AI在科學(xué)領(lǐng)域的潛力釋放。

5. 組織模式設(shè)計(jì)

學(xué)術(shù)界偏自下而上，工業(yè)界偏自上而下，但頂尖實(shí)驗(yàn)室往往能找到二者間的平衡。

像貝爾實(shí)驗(yàn)室和施樂帕洛阿爾托研究中心的黃金年代，就以自由探索的研究模式著稱。這也為DeepMind的創(chuàng)立提供了靈感。

最近，一批新興科學(xué)機(jī)構(gòu)試圖從這些例子中汲取經(jīng)驗(yàn)，復(fù)刻這種研究模式。它們希望推動(dòng)更多高風(fēng)險(xiǎn)、高回報(bào)的研究，削減官僚主義，為科學(xué)家提供更好的激勵(lì)。

這些機(jī)構(gòu)致力于解決一些科學(xué)中規(guī)模過大、學(xué)術(shù)界無法承擔(dān)，但在工業(yè)界又不夠盈利的問題，例如擴(kuò)展Lean證明助手，這一工具對(duì)AI數(shù)學(xué)研究至關(guān)重要。

這些機(jī)構(gòu)的核心目標(biāo)在于，將自上而下的協(xié)調(diào)與對(duì)科學(xué)家自下而上的賦能相結(jié)合。既不能完全依賴科學(xué)家自由發(fā)揮（可能導(dǎo)致效率低下或研究方向分散），也不能強(qiáng)行控制每一步（會(huì)扼殺創(chuàng)造力）。

理想狀態(tài)下，機(jī)構(gòu)為科學(xué)家提供清晰的目標(biāo)、資源和支持，但具體的研究方法和過程由科學(xué)家自己主導(dǎo)。

找到這種平衡不僅能吸引頂尖研究領(lǐng)導(dǎo)者，也是成功的關(guān)鍵。Demis Hassabis稱之為協(xié)調(diào)尖端研究的核心秘訣。

這種平衡同樣適用于具體項(xiàng)目。比如在DeepMind，研究常在「探索」?fàn)顟B(tài)（團(tuán)隊(duì)尋找新想法）和「利用」?fàn)顟B(tài)（團(tuán)隊(duì)專注于工程和性能擴(kuò)展）兩種模式間切換。

掌握模式切換時(shí)機(jī)和調(diào)整團(tuán)隊(duì)節(jié)奏，是一門藝術(shù)。

6. 跨學(xué)科

跨學(xué)科合作是破解科學(xué)難題的鑰匙，卻常被學(xué)科壁壘卡住。

科學(xué)AI的研究往往需要多學(xué)科起步，但真正的突破來自跨學(xué)科的深度融合。這不僅是把人湊在一起，而是讓團(tuán)隊(duì)共同開發(fā)共享的方法和思想。

比如，DeepMind的Ithaca項(xiàng)目用AI修復(fù)受損的古希臘銘文。為了成功，AI研究負(fù)責(zé)人要鉆研銘文學(xué)，而銘文學(xué)家也需要理解AI模型，因?yàn)橹庇X對(duì)這一工作至關(guān)重要。

培養(yǎng)這種團(tuán)隊(duì)動(dòng)態(tài)需要正確的激勵(lì)機(jī)制。團(tuán)隊(duì)能做到這一點(diǎn)，靠的是專注于解決問題，而不是搶論文署名——這也是AlphaFold 2成功的關(guān)鍵。

這種專注在工業(yè)實(shí)驗(yàn)室更易實(shí)現(xiàn)，也凸顯了長期公共研究資金的重要性——它需要擺脫對(duì)發(fā)表壓力的過度依賴。

為了實(shí)現(xiàn)真正的跨學(xué)科合作，組織還需要為能夠幫助融合學(xué)科的人創(chuàng)造角色和職業(yè)路徑。

在DeepMind，研究工程師推動(dòng)研究與工程的良性循環(huán)，項(xiàng)目經(jīng)理加強(qiáng)團(tuán)隊(duì)協(xié)作并連接不同項(xiàng)目。DeepMind還優(yōu)先招募擅長發(fā)現(xiàn)學(xué)科交叉的人，并鼓勵(lì)科學(xué)家和工程師定期更換項(xiàng)目。

關(guān)鍵是打造一種文化——好奇心驅(qū)動(dòng)、尊重差異、敢于爭論。經(jīng)濟(jì)歷史學(xué)家Joel Mokyr稱這種文化為「爭議性」（contestability）：不同背景的研究者能公開探討，彼此批評(píng)又共同進(jìn)步。

這種文化的實(shí)踐可以通過定期舉辦跨學(xué)科研討會(huì)、開放討論平臺(tái)以及鼓勵(lì)團(tuán)隊(duì)內(nèi)外互動(dòng)來實(shí)現(xiàn)。

這段修復(fù)的銘文（IG I3 4B）記錄了一項(xiàng)與雅典衛(wèi)城相關(guān)的法令，時(shí)間可追溯至公元前485年至484年

7. 采用

科學(xué)AI工具如AlphaFold既專業(yè)化又通用：它們專注少量任務(wù)，卻服務(wù)廣泛科學(xué)界，從研究疾病到改進(jìn)漁業(yè)。

然而，科學(xué)進(jìn)展轉(zhuǎn)化為實(shí)際應(yīng)用并不簡單。例如，疾病的病原理論（germ-theory）從提出到被廣泛接受經(jīng)歷了漫長的時(shí)間，而科學(xué)突破所催生的下游產(chǎn)品（如新型抗生素）也常常由于缺乏合適的市場激勵(lì)而未能得到充分開發(fā)。

為了促進(jìn)模型的落地應(yīng)用，我們?cè)诳茖W(xué)家采用與商業(yè)目標(biāo)、安全風(fēng)險(xiǎn)等因素之間尋找平衡，并設(shè)立了一個(gè)專門的影響力加速器（Impact Accelerator），以推動(dòng)研究的落地應(yīng)用，并鼓勵(lì)社會(huì)公益方向的合作。

要讓科學(xué)家更容易用上新工具，集成流程必須簡單。

在AlphaFold 2開發(fā)中，我們不僅開源代碼，還聯(lián)合EMBL-EBI創(chuàng)建數(shù)據(jù)庫，供計(jì)算資源有限的科學(xué)家輕松查詢2億種蛋白質(zhì)結(jié)構(gòu)。

AlphaFold 3進(jìn)一步擴(kuò)展了功能，但預(yù)測需求激增。為此，我們推出AlphaFold Server，科學(xué)家可按需生成結(jié)構(gòu)。

同時(shí)，科學(xué)界還自發(fā)開發(fā)工具如ColabFold，顯示對(duì)多樣化需求的重視及培養(yǎng)科學(xué)界計(jì)算能力的重要性。

迄今為止，來自全球190多個(gè)國家的超過200萬用戶已訪問AlphaFold蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫，瀏覽了700多萬個(gè)結(jié)構(gòu)

科學(xué)家信任AI模型，才會(huì)用它。推廣關(guān)鍵在于明確模型的用途和局限。

比如，在AlphaFold開發(fā)中，我們?cè)O(shè)計(jì)了不確定性指標(biāo)，通過直觀可視化展示模型對(duì)預(yù)測的信心，并與EMBL-EBI合作推出培訓(xùn)模塊，指導(dǎo)如何解讀置信度并用實(shí)際案例強(qiáng)化信任。

類似地，Med-Gemini系統(tǒng)在健康問答上表現(xiàn)優(yōu)異。它通過生成多條推理鏈評(píng)估答案分歧計(jì)算不確定性。當(dāng)不確定性高時(shí)，自動(dòng)調(diào)用網(wǎng)絡(luò)搜索整合最新信息。

這種方法既提升了可靠性，也讓科學(xué)家對(duì)決策過程一目了然，信任倍增。

Med-Gemini-3D能夠?yàn)镃T掃描生成報(bào)告，這比標(biāo)準(zhǔn)X光成像復(fù)雜得多。在此示例中，Med-Gemini-3D的報(bào)告正確地包含了原始放射科醫(yī)生報(bào)告中遺漏的一處病變（用綠色標(biāo)出）

8. 合作

科學(xué)AI離不開多領(lǐng)域協(xié)作，公共和私營部門的合作尤為關(guān)鍵。

從數(shù)據(jù)集創(chuàng)建到成果共享，這種合作貫穿項(xiàng)目全程。

比如，AI模型設(shè)計(jì)的新材料是否可行，需要資深材料科學(xué)家的評(píng)估；DeepMind設(shè)計(jì)的抗SARS-CoV-2蛋白質(zhì)，能否如預(yù)期結(jié)合目標(biāo)，也需與克里克研究所合作進(jìn)行濕實(shí)驗(yàn)驗(yàn)證。甚至在數(shù)學(xué)領(lǐng)域，F(xiàn)unSearch解決Cap Set問題，也得益于數(shù)學(xué)家Jordan Ellenberg的專業(yè)指導(dǎo)。

鑒于工業(yè)實(shí)驗(yàn)室在推動(dòng)AI發(fā)展中的核心作用，以及對(duì)豐富領(lǐng)域知識(shí)的需求，公共與私營部門的合作在推動(dòng)科學(xué)AI前沿發(fā)展方面的重要性將日益凸顯。為此，必須加大對(duì)公私合作的支持，比如為大學(xué)和研究機(jī)構(gòu)與企業(yè)的聯(lián)合團(tuán)隊(duì)提供更多資金。

但合作不簡單。各方需盡早就目標(biāo)和關(guān)鍵問題達(dá)成一致：研究成果歸屬、是否發(fā)表論文、數(shù)據(jù)和模型是否開源、適用的許可協(xié)議等，都可能引發(fā)爭議。這些分歧通常反映了雙方不同的激勵(lì)，但成功合作往往建立在清晰的價(jià)值互換之上。

比如，AlphaFold蛋白質(zhì)數(shù)據(jù)庫能覆蓋200萬用戶，正是因?yàn)榻Y(jié)合了我們的AI模型與EMBL-EBI的生物數(shù)據(jù)管理專長。這種優(yōu)勢互補(bǔ)式合作，不僅高效，還能讓AI潛力最大化。

責(zé)任編輯：張燕妮來源：新智元

AI 科學(xué)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營