全球首個(gè)AI基因組誕生,35億年生命代碼重編程!生物學(xué)迎「ChatGPT時(shí)刻」
人類歷史首次,用AI生成全功能基因組!
1977年,生物化學(xué)家Frederick Sanger等人,完成了史上第一個(gè)基因組測(cè)序——噬菌體ΦX174。
40多年后的今天,斯坦福聯(lián)手Arc Institute團(tuán)隊(duì),以ΦX174為起點(diǎn),用AI首次生成了噬菌體基因組。

其中一個(gè),AI設(shè)計(jì)的噬菌體基因組,長(zhǎng)的是這樣子:

Evo-Φ36
簡(jiǎn)單講,噬菌體ΦX174是一種「感染大腸桿菌」的病毒,能精準(zhǔn)獵殺細(xì)菌,卻對(duì)人體無害。
過去,設(shè)計(jì)一個(gè)基因組絕非易事,需要考慮繁多的因素,限制了合成生物學(xué)領(lǐng)域的進(jìn)展。
為此,斯坦福等團(tuán)隊(duì)拿出了「秘密武器」——
基于數(shù)百萬個(gè)基因組訓(xùn)練,DNA語言模型Evo 1和Evo 2,能以超乎想象的規(guī)模學(xué)習(xí)基因組的復(fù)雜特征。
其工作原理與ChatGPT類似,專門去處理DNA。

論文地址:https://www.biorxiv.org/content/10.1101/2025.09.12.675911v1
他們以噬菌體ΦX174為模板,合成了285條基因組。
最終顯示,16個(gè)基因組可有效抑制宿主生長(zhǎng),不僅能精準(zhǔn)干掉特定大腸桿菌,還不會(huì)誤傷其他的菌株。
有些AI設(shè)計(jì)的噬菌體,比原始版本復(fù)制力更快、競(jìng)爭(zhēng)力更強(qiáng),甚至還能對(duì)付天然噬菌體難以處理的耐藥菌。
這一實(shí)驗(yàn)的成功,意味著什么?


它標(biāo)志AI在「合成生物學(xué)」領(lǐng)域的一次重大突破——
首次成功驗(yàn)證了,AI能完整生成具備生物學(xué)功能的噬菌體基因組。
這不僅擴(kuò)展了人類對(duì)生命設(shè)計(jì)的邊界,還為應(yīng)對(duì)「抗生素耐藥性」等健康挑戰(zhàn),提供了全新可替代的療法。

歷史首次!AI生成「完整」基因組
在最新技術(shù)博文中,核心團(tuán)隊(duì)詳細(xì)拆解了,成功設(shè)計(jì)首批AI生成基因組的秘訣。

不論是設(shè)計(jì)單個(gè)基因,還是一個(gè)完整的基因組,都是一項(xiàng)極具挑戰(zhàn)的難題。
以遺傳信息存儲(chǔ)系統(tǒng)的歷史來算,基因組大概存在了40億年。而DNA基因組的存在,大約有35億年。

今年2月,Arc Institute曾證明了,基因組基礎(chǔ)模型Evo「家族」,可成功生成單個(gè)蛋白質(zhì)或復(fù)雜的多組分系統(tǒng),比如CRISPR-Cas復(fù)合體。
但是設(shè)計(jì)整個(gè)基因組,那又是一個(gè)全新的戰(zhàn)場(chǎng)!

因?yàn)椋蚪M設(shè)計(jì),核心難題在于復(fù)雜性:多個(gè)基因相互作用,還要維持精妙的平衡,確保復(fù)制、宿主特異性和進(jìn)化適應(yīng)性。
這些挑戰(zhàn),在單個(gè)蛋白質(zhì)設(shè)計(jì)中,根本不會(huì)存在。
為了攻克這一難題,斯坦福Arc Institute團(tuán)隊(duì)開發(fā)了一系列創(chuàng)新技術(shù),其中包括:
- 一個(gè)為重疊閱讀框定制的基因注釋流程;
- 用于從基因組語言模型中采樣的系統(tǒng)性微調(diào)與提示詞工程策略;
- 一套為合成噬菌體基因組設(shè)計(jì)的全新篩選方案
ΦX174,跨越半個(gè)世紀(jì)接力賽
若要生成合成基因組,還得需要一個(gè)可靠的起點(diǎn)。
噬菌體ΦX174——一種微小的病毒基因組,只有5386個(gè)核苷酸,編碼11個(gè)基因。

左:ΦX174噬菌體顯微照;右:?jiǎn)蝹€(gè)ΦX174噬菌體3D結(jié)構(gòu)
它的大小,剛好在當(dāng)前DNA合成成本的可承受范圍內(nèi),卻也足夠復(fù)雜,能考驗(yàn)基因組設(shè)計(jì)的能力。
然而,ΦX174基因重疊結(jié)構(gòu),創(chuàng)造了一個(gè)嚴(yán)苛的測(cè)試用例:
一個(gè)突變可能影響多個(gè)蛋白質(zhì),必須多重約束下才能正常工作。
此外,ΦX174編碼了多種調(diào)控元件和識(shí)別序列,它們精密協(xié)同,確保噬菌體在宿主細(xì)胞內(nèi)能被正確包裝和復(fù)制。
ΦX174基因組,是一場(chǎng)跨越半個(gè)世紀(jì)的接力賽。
1977年,F(xiàn)red Sanger及其團(tuán)隊(duì)的研究,讓其成為人類首個(gè)完整測(cè)序的基因組。

2003年,Craig Venter及其團(tuán)隊(duì)首次通過化學(xué)方法將其完整合成,證明了基因組可以從零開始構(gòu)建。
如今,2025年,團(tuán)隊(duì)利用ΦX174作為模板,創(chuàng)造出首批由AI生成的基因組。
這一演進(jìn)歷程,正標(biāo)志著定義現(xiàn)代基因組學(xué)的核心能力:先學(xué)會(huì)了讀?。y(cè)序),接著是寫入(合成),而現(xiàn)在是設(shè)計(jì)(AI生成)。

ΦX174基因組
AI「基因組工廠」,破解重疊謎題
如上所述,ΦX174重疊基因,讓標(biāo)準(zhǔn)工具束手無策。因?yàn)樗荒茏R(shí)別11個(gè)基因中的7個(gè)。
為此,研究人員打造了專屬注釋流程:
結(jié)合開放閱讀框(ORF)搜索和噬菌體蛋白數(shù)據(jù)庫的同源性比對(duì),最終成功識(shí)別全部基因,甚至預(yù)測(cè)了部分A*基因。
這一工具,在評(píng)估數(shù)千個(gè)AI生成的序列時(shí),大顯身手。
研究人員設(shè)定了底線——生成的基因組必須預(yù)測(cè)出,至少7個(gè)匹配天然ΦX174蛋白質(zhì),確保保留噬菌體「生存工具包」。
微調(diào)Evo,讓AI更懂噬菌體
原有的Evo模型,基于海量噬菌體數(shù)據(jù)訓(xùn)練后,雖能生成序列,但缺乏針對(duì)ΦX174精準(zhǔn)控制。
為此,監(jiān)督微調(diào),成為了不二選擇。
團(tuán)隊(duì)又讓Evo,在14,466精選的微小噬菌體序列上,繼續(xù)訓(xùn)練在減少冗余后,模型專攻ΦX174相關(guān)變異。
微調(diào)后,通過精心設(shè)計(jì)的提示詞和采樣參數(shù),Evo能生成與ΦX174進(jìn)化相似卻又創(chuàng)新的序列。
這就像給AI一個(gè)靈感模板,讓它在熟悉中注入新意。

評(píng)估與篩選
生成序列后,作者又開發(fā)了多維度評(píng)估體系,可以檢查基因排列、宿主特異性和進(jìn)化多樣性。
關(guān)鍵是,確保AI噬菌體能感染,實(shí)驗(yàn)用的非致病菌株——C型大腸桿菌。
于是,他們要求序列中包含與ΦX174相似的刺突蛋白,因?yàn)樵摰鞍讻Q定了ΦX174的宿主范圍。
實(shí)驗(yàn)證明,所有16個(gè)功能性噬菌體,都對(duì)C型大腸桿菌,以及W型大腸桿菌,具有嚴(yán)格的靶向性。
而且,其對(duì)其他六種測(cè)試菌株無效。
這恰恰證明了,宿主特異性可以在基因組中,其他區(qū)域顯著進(jìn)化的同時(shí)得以維持。

2小時(shí)「團(tuán)滅」細(xì)菌
全新噬菌體誕生
傳統(tǒng)噬菌體研究慢而繁瑣,研究人員又創(chuàng)新了篩選流程。
他們用Gibson組裝合成基因組,轉(zhuǎn)化至感受態(tài)C型大腸桿菌中,然后在96孔板中監(jiān)測(cè)其生長(zhǎng)抑制情況。
成功感染,會(huì)讓細(xì)菌密度(OD???)在2-3小時(shí)內(nèi)暴跌。
這個(gè)方案,讓團(tuán)隊(duì)能快速測(cè)試285個(gè)設(shè)計(jì),最終驗(yàn)證了16個(gè)功能性噬菌體,并表征它們的適應(yīng)性和宿主范圍。

評(píng)估AI設(shè)計(jì)噬菌體的實(shí)驗(yàn)檢測(cè)
這些AI基因組攜帶了67-392個(gè),相較于其最近似天然基因組的新突變。
其中,Evo-Φ2147攜帶了392個(gè)突變,與噬菌體NC51的平均核苷酸同一性為93.0%。
根據(jù)某些分類學(xué)標(biāo)準(zhǔn),它足以被認(rèn)定為一個(gè)新物種。
另外,13個(gè)基因組包含自然界未見的突變,證明Evo能夠利用自然進(jìn)化從未涉足過的序列空間。
一個(gè)非常有趣的發(fā)現(xiàn)是,合成噬菌體之一Evo-Φ36整合了,遠(yuǎn)親噬菌體G4的DNA包裝蛋白——J蛋白(25 vs 38個(gè)氨基酸)。

這在以往,是一個(gè)未能攻克的工程性難題。
研究人員通過冷凍電鏡看到,它以獨(dú)特方式嵌入衣殼結(jié)構(gòu),AI巧妙地協(xié)調(diào)補(bǔ)償突變,讓全新蛋白質(zhì)組合得以正常運(yùn)作。

跨代追殺「耐藥菌」,5次逆轉(zhuǎn)
細(xì)菌的抗生素耐藥性,是現(xiàn)代醫(yī)學(xué)面臨的最緊迫挑戰(zhàn)之一,每年有數(shù)十萬,甚至更多人因此喪生。
細(xì)菌能夠迅速進(jìn)化出對(duì)傳統(tǒng)抗生素的耐藥性,卻極大地限制了治療效果。

而噬菌體療法有望逆轉(zhuǎn),但自然噬菌體往往跟不上細(xì)菌進(jìn)化。
在研究中,研究團(tuán)隊(duì)誘導(dǎo)了,三種對(duì)ΦX174具有耐藥性的C型大腸桿菌菌株,這些菌株的waa操縱子(負(fù)責(zé)修飾細(xì)菌表面受體)發(fā)生了突變。
結(jié)果顯示,AI生成的噬菌體「雞尾酒」(cocktails),在1-5次傳代內(nèi)攻克了三種耐藥菌株。
然而,單獨(dú)使用ΦX174,則完全無效。
值得一提的是,這些實(shí)現(xiàn)突破的噬菌體,是「嵌合基因組」。它們?nèi)诤隙鄠€(gè)AI片段,突變集中在受體交互區(qū)。
序列分析表明,成功的噬菌體,結(jié)合了2-3種不同AI設(shè)計(jì)的遺傳元件。
這樣一來,人類無需依賴自然界稀有的噬菌體,而讓AI直接生成多樣群體,形成「多重打擊」,讓細(xì)菌難以發(fā)展出全面的耐藥性。

總而言之,AI能快速篩選出有效的基因序列,這就讓噬菌體療法不再是碰運(yùn)氣的「試錯(cuò)」,而是精準(zhǔn)的「設(shè)計(jì)」。
未來,人類能主動(dòng)設(shè)計(jì)出領(lǐng)先一步的療法,永遠(yuǎn)跑在細(xì)菌變異的前面。
基因革命2.0,編寫生命代碼
如今,噬菌體療法,正日益成為對(duì)抗多重耐藥菌的有效武器。
近期,醫(yī)學(xué)上的治療靶點(diǎn),主要針對(duì)植物病原體,或是大型DNA噬菌體。

最新研究證明,AI模型已能捕捉進(jìn)化約束,通過訓(xùn)練、質(zhì)控和高質(zhì)量驗(yàn)證,橋接AI生成序列與生物學(xué)現(xiàn)實(shí)。
隨著模型迭代和合成成本下降,全基因組設(shè)計(jì)將開啟未探索的進(jìn)化空間,為生物技術(shù)和基礎(chǔ)研究開辟全新的疆域。
從讀取到寫入,再到設(shè)計(jì),這一轉(zhuǎn)變,標(biāo)志著人類在最基礎(chǔ)的層面上改造生物學(xué)的能力,翻開了新的篇章。

核心作者
Brian Hie
我是斯坦福大學(xué)化學(xué)工程系的助理教授,以及Arc Institute創(chuàng)新研究員,致力于生物學(xué)與人工智能交叉領(lǐng)域的研究。
他曾獲得了MIT CSAIL博士學(xué)位,本科就讀于斯坦福大學(xué)。

Samuel King
Samuel King是斯坦福大學(xué)博士研究生,目前在Arc Institute從事合成生物學(xué)與ML交叉領(lǐng)域的研究工作。
他本科畢業(yè)于哥倫比亞大學(xué)(UBC),獲得生物學(xué)榮譽(yù)學(xué)士學(xué)位。



































