麻省理工團(tuán)隊(duì)用活細(xì)胞構(gòu)建微型計(jì)算機(jī),即時(shí)讀取和寫入
這是一個(gè)生物學(xué)和計(jì)算機(jī)科學(xué)結(jié)合的典范,麻省理工學(xué)院的科學(xué)家利用基因編輯技術(shù)將細(xì)胞變?yōu)槲⑿陀?jì)算機(jī),可實(shí)現(xiàn)讀取、寫入和執(zhí)行的功能。
DNA 計(jì)算機(jī)在 1990 年代就出現(xiàn)了,與電子計(jì)算機(jī)用“0”和“1”來(lái)儲(chǔ)存信息不同,DNA 計(jì)算機(jī)將信息儲(chǔ)存在構(gòu)成 DNA 分子的A、C、G、T中。只是這些 DNA 信息在活細(xì)胞中不容易改變,因而計(jì)算緩慢。于是麻省理工學(xué)院的科學(xué)家希望加速這一過(guò)程,發(fā)明了一種稱作DOMINO的技術(shù),該技術(shù)全稱是基于 DNA 的有序存儲(chǔ)器和迭代網(wǎng)絡(luò)運(yùn)行者。它建立在 CRISPR 基因編輯技術(shù)基礎(chǔ)上,旨在響應(yīng)小分子或光照等生物信號(hào)。
8 月 22 日,這篇文章以《活細(xì)胞中單核苷酸分辨率的計(jì)算和儲(chǔ)存》為題發(fā)表在《分子細(xì)胞》期刊(Molecular Cell)。通訊作者是來(lái)自麻省理工學(xué)院的施密特科學(xué)博士后研究員 Fahim Farzadfard 與電氣工程與計(jì)算機(jī)科學(xué)系、生物工程系副教授盧冠達(dá)(Timothy K. Lu)。
這是 Fahim Farzadfard 做的藝術(shù)圖。他們開發(fā)的 DOMINO 是一種記錄生物信息并在活細(xì)胞中進(jìn)行邏輯和計(jì)算的技術(shù),該技術(shù)通過(guò) DNA 寫入事件的級(jí)聯(lián)(類似于多米諾骨牌),為活細(xì)胞中的信息傳播、計(jì)算和存儲(chǔ)提供了強(qiáng)大且可擴(kuò)展的方法。來(lái)源:Fahim Farzadfard
利用堿基突變實(shí)現(xiàn)單核苷酸分辨率,無(wú)需破壞細(xì)胞
因其普遍存在的持久性和生物功能兼容性,DNA 成為人工生物信息儲(chǔ)存的理想介質(zhì),特別是隨著 DNA 測(cè)序效率的提升以及成本下降,其信息儲(chǔ)存優(yōu)勢(shì)日漸明顯。
如今基因組編輯技術(shù)讓人們能更便捷改變遺傳信息。DNA 編輯器可以對(duì)活細(xì)胞內(nèi)所含 DNA 進(jìn)行插入、刪除、倒位或堿基替換突變等形式,并可用于區(qū)分不同 DNA 記憶狀態(tài)。短暫的細(xì)胞事件,例如蛋白質(zhì)-蛋白質(zhì)相互作用,可以作為轉(zhuǎn)錄輸出被 DNA 信息儲(chǔ)存。
此前的活細(xì)胞 DNA 技術(shù)只能讀取或?qū)懭?,也就是說(shuō),在一兩個(gè)分子事件后該細(xì)胞就停止了數(shù)據(jù)儲(chǔ)存,其編碼容量和可擴(kuò)展性受到限制,不能用來(lái)連續(xù)監(jiān)控動(dòng)態(tài)信號(hào)或長(zhǎng)時(shí)間歷史信號(hào),并且缺乏便捷的讀寫和監(jiān)控操作模式。
因此,人們需要一種高效且穩(wěn)健的分子記錄和 DNA 記憶平臺(tái),像硬盤一樣能夠進(jìn)行信息存儲(chǔ)和計(jì)算,F(xiàn)ahim Farzadfard 等人構(gòu)建的活細(xì)胞 DNA 分子記錄儀則能夠編碼更多信息。
這是一種非破壞性的 DNA 報(bào)告基因回路,可以響應(yīng)細(xì)胞內(nèi)的指導(dǎo) RNA(gRNA)突變儲(chǔ)存狀態(tài),最后以不同水平輸出。因此系統(tǒng)讀取只需要測(cè)定回路狀態(tài),而無(wú)需破壞細(xì)胞和 DNA 測(cè)序讀數(shù)。
DOMINO 存儲(chǔ)器架構(gòu)的示意圖。來(lái)源:Molecular Cell
為了達(dá)到更高的精確度,研究人員將一種 Cas9 與最近開發(fā)的堿基編輯酶融合,該酶可以將核苷酸胞嘧啶轉(zhuǎn)化為胸腺嘧啶而不破壞雙鏈 DNA。具體而言,研究人員利用基因編輯技術(shù)構(gòu)建了一個(gè)單核苷酸分辨率的讀寫頭,這個(gè)讀寫頭由與胞苷脫氨酶融合的 Cas9 切口酶與尿嘧啶 DNA 糖基化酶抑制劑組成。Cas9 切口酶用來(lái)讀取,由 gRNA 指向特定的 DNA 靶標(biāo)并將其切割,胞苷脫氨酶用來(lái)寫入,而尿嘧啶 DNA 糖基化酶抑制劑則可以通過(guò)阻斷細(xì)胞修復(fù)機(jī)制提高寫入效率。
一旦 12 堿基對(duì)的 gRNA 序列定位到靶標(biāo),編輯器模塊可以讓靶標(biāo)序列5’末端(5’末端表示 DNA 復(fù)制或轉(zhuǎn)錄的方向)附近的脫氧胞苷脫氨基,之后引入胞嘧啶-胸腺嘧啶突變,從而在 DNA 中產(chǎn)生永久記錄。也就是說(shuō),只有細(xì)胞中存在特定 DNA 序列時(shí),胞嘧啶轉(zhuǎn)換為胸腺嘧啶才會(huì)發(fā)生,那么通過(guò)測(cè)量這種突變即可得到細(xì)胞遇到的信號(hào)。
讀寫頭在誘導(dǎo)型啟動(dòng)子控制下,可以通過(guò)內(nèi)部或外部輸入控制該系統(tǒng)中的 DNA 寫入。這里讀寫頭的表達(dá)可看作是操作信號(hào),而控制 gRNA 表達(dá)的信號(hào)則是獨(dú)立可控的輸入。
研究人員還可以通過(guò)設(shè)計(jì) DOMINO 系統(tǒng)來(lái)實(shí)現(xiàn)每套輸入得到一個(gè)獨(dú)特的識(shí)別標(biāo)志,那么從這個(gè)識(shí)別標(biāo)志也能推測(cè)出原來(lái)的系統(tǒng)輸入是什么。依據(jù)研究人員的設(shè)計(jì),最終的輸出結(jié)果會(huì)激活綠色熒光蛋白表達(dá),那么通過(guò)測(cè)量綠色熒光的表達(dá)水平,即可得知細(xì)胞內(nèi)發(fā)生了多少突變,這就避免了測(cè)序破壞細(xì)胞。
通過(guò)這樣的操作,DOMINO 系統(tǒng)實(shí)現(xiàn)了超越 DNA 只能讀寫而輸出只能破壞細(xì)胞來(lái)測(cè)序讀取的做法,并且實(shí)現(xiàn)長(zhǎng)期持續(xù)記錄和監(jiān)測(cè)。
這是 Fahim Farzadfard 做的藝術(shù)圖。DOMINO 可以實(shí)現(xiàn)活細(xì)胞中 DNA 計(jì)算的各種邏輯。來(lái)源:Fahim Farzadfard
此外,DOMINO 系統(tǒng)還能夠通過(guò)分層多個(gè) DOMINO 運(yùn)算符來(lái)構(gòu)建各種形式的邏輯。具體而言,DNA 事件寫入邏輯可以與順序無(wú)關(guān),可以與順序有關(guān),也可與時(shí)間有關(guān)。還可與基于 CRISPR 的基因調(diào)控策略結(jié)合,比如 CRISPR 干擾(CRISPRi)和 CRISPR 激活(CRISPRa),實(shí)現(xiàn)模塊化和通用的儲(chǔ)存以及基因調(diào)控功能。
存儲(chǔ)器的進(jìn)化
數(shù)年前,盧冠達(dá)實(shí)驗(yàn)室開發(fā)了一種基于稱為 DNA 重組酶的記憶存儲(chǔ)系統(tǒng)。當(dāng)特定事件發(fā)生時(shí),它可以翻轉(zhuǎn) DNA 片段。然而,這種方法在規(guī)模上是有限的:它只能記錄一個(gè)或兩個(gè)事件,因?yàn)楸仨毞D(zhuǎn)的 DNA 序列非常大,并且每個(gè)都需要不同的重組酶。
之后,盧冠達(dá)和 Farzadfard 開發(fā)了一種更具針對(duì)性的方法。他們將新 DNA 序列插入基因組中的預(yù)定位置,但這種方法僅適用于細(xì)菌細(xì)胞。2016 年,他們開發(fā)了一種基于 CRISPR 的記憶存儲(chǔ)系統(tǒng),但它依賴于細(xì)胞自身的 DNA 修復(fù)機(jī)制,以便在 Cas9 切割 DNA 后產(chǎn)生突變。這意味著突變結(jié)果并不總是可預(yù)測(cè)的,因此限制了可以存儲(chǔ)的信息量。
如今,他們的 DOMINO 系統(tǒng)使用的是 CRISPR-Cas9 酶的變體,它可以產(chǎn)生更明確的突變,因?yàn)樗梢灾苯有薷暮痛鎯?chǔ) DNA 堿基中的信息,而不是切割 DNA 并等待細(xì)胞修復(fù)損傷。研究人員證明,這個(gè)系統(tǒng)可以在人體和細(xì)菌細(xì)胞中正常工作。
這個(gè)系統(tǒng)與其他使用多種蛋白質(zhì)的精確 DNA 讀寫系統(tǒng)不同,DOMINO 僅僅使用短小的 gRNA 和少量蛋白質(zhì),這會(huì)減少細(xì)胞的代謝負(fù)擔(dān)。
通過(guò)讀寫頭,DOMINO 將基因組 DNA 轉(zhuǎn)換為可尋址、可讀和寫入的介質(zhì),可以在活細(xì)胞中加工和存儲(chǔ)信息。僅僅通過(guò)改變 gRNA 序列即可構(gòu)建各種 DOMINO 操縱子,這樣該系統(tǒng)的應(yīng)用范圍就具備了極大的擴(kuò)展空間。同時(shí),由于該系統(tǒng)分辨率高,那么可以構(gòu)建多個(gè) gRNA 的操縱子。
為下一代存儲(chǔ)器鋪路
活細(xì)胞可以變成信息記錄裝置,這些記錄裝置將自身信號(hào)動(dòng)態(tài)歷史儲(chǔ)存為永久的 DNA 記錄,反過(guò)來(lái)為研究人員提供它們?cè)谧匀贿^(guò)程發(fā)展的證據(jù)。要知道,人們不僅僅需要生物反應(yīng)的快照。在生物系統(tǒng)中,許多分子事件非常短暫,因此很難在自然環(huán)境下檢測(cè)和研究。而 DNA 編輯可以用來(lái)創(chuàng)建分子記錄儀,累積下來(lái)的突變可通過(guò) DNA 測(cè)序或功能分析加以檢索,以推斷原始信息。
這些策略已經(jīng)有了。例如,通過(guò)信號(hào)-響應(yīng)啟動(dòng)子,諸如是否存在、持續(xù)時(shí)常、強(qiáng)度、時(shí)序和時(shí)間相關(guān)的生物線索(如代謝物和細(xì)胞因子)或者環(huán)境線索(如光、污染物、噬菌體或溫度變化)等記錄信息都可被寫入 DNA。
DOMINO 系統(tǒng)就是這個(gè)分子記錄儀。研究人員指出,DOMINO 系統(tǒng)提升了活細(xì)胞中進(jìn)行分子記錄和計(jì)算的能力,這就提高了監(jiān)測(cè)和控制細(xì)胞表型的能力。這些類型的復(fù)雜存儲(chǔ)器電路的應(yīng)用包括跟蹤在細(xì)胞分化時(shí)代代相傳的變化,或者創(chuàng)建可以檢測(cè)并可能治療患病細(xì)胞的傳感器。
DOMINO 中的誘導(dǎo)型啟動(dòng)子是可以替換的,那么這就帶來(lái)了各種應(yīng)用的可能。比如可以在該系統(tǒng)中記錄各種生物學(xué)信號(hào)或生理學(xué)信號(hào),如糖、重金屬如銅離子以及暗室效應(yīng),也可以記錄胃腸道炎癥的生物標(biāo)志物,如血紅素、過(guò)氧化氫和一氧化氮。
其中的一個(gè)應(yīng)用是檢測(cè)糖。將響應(yīng)乳糖的 DNA 編碼插入到細(xì)菌中,當(dāng)細(xì)菌遇到糖時(shí),DOMINO 會(huì)改變細(xì)菌的 DNA。此外,這些事件印跡會(huì)留在 DNA 里,不會(huì)隨著事件發(fā)生后而消退。
同樣,DOMINO 可以設(shè)計(jì)出檢測(cè)癌癥相關(guān)基因的路徑,也可以編程打開抗癌分子的基因,使系統(tǒng)能夠檢測(cè)和治療癌癥。
盧冠達(dá)說(shuō),本研究試圖克服以前的局限性,它使我們更接近最終愿景,即擁有強(qiáng)大、高度可擴(kuò)展和可定義的內(nèi)存系統(tǒng),這類似于硬盤驅(qū)動(dòng)器的工作方式。
研究人員認(rèn)為,該研究解決了當(dāng)前體內(nèi)記錄和計(jì)算技術(shù)的許多局限性,并為用于活細(xì)胞中的信息處理和存儲(chǔ)的下一代存儲(chǔ)器架構(gòu)鋪平了道路。
在 Farzadfard 和盧冠達(dá)于 2018 年 8 月 31 日在Science發(fā)表的綜述文章中,他們論述了這個(gè)分子記錄儀的未來(lái)。
在將來(lái),發(fā)育生物學(xué)家可以使用 DNA 記錄儀研究分化和發(fā)育途徑;癌癥生物學(xué)家可以使用這些 DNA 記錄儀來(lái)研究腫瘤發(fā)展,并深入了解腫瘤微環(huán)境中與癌癥異質(zhì)性有關(guān)的細(xì)胞和環(huán)境線索;免疫學(xué)家可以使用 DNA 記錄儀來(lái)研究免疫細(xì)胞成熟、記憶形成和免疫應(yīng)答過(guò)程中的信號(hào)轉(zhuǎn)導(dǎo);微生物學(xué)家可以利用其來(lái)研究細(xì)菌群落和生物膜內(nèi)的信號(hào)動(dòng)力學(xué)和分子相互作用。
專訪第一作者兼通訊作者 Fahim Farzadfard 博士:我們剛開始進(jìn)行細(xì)胞編程的入門
DeepTech:在這項(xiàng)研究中,DOMINO 系統(tǒng)的最大創(chuàng)新是單堿基突變,即讓胞嘧啶變成胸腺嘧啶,這也是細(xì)胞無(wú)需被破壞的關(guān)鍵,是這樣嗎?
Fahim Farzadfard:是這樣。這項(xiàng)研究工作的其他突破是,我們可以在活細(xì)胞中即時(shí)進(jìn)行讀取和寫入,這就可以讓我們實(shí)現(xiàn)多個(gè)讀取事件和寫入事件的分層,以便讓我們記錄或控制 DNA 分子事件的發(fā)生順序和發(fā)生時(shí)間。另外,DOMINO 實(shí)現(xiàn)的分子記錄規(guī)模、模塊性和魯棒性(穩(wěn)?。┮诧@著勝過(guò)此前的方法。
DeepTech:我們很想知道,你是如何找到這么巧妙的方法的?
Fahim Farzadfard:我一直致力于開發(fā) DNA 分子的信息處理和記錄技術(shù)。我開發(fā)的第一個(gè)系統(tǒng)是 SCRIBE 系統(tǒng),該系統(tǒng)于 2014 年在Science上發(fā)表,并證明了使用 DNA 書寫記錄 DNA 中的生物信息的可能性。之后,我一直試圖實(shí)現(xiàn)使用 DNA 作為生物細(xì)胞存儲(chǔ)器的最終愿景,希望它的使用類似使用計(jì)算機(jī)硬盤,而 DOMINO 是這項(xiàng)工作的繼續(xù),也是接近這一愿景的最新努力。
DeepTech:當(dāng)前的 DOMINO 系統(tǒng)還有哪些局限嗎?
Fahim Farzadfard:我們還需要在兩個(gè)方面進(jìn)行改進(jìn),即時(shí)間分辨率和并行處理方面,這會(huì)對(duì)神經(jīng)記錄這樣的應(yīng)用非常有幫助。
DeepTech:計(jì)算機(jī)是物理信號(hào)的計(jì)算過(guò)程,DNA 計(jì)算則是化學(xué)反應(yīng)過(guò)程,我們應(yīng)該如何理解基于這兩種不同反應(yīng)的計(jì)算系統(tǒng)的差異?我們應(yīng)該對(duì) DNA 計(jì)算有什么期望?
Fahim Farzadfard:與硬盤驅(qū)動(dòng)的“0”和“1”存儲(chǔ)器不同,這里我們使用遺傳編碼A、C、G、T的讀寫頭來(lái)操作 DNA 存儲(chǔ)器。
一旦有了存儲(chǔ)系統(tǒng),我們就可以根據(jù)各種形式的邏輯用于數(shù)字計(jì)算或其他形式的計(jì)算(如模擬計(jì)算)來(lái)處理存儲(chǔ)的信息,就像我們使用硬盤驅(qū)動(dòng)器和處理器來(lái)執(zhí)行復(fù)雜的硅計(jì)算一樣。
我認(rèn)為基于硅的計(jì)算機(jī)和基于 DNA 的活細(xì)胞計(jì)算機(jī)之間肯定存在差異?;罴?xì)胞中的回路反應(yīng)缺乏聯(lián)網(wǎng)區(qū)域化的相互作用,因?yàn)樗械姆磻?yīng)發(fā)生在同樣的隔斷區(qū)中。
另一個(gè)大的區(qū)別是,因?yàn)橹辽僭诋?dāng)前 DNA 計(jì)算依賴于生物化學(xué)過(guò)程,例如基因表達(dá),所以它比電子計(jì)算機(jī)的運(yùn)算要慢得多。這個(gè)限制與時(shí)間尺度有關(guān),因?yàn)樵S多生物過(guò)程如細(xì)胞信號(hào)轉(zhuǎn)導(dǎo)、分化和發(fā)育的過(guò)程是有限制的。
需要強(qiáng)調(diào)的是,在基于 DNA 的計(jì)算中,我們無(wú)法接近電子計(jì)算機(jī)的處理能力。然而,基于 DNA 的計(jì)算機(jī)提供了強(qiáng)大的與生物系統(tǒng)交互的計(jì)算工具,這是電子計(jì)算機(jī)無(wú)法實(shí)現(xiàn)的。
在這里,即使些微的計(jì)算都可能對(duì)疾病診斷和醫(yī)學(xué)應(yīng)用有非常強(qiáng)大的助推,尤其是在傳統(tǒng)技術(shù)無(wú)法實(shí)現(xiàn)的領(lǐng)域。
DeepTech:你認(rèn)為 DOMINO 系統(tǒng)在 DNA 計(jì)算發(fā)展中處于什么位置?總的來(lái)看,DNA 計(jì)算目前發(fā)展到了哪個(gè)階段?
Fahim Farzadfard:隨著 CRISPR-Cas9 和堿基編輯技術(shù)的發(fā)展,DNA 分子記錄和計(jì)算的技術(shù)也在迅速發(fā)展。如今有了 DOMINO 系統(tǒng)的幫助,我們證明了采用精確的 DNA 編輯可以實(shí)現(xiàn)各種形式的計(jì)算操作,因?yàn)椴煌耐蛔儬顟B(tài)是可以被 DNA 編輯器精確控制的。
我認(rèn)為先前的技術(shù)瓶頸在于,DNA 編輯太隨機(jī),一些突變是不可預(yù)測(cè)的,并且缺乏固有的信息讀取技術(shù)。那么這實(shí)際上就不能用于計(jì)算,因?yàn)橛?jì)算需要可預(yù)測(cè)的結(jié)果,舉個(gè)例子就是,如果事件A發(fā)生則事件B就會(huì)發(fā)生,如果事件B發(fā)生則事件C就會(huì)發(fā)生。
因此人們需要一個(gè)精確的 DNA 編輯器以及固有的信息讀取途徑。對(duì)于前者,在某個(gè)突變發(fā)生時(shí),會(huì)導(dǎo)致級(jí)聯(lián)邏輯運(yùn)算產(chǎn)生,而后者則是對(duì)于動(dòng)態(tài)讀取活細(xì)胞信息所必需的。DOMINO 系統(tǒng)正是滿足了上述要求。
我認(rèn)為 DOMINO 是在活細(xì)胞中構(gòu)建通用讀寫操作的重要一步,可將其視為一種理想的通用圖靈機(jī)。
如果我們將細(xì)胞視為生物計(jì)算機(jī),那么對(duì)這些細(xì)胞進(jìn)行穩(wěn)健編程的能力將為我們提供無(wú)與倫比的方法來(lái)研究和控制活細(xì)胞中分子事件的變化。
我想我們剛開始進(jìn)行細(xì)胞編程的入門。
Fahim Farzadfard 簡(jiǎn)介
Fahim Farzadfard,生于伊朗,畢業(yè)于德黑蘭大學(xué)生物技術(shù)專業(yè),并在麻省理工學(xué)院獲得博士學(xué)位。博士期間,他為活細(xì)胞的分子記錄和計(jì)算開發(fā)了多個(gè)基礎(chǔ)平臺(tái), 他引入了基于 DNA 分子記錄和模擬儲(chǔ)存的概念,并發(fā)明了一個(gè)模塊化和可擴(kuò)展的平臺(tái) SCRIBE(Synthetic Cellular Recorders Integrating Biological Events),后者可用于將信號(hào)動(dòng)態(tài)記錄到細(xì)胞自身的基因組 DNA 中。
作為施密特科學(xué)博士后研究員,F(xiàn)ahim Farzadfard 同時(shí)在哈佛大學(xué) George Church 和麻省理工學(xué)院 Ed Boynton 兩個(gè)實(shí)驗(yàn)室工作,他的目標(biāo)是進(jìn)一步推進(jìn)分子記錄技術(shù)并將其應(yīng)用于大腦研究。