偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI可以改寫人類基因組嗎?首次由AI從頭設計的基因編輯器成功編輯人類細胞中DNA

人工智能 新聞
近日,美國 AI 蛋白質設計初創(chuàng)公司 Profluence 推出了 OpenCRISPRTM 計劃,發(fā)布了世界上第一個開源的 AI 生成的基因編輯器。

生成式 AI 可以對話、寫詩、畫圖、做視頻、作曲、寫代碼......

那么,AI 可以改寫人類基因組嗎?

現(xiàn)在,新的 AI 技術正在為可編輯 DNA 的微觀生物機制繪制藍圖,這預示著未來科學家將以更高的精度和速度對抗疾病。

近日,美國 AI 蛋白質設計初創(chuàng)公司 Profluence 推出了 OpenCRISPRTM 計劃,發(fā)布了世界上第一個開源的 AI 生成的基因編輯器。

Profluence 展示了通過 AI 從頭開始設計的可定制基因編輯器,對人類基因組的首次成功精確編輯。

該技術基于驅動 ChatGPT 的相同方法。正如 ChatGPT 通過分析維基百科文章、書籍和聊天記錄來學習生成語言一樣,Profluent 的技術在分析大量生物數(shù)據(jù),包括科學家已經用來編輯人類 DNA 的微觀機制,然后創(chuàng)建了新的基因編輯器。

相關研究以「Design of highly functional genome editors by modeling the universe of CRISPR-Cas sequences」為題,于 2024 年 4 月 22 日發(fā)布在預印平臺 bioRxiv 上。

圖片

論文鏈接:https://doi.org/10.1101/2024.04.22.590591

OpenCRISPR-1 是一款 AI 創(chuàng)建的基因編輯器,由類似 Cas9 的蛋白質和引導 RNA 組成,完全使用 Profluence 的大語言模型 (LLM) 開發(fā)。

通過 OpenCRISPR 的訓練過程,該公司的 AI 從大規(guī)模序列和生物背景中學習,生成數(shù)百萬種自然界中不存在的多種 CRISPR 類蛋白質,從而以指數(shù)方式擴展了幾乎所有已知的 CRISPR 家族。

圖片

OpenCRISPR-1 的結構分析。

為了實現(xiàn)技術民主化,Profluence 推出了 OpenCRISPR-1 作為初始開源版本,使 AI 設計的基因編輯器可以免費獲得倫理研究和商業(yè)用途的許可。

Profluence 聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Ali Madani 表示:


「嘗試用 AI 設計的生物系統(tǒng)編輯人類 DNA 是一項科學登月計劃。我們的成功預示著未來,AI 可以精確設計所需的內容,來創(chuàng)造一系列定制的疾病療法。為了刺激基因編輯領域的創(chuàng)新和民主化,以推動未來向前發(fā)展,我們正在開源該計劃的產品?!?/p>


探索全部蛋白序列變異,AI 只需幾小時

到目前為止,蛋白質工程界通常依靠基于發(fā)現(xiàn)的方法來從自然界復制功能性蛋白質,或通過稱為定向進化的過程進行迭代修改。許多轉化蛋白都是偶然發(fā)現(xiàn)的。

CRISPR-Cas9 基因編輯系統(tǒng)的核心組成部分是 Cas9 蛋白,它是一種 RNA 引導的核酸酶,可以搜索人類基因組中的全部 30 億個核苷酸,并僅在一個特定位點進行切割。

這種核酸酶與單向導 RNA(sgRNA)結合在一起,sgRNA 由一個支架組成,它在結構上與蛋白質相互作用,間隔序列可以被編程為靶向基因組中的任何位置。

圖片

CRISPR-Cas 圖譜的形成。

鑒于大多數(shù) Cas9 蛋白的長度超過 1000 個氨基酸,總體設計空間包含 20^1000 個可能的序列,這比可觀測宇宙中的原子數(shù)量多幾個數(shù)量級。然而,由于這些蛋白質必須以精確的順序協(xié)調許多相互作用才能實現(xiàn)精確切割,因此即使是單個錯誤的突變也可以完全破壞蛋白質功能。

通過實驗探索所有可能的序列變異需要很多很多的時間,但在幾個小時內,AI 系統(tǒng)就可以在這個搜索空間中導航從而發(fā)現(xiàn)功能性基因編輯器。

語言模型生成多種 CRISPR-Cas 蛋白

生成蛋白質語言模型通常是在涵蓋廣泛功能的大型、多樣化的天然蛋白質序列數(shù)據(jù)集上進行預訓練的。它們可以生成反映天然蛋白質特性的真實蛋白質序列。然而,對于特定的應用,例如新型基因編輯器的生成,我們需要引導生成特定的感興趣的蛋白質家族。

為此,Profluence  的研究團隊進行了詳盡的數(shù)據(jù)挖掘,來構建迄今為止最廣泛的 CRISPR 系統(tǒng)數(shù)據(jù)集。將此資源稱為 CRISPR-Cas Atlas。

總而言之,研究發(fā)現(xiàn)了 510 萬個 CRISPR-Cas 蛋白,將這些系統(tǒng)的已知自然多樣性總體擴展了 2.7 倍,特別是 Cas9 擴展了 4.1 倍。

為了生成新型 CRISPR-Cas 蛋白質,研究人員在 CRISPR-Cas Atlas 上訓練了蛋白質語言模型。從這個模型中生成了 400 萬個序列,并使用生物信息學技術去除簡并序列并鑒定每個生成的蛋白質屬于哪個 CRISPR-Cas 家族。與 CRISPR-Cas Atlas 中發(fā)現(xiàn)的天然蛋白質相比,這組過濾后的生成序列的多樣性擴大了 4.8 倍。

圖片

通過蛋白質簇的數(shù)量來衡量,生成的序列極大地擴展了 CRISPR 相關蛋白質家族的多樣性。

生成的基因編輯器在人類細胞中發(fā)揮作用

研究人員進一步將注意力集中在 CRISPR-Cas9 系統(tǒng)上,并根據(jù) CRISPR-Cas 圖譜中的 238,917 個 Cas9 蛋白訓練了蛋白質語言模型。

鑒于 SpCas9 的廣泛采用和臨床成功,使用模型來生成可與 SpCas9 互操作的 Cas9 類蛋白。換句話說,它們結合基因組的相同部分(PAM)并與相同的 sgRNA 兼容;因此,它們可用于相同的應用程序。

然后,從這些生成的序列中選擇了 48 個,用于對人類細胞進行嚴格的功能表征。OpenCRISPR-1 在靶標位點上的活性與 SpCas9 相當(OpenCRISPR-1 的編輯為 55.7%,SpCas9 的編輯為 48.3%),但令人驚訝的是,脫靶位點的編輯減少了 95%(OpenCRISPR-1 的編輯率為 0.32%,而 SpCas9 的編輯率為 6.1%)。

此外,OpenCRISPR-1 是一種高度新穎的蛋白質:它距離 SpCas9 有 403 個突變,距離 CRISPR-Cas 圖譜中的任何天然蛋白質有 182 個突變。

圖片

多種生成的核酸酶(綠色),包括 OpenCRISPR-1(深綠色),具有與 SpCas9(藍色)相當或更高的在靶活性,但脫靶活性低得多。

接下來,研究證明,當與脫氨酶配對時,OpenCRISPR-1 和 SpCas9 在精確編輯靶標基因組中的單個堿基時具有相似的活性和特異性。此外,能夠通過使用另一個經過 Profluence 訓練的蛋白質語言模型生成的脫氨酶來保持堿基編輯活性,同時提高特異性。

圖片

當使用 ABE8.20(一種高活性工程脫氨酶)以及研究生成的脫氨酶 PF-DEAM-1 和 PF-DEAM-2 進行堿基編輯時,OpenCRISPR-1 的功能與 SpCas9 非常相似。

最后,為了進一步優(yōu)化生成的核酸酶的活性,研究人員還訓練了一個模型來為任何給定的 Cas9 類蛋白生成兼容的 sgRNA。與 SpCas9 的 sgRNA 相比,這些生成的 sgRNA 可以提高所測試的 5 種蛋白質中的 4 種生成的核酸酶的活性。

圖片

對于測試的 5 種生成的核酸酶中的 4 種,使用模型生成的 sgRNA 提高了編輯效率。

OpenCRISPR-1 只是冰山一角

研究展示了世界上首次使用基因編輯系統(tǒng)成功編輯人類基因組,其中每個組件都完全由 AI 設計。

此外,平臺能夠隨意生成更多的基因編輯系統(tǒng);OpenCRISPR-1 只是冰山一角。

團隊公開發(fā)布了 OpenCRISPR-1,促進在研究和商業(yè)應用中廣泛、合乎道德的使用。在向更廣泛的社區(qū)提供這種分子的過程中,研究人員希望降低基于 CRISPR 的技術的治療、農業(yè)和科學應用的成本和進入門檻。

Profluence 副總裁兼基因編輯主管 Peter Cameron 表示:「這是一個分水嶺,也是我們希望在著手構建下一代基因藥物時迭代過程的開始。我們鼓勵基因編輯社區(qū)對 OpenCRISPR-1 進行壓力測試。如果有可以針對特定應用進行改進的特定功能,我們想知道,并可以合作優(yōu)化這些特性。」

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-04-24 13:36:40

2022-04-20 14:35:59

區(qū)塊鏈生物技術NFT

2023-09-20 12:58:00

訓練研究

2020-06-10 10:32:10

人工智能技術編輯

2022-02-24 13:54:12

機器學習基因研究

2022-04-15 11:58:20

數(shù)字孿生醫(yī)療組織智慧醫(yī)療

2012-09-11 11:29:22

大數(shù)據(jù)云計算

2014-12-10 10:01:41

2016-10-09 12:01:33

中安比特

2025-03-31 09:30:00

數(shù)據(jù)訓練模型

2023-11-08 11:00:56

Graphite開源

2014-03-26 09:06:27

Google大數(shù)據(jù)

2024-11-19 13:13:54

2017-10-25 09:52:07

2023-08-10 08:38:57

Project IDFlutter谷歌

2022-02-18 09:53:17

AI芯片設計

2025-06-27 08:45:31

2021-10-19 09:21:08

AI人類工具

2024-04-22 07:00:00

AI駕駛

2021-04-01 15:42:24

AI 數(shù)據(jù)人工智能
點贊
收藏

51CTO技術棧公眾號