偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

全球首創(chuàng) :分子之心開源新AI算法,攻克蛋白質(zhì)側(cè)鏈預(yù)測與序列設(shè)計難題

人工智能 新聞
PSCP 深度架構(gòu) AttnPacker——大幅優(yōu)化的AI算法。

蛋白質(zhì)結(jié)構(gòu)和功能的形成,很大程度上取決于側(cè)鏈原子間的相互作用,因此,精準(zhǔn)的蛋白質(zhì)側(cè)鏈預(yù)測(PSCP)是解決蛋白質(zhì)結(jié)構(gòu)預(yù)測和蛋白質(zhì)設(shè)計難題的關(guān)鍵一環(huán)。但此前蛋白質(zhì)結(jié)構(gòu)預(yù)測大多聚焦于主鏈結(jié)構(gòu),側(cè)鏈結(jié)構(gòu)預(yù)測始終是一個未被完全解決的難題。

近日,分子之心許錦波團(tuán)隊推出一種新的 PSCP 深度架構(gòu) AttnPacker,在速度、內(nèi)存效率和整體精度方面取得大幅提升,是目前已知的最優(yōu)側(cè)鏈結(jié)構(gòu)預(yù)測算法,也是全球首創(chuàng)的可同時進(jìn)行蛋白質(zhì)側(cè)鏈預(yù)測和序列設(shè)計的 AI 算法。

論文發(fā)表在《美國科學(xué)院院刊》(PNAS)上,其預(yù)訓(xùn)練模型、源代碼和推理腳本都已在 Github 上開源。

圖片

  • 論文鏈接:https://www.pnas.org/doi/10.1073/pnas.2216438120#supplementary-materials
  • 開源鏈接:https://github.com/MattMcPartlon/AttnPacker

背景

蛋白質(zhì)由數(shù)個氨基酸折疊而成,其結(jié)構(gòu)分為主鏈和側(cè)鏈。側(cè)鏈的差異性對蛋白質(zhì)的結(jié)構(gòu)與功能有巨大影響,尤其是生物活性?;趯?cè)鏈結(jié)構(gòu)的清晰認(rèn)知,科學(xué)家們能夠更精準(zhǔn)地測定蛋白質(zhì)三維結(jié)構(gòu),解析蛋白質(zhì) - 蛋白質(zhì)之間的相互作用,并進(jìn)行理性蛋白設(shè)計。應(yīng)用到藥物設(shè)計領(lǐng)域,科學(xué)家們便能更快、更準(zhǔn)確地找到適合藥物與受體的結(jié)合點(diǎn)位,甚至根據(jù)需要優(yōu)化或設(shè)計結(jié)合點(diǎn)位;在酶優(yōu)化領(lǐng)域,科學(xué)家們可以通過對序列的優(yōu)化改造,讓多個側(cè)鏈參與催化反應(yīng),實現(xiàn)更高效、特異性更高的催化效果。

當(dāng)前大多數(shù)蛋白質(zhì)結(jié)構(gòu)預(yù)測算法主要針對主鏈的結(jié)構(gòu)解析,但蛋白質(zhì)側(cè)鏈結(jié)構(gòu)預(yù)測還是一個未被完全突破的難題。無論是 AlphaFold2 等熱門蛋白質(zhì)結(jié)構(gòu)預(yù)測算法,還是 DLPacker、RosettaPacker 等專注側(cè)鏈結(jié)構(gòu)預(yù)測的算法,準(zhǔn)確度或速度都不盡如人意。這也為蛋白質(zhì)設(shè)計帶來了限制。

傳統(tǒng)方法,如 RosettaPacker,主要使用能量優(yōu)化方法,先對側(cè)鏈原子的分布進(jìn)行分組,再針對某個特定氨基酸來搜索側(cè)鏈的分組,尋找能量最小的組合。這些方法主要區(qū)別于研究者對旋轉(zhuǎn)異構(gòu)體文庫、能量函數(shù)和能量最小化程序的選擇,準(zhǔn)確性受限于對搜索啟發(fā)式方法和離散抽樣程序的使用。業(yè)界也有基于深度學(xué)習(xí)的側(cè)鏈預(yù)測方法,如 DLPacker,它將 PSCP 表述為圖像到圖像的轉(zhuǎn)換問題,并采用了 U-net 模型結(jié)構(gòu)。但預(yù)測精度和速度依然不夠理想。

方法

AttnPacker 是一種端到端的預(yù)測蛋白質(zhì)側(cè)鏈坐標(biāo)的深度學(xué)習(xí)方法。它聯(lián)合模擬了側(cè)鏈相互作用,直接預(yù)測的側(cè)鏈結(jié)構(gòu)在物理上更可行,具有更少的原子碰撞和更理想的鍵長和角度。

具體而言,AttnPacker 引入了一種利用 PSCP 的幾何和關(guān)系方面的深度圖轉(zhuǎn)換器架構(gòu)。受 AlphaFold2 啟發(fā),分子之心提出了位置感知三角形更新,以使用基于圖形的框架來計算三角形注意力和乘法更新,從而優(yōu)化成對特征。通過這種方法,AttnPacker 的內(nèi)存顯著減少并擁有更高容量的模型。此外,分子之心探索了幾種 SE (3) 等變注意力機(jī)制,并提出了一種用于從 3D 點(diǎn)學(xué)習(xí)的等變變換器架構(gòu)。

圖片

AttnPacker 運(yùn)行流程。以蛋白質(zhì)主鏈坐標(biāo)和序列作為輸入,并基于坐標(biāo)信息導(dǎo)出空間特征圖和等變基。特征圖由不變量 graph-transformer 模塊處理,然后傳遞給一個等變的 TFN-Transformer 輸出預(yù)測的側(cè)鏈坐標(biāo)、每個殘基的置信度分?jǐn)?shù)和可選的設(shè)計序列。預(yù)測坐標(biāo)經(jīng)過后處理,以去除所有空間沖突,并確保理想化的幾何結(jié)構(gòu)。

效果

在預(yù)測效果上,AttnPacker 對天然和非天然主鏈結(jié)構(gòu)都顯示出準(zhǔn)確性和效率上的改進(jìn)。同時保證了物理上的可行性,與理想鍵長和角度的偏差可以忽略不計,且產(chǎn)生了最小的原子空間位阻。

分子之心在 CASP13 和 CASP14 天然和非天然蛋白質(zhì)主鏈數(shù)據(jù)集上對 AttnPacker 與目前最先進(jìn)的方法 ——SCWRL4、FASPR、RosettaPacker 和 DLPacker 進(jìn)行對比測試。結(jié)果顯示,AttnPacker 在 CASP13 和 CASP14 天然主鏈上顯著優(yōu)于傳統(tǒng)蛋白質(zhì)側(cè)鏈預(yù)測方法,平均重建 RMSD 比每個測試集上的次優(yōu)方法低 18% 以上。AttnPacker 還超越了深度學(xué)習(xí)方法 DLPacker,平均 RMSD 降低了 11% 以上,同時也顯著提高了側(cè)鏈二面角精度。除了準(zhǔn)確性,AttnPacker 的原子碰撞明顯少于其他方法。

圖片

給出天然主鏈結(jié)構(gòu)時,各算法在 CASP13 和 CASP14 目標(biāo)蛋白上的側(cè)鏈結(jié)構(gòu)預(yù)測結(jié)果。星號表示平均沖突值低于天然結(jié)構(gòu) ——CASP13 為 56.0、5.9 和 0.4,CASP14 為 80.4、7.9 和 2.5。

在 CASP13 和 CASP14 非天然主鏈上,AttnPacker 也明顯優(yōu)于其他方法,原子碰撞也明顯少于其他方法。

圖片

給出非天然主鏈結(jié)構(gòu)時,各算法在 CASP13 和 CASP14 目標(biāo)蛋白上的側(cè)鏈結(jié)構(gòu)預(yù)測結(jié)果。星號表示平均沖突值低于相應(yīng)天然結(jié)構(gòu) ——CASP13 的 34.6、2.2、0.5 和 CASP14 的 40.0、2.7、0.7。

創(chuàng)新性地擯棄了離散的旋轉(zhuǎn)異構(gòu)體庫以及計算上昂貴的構(gòu)象搜索和采樣步驟,直接結(jié)合主鏈 3D 幾何結(jié)構(gòu)來并行計算所有側(cè)鏈坐標(biāo)。AttnPacker 與基于深度學(xué)習(xí)的方法 DLPacker、基于傳統(tǒng)計算方法的 RosettaPacker 相比,計算效率顯著提高,減少了 100 倍以上的推理時間。

不同 PSCP 方法的時間比較。重建所有 83 個 CASP13 目標(biāo)蛋白的側(cè)鏈原子的相對時間。

AttnPacker 在蛋白質(zhì)設(shè)計上的表現(xiàn)同樣優(yōu)秀。分子之心訓(xùn)練了一個 AttnPacker 變體用以協(xié)同設(shè)計,該變體可實現(xiàn)媲美當(dāng)下最先進(jìn)的方法的天然序列恢復(fù)率,同時還可生產(chǎn)高度精確的組裝。Rosetta 模擬驗證顯示,AttnPacker 設(shè)計的結(jié)構(gòu)通常會產(chǎn)生亞原生(更低的)Rosetta 能量。

圖片

用 ESMFold scTM 和 plDDT 指標(biāo)對比天然蛋白質(zhì)序列和 AttnPacker 生成的序列,以評估 AttnPacker 的生成質(zhì)量,結(jié)果表現(xiàn)出強(qiáng)相關(guān)性。

除了效果和效率驚人之外,AttnPaker 還有一個非常實用的價值 —— 它非常易用。AttnPaker 只需要一個蛋白質(zhì)的結(jié)構(gòu)文件即可運(yùn)行。相比之下,OPUS-Rota4 (28) 需要來自 DLPacker 的原子環(huán)境的體素表示、來自 trRosetta100 的邏輯、二級結(jié)構(gòu)和來自 OPUS-CM 輸出的約束文件。另外,由于 AttnPacker 直接預(yù)測側(cè)鏈坐標(biāo),輸出是完全可微分的,這有利于下游預(yù)測任務(wù),例如優(yōu)化或蛋白質(zhì) - 蛋白質(zhì)相互作用?!邦A(yù)測效果好、效率高、易用,這些優(yōu)勢有利于 AttnPacker 在研究和工業(yè)領(lǐng)域的廣泛使用。” 許錦波教授表示。

總結(jié)

1、AttnPacker 是一個用于直接預(yù)測序列和側(cè)鏈坐標(biāo)的 SE(3)等變模型,可以用于蛋白質(zhì)側(cè)鏈結(jié)構(gòu)預(yù)測,也可用于蛋白質(zhì)序列設(shè)計,是一項開創(chuàng)性的工作。

2、AttnPacker 的準(zhǔn)確性優(yōu)于其他方法,且效率大幅提升,并具備極高的易用性。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2023-07-17 10:34:57

模型性能

2023-07-06 16:59:56

英特爾

2023-07-06 13:23:49

2021-07-24 10:21:46

模型人工智能深度學(xué)習(xí)

2025-07-14 16:59:06

AI蛋白質(zhì)模型

2023-03-03 14:00:00

模型深度學(xué)習(xí)

2023-12-20 14:11:55

人工智能

2024-01-09 17:07:54

AI藥物設(shè)計醫(yī)療保健

2021-12-20 10:07:35

AI 數(shù)據(jù)人工智能

2023-09-20 12:44:00

AI訓(xùn)練

2023-10-04 09:23:21

微軟開發(fā)

2020-12-01 10:53:42

AI 數(shù)據(jù)人工智能

2021-11-22 09:39:21

深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)人工智能

2021-09-09 17:57:04

AI

2022-11-02 13:41:46

2024-02-22 09:55:23

AI技術(shù)

2024-09-09 08:10:00

2022-10-08 12:38:23

模型開源

2022-02-14 00:04:24

AI蛋白質(zhì)結(jié)構(gòu)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號