偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

PyTorch開發(fā)新藥?哈佛出品,10行代碼訓(xùn)練“藥神”模型

新聞 前端
最近,來(lái)自哈佛大學(xué)等機(jī)構(gòu)的研究人員,開發(fā)出了一個(gè)AI“藥神”工具包,為加速新冠疫情下的新藥研發(fā)助力。

 本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

最近,來(lái)自哈佛大學(xué)等機(jī)構(gòu)的研究人員,開發(fā)出了一個(gè)AI“藥神”工具包,為加速新冠疫情下的新藥研發(fā)助力。

這款名為DeepPurpose的工具包,不僅包含COVID-19的生物測(cè)定數(shù)據(jù)集,還有56種前沿的AI模型。

作為一個(gè)基于PyTorch的工具包,DeepPurpose只需要不到10行代碼,就能訓(xùn)練出AI“藥神”模型。

[[340079]]

這些模型不僅能完成虛擬篩選,還能挖掘出已有藥物的新功能(例如,高血壓藥物可治療阿爾茲海默癥)。

下面來(lái)看看它實(shí)現(xiàn)的原理。

56種前沿模型,功能齊全

DeepPurpose由兩個(gè)編碼器組成,分別用來(lái)生成藥物分子和蛋白質(zhì)的嵌入(Embedding),也就是深度學(xué)習(xí)過(guò)程中的映射。

隨后,將這兩個(gè)編碼器串聯(lián)到解碼器中,用于預(yù)測(cè)二者的結(jié)合親和力,如下圖所示。

PyTorch開發(fā)新藥?哈佛出品,10行代碼訓(xùn)練“藥神”模型

在這期間,模型的輸入是藥物靶標(biāo)對(duì)(drug-target pair),輸出則是指示藥物-靶對(duì)的結(jié)合活性的分?jǐn)?shù)。

當(dāng)然,DeepPurpose畢竟是一個(gè)工具包,所以無(wú)論是藥物分子、還是蛋白質(zhì),它們的編碼器都不止一種類型

對(duì)于藥物分子,DeepPurpose提供了8種編碼器

在這些編碼器中,有用于構(gòu)造分子結(jié)構(gòu)圖的、有將繪制的分子轉(zhuǎn)換成二進(jìn)制數(shù)的、也有用于獲取序列順序信息的等……模型各有不同。

而對(duì)于靶蛋白,DeepPurpose也提供了7種編碼器,相較于藥物的化學(xué)和信息學(xué), 編碼器對(duì)靶蛋白的轉(zhuǎn)換更多地側(cè)重于生物學(xué)信息。

也就是說(shuō),DeepPurpose一共能提供7*8=56種模型,其中許多模型非常新穎前沿,值得入手。

那么,DeepPurpose究竟該怎么上手呢?

10步以內(nèi),上手AI“藥神”

事實(shí)上,訓(xùn)練一個(gè)新藥研發(fā)模型,需要通過(guò)以下幾個(gè)步驟,每一步都只需要用1行代碼實(shí)現(xiàn),所有這些步驟加起來(lái),也不超過(guò)10步

來(lái)看看這個(gè)模型要經(jīng)過(guò)的步驟:

1、數(shù)據(jù)加載
2、指定編碼器
3、分割數(shù)據(jù)集、編碼
4、生成模型配置文件
5、初始化模型
6、訓(xùn)練模型
7、舊藥新用/虛擬篩選
8、模型保存/加載

其中,DeepPurpose最關(guān)鍵的兩個(gè)功能,舊藥新用虛擬篩選可以在訓(xùn)練后實(shí)現(xiàn)??梢钥匆姡珼eepPurpose會(huì)自動(dòng)生成藥物的親和度,并由低到高進(jìn)行排序。

PyTorch開發(fā)新藥?哈佛出品,10行代碼訓(xùn)練“藥神”模型

這樣,就能快速縮小高通量分子的篩選范圍(如果親和度為0,那真的不必考慮了)。

至于虛擬篩選,也是類似的工作,會(huì)生成一個(gè)與上圖相似的排名列表。

不僅如此,這個(gè)AI模型還包含另外幾種案例,例如SARS-CoV2 3CLPro的舊藥新用方法、預(yù)訓(xùn)練模型等。

此外,針對(duì)近期引發(fā)關(guān)注的新冠疫情,DeepPurpose也包含了MIT收集的COVID-19開源數(shù)據(jù)集

針對(duì)這些數(shù)據(jù),工具包中有相應(yīng)的函數(shù),可以直接引用。

PyTorch開發(fā)新藥?哈佛出品,10行代碼訓(xùn)練“藥神”模型

而這個(gè)工具包的框架,正是基于藥物研發(fā)的原理制作的。

靶蛋白:藥物作用對(duì)象

藥物篩選最根本的原理,通常是判斷藥物分子與靶蛋白(藥物作用的目標(biāo))的親和性。

為什么是蛋白質(zhì)?

事實(shí)上,這是因?yàn)椴糠旨膊。ɡ绨┌Y、腫瘤)產(chǎn)生的原因,通常與某一類蛋白質(zhì)有關(guān),如果能找到、并用藥物“調(diào)節(jié)”這種蛋白質(zhì),就能治愈疾病。

PyTorch開發(fā)新藥?哈佛出品,10行代碼訓(xùn)練“藥神”模型

 圖片來(lái)源于flickr

例如,細(xì)胞與細(xì)胞之間的交流,依靠的就是細(xì)胞膜上的糖蛋白。而某種疾病發(fā)生的原因,可能就是因?yàn)橐活惣?xì)胞上的糖蛋白過(guò)度表達(dá)。

而這個(gè)糖蛋白,就被稱之為疾病過(guò)程中的靶蛋白。

但能用來(lái)調(diào)節(jié)某種靶蛋白的藥物,并不好找,畢竟不是每種化合物都能很好地與靶蛋白“貼貼”。

在這樣的基礎(chǔ)上,研究人員開發(fā)了DeepPurpose,這個(gè)工具包能用于預(yù)測(cè)藥物分子與靶蛋白的親和度,專業(yè)學(xué)術(shù)名詞叫藥物-靶標(biāo)相互作用(Drug-Target Interaction, DTI),簡(jiǎn)稱DTI。

之所以選擇用AI助力新藥研發(fā),也有其背后的原因。

AI助新藥研發(fā)一臂之力

事實(shí)上,藥廠研發(fā)出一種新藥,需要15年左右,甚至更久。

[[340081]]

而在這期間,光是研究開發(fā)的階段,就要花掉2-10年。

研究開發(fā)的階段,目的是篩選出有治療潛力的新化合物,也就是說(shuō),每一種化合物都需要做實(shí)驗(yàn),去不斷試錯(cuò)。

這一過(guò)程不僅枯燥無(wú)味,而且工程量巨大,人力財(cái)力都得砸。

如果用AI完成藥物篩選這一過(guò)程,對(duì)于新藥研發(fā)的加速將會(huì)起到不小的作用。

作者介紹

[[340082]]

論文的第一作者黃柯鑫,本科于紐約大學(xué)獲得數(shù)學(xué)和計(jì)算機(jī)雙學(xué)位,目前在哈佛大學(xué)讀碩士,專業(yè)與醫(yī)療大數(shù)據(jù)有關(guān)。

黃柯鑫的研究方向,主要是圖神經(jīng)網(wǎng)絡(luò)(GNN)在新藥研發(fā)和醫(yī)療文本(如電子病歷等)上的應(yīng)用。

此外,Tianfan Fu、Lucas Glass、Marinka Zitnik、Cao Xiao和Jimeng Sun也共同參與了研究工作。

傳送門

論文鏈接:
https://arxiv.org/abs/2004.08919

項(xiàng)目鏈接:
https://github.com/kexinhuang12345/DeepPurpose

黃柯鑫主頁(yè):
https://www.kexinhuang.com/

 

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2024-11-27 14:30:00

模型訓(xùn)練

2018-07-09 14:21:29

Python電影數(shù)據(jù)

2023-10-23 09:56:00

2023-11-10 09:41:44

Python代碼

2020-07-13 14:30:35

人工智能機(jī)器學(xué)習(xí)技術(shù)

2021-03-25 15:19:33

深度學(xué)習(xí)Pytorch技巧

2025-06-16 03:00:00

2021-05-11 20:46:17

Python代碼分類

2018-07-13 15:36:52

2024-07-25 08:25:35

2023-02-19 15:26:51

深度學(xué)習(xí)數(shù)據(jù)集

2024-09-26 00:11:01

2018-07-16 16:39:00

數(shù)據(jù)

2023-12-11 15:40:32

PyTorch代碼大模型

2020-10-30 08:00:00

PyTorch機(jī)器學(xué)習(xí)人工智能

2025-04-02 09:00:00

模型開源AI

2023-05-16 13:54:00

模型AI

2023-08-14 07:42:01

模型訓(xùn)練

2024-04-09 15:22:24

2019-10-15 14:04:29

技術(shù)人工智能框架
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)