偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

新聞 人工智能
最近,來(lái)自哈佛醫(yī)學(xué)院和牛津大學(xué)的科學(xué)家合作開發(fā)了一種AI模型,成功預(yù)測(cè)了3219個(gè)疾病基因中超過(guò)3600萬(wàn)個(gè)變體的致病性,并將超過(guò)25萬(wàn)個(gè)未知變體進(jìn)行了歸類。

[[432059]]

 本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。

直接從基因?qū)用骖A(yù)測(cè)疾病,這一直是近現(xiàn)代醫(yī)學(xué)研究的主要方向之一。

然而,全體人類的基因變異體數(shù)量遠(yuǎn)超現(xiàn)有的探測(cè)技術(shù),甚至僅僅是不同個(gè)體的蛋白質(zhì)區(qū)編碼也會(huì)展現(xiàn)出巨大的差異性。

因此,超過(guò)98%的基因變異給人體帶來(lái)的影響依舊是未知且無(wú)法預(yù)測(cè)的。

但最近,來(lái)自哈佛醫(yī)學(xué)院和牛津大學(xué)的科學(xué)家合作開發(fā)了一種AI模型,成功預(yù)測(cè)了3219個(gè)疾病基因中超過(guò)3600萬(wàn)個(gè)變體的致病性,并將超過(guò)25萬(wàn)個(gè)未知變體進(jìn)行了歸類。

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

這項(xiàng)研究現(xiàn)已登上Nature。

“從進(jìn)化中預(yù)測(cè)致病性”

其實(shí),現(xiàn)在臨床上已有用于預(yù)測(cè)基因變異影響的模型。

但這些模型往往是在經(jīng)過(guò)標(biāo)注的臨床數(shù)據(jù)集上進(jìn)行有監(jiān)督學(xué)習(xí),一旦進(jìn)入現(xiàn)實(shí)場(chǎng)景,標(biāo)簽偏差、標(biāo)簽稀疏以及噪音就會(huì)造成其準(zhǔn)確率的下降,并不能作為基因變異體分類的可靠依據(jù)。

而這次的研究團(tuán)隊(duì)提出了一個(gè)叫做EVE(Evolutionary model of Variant Effect)的模型。

這是一個(gè)僅根據(jù)進(jìn)化序列訓(xùn)練的無(wú)監(jiān)督生成模型。

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

模型預(yù)測(cè)變異基因的致病性主要分為兩步:

第一步,使用變型自動(dòng)編碼器VAE來(lái)學(xué)習(xí)蛋白質(zhì)的氨基酸序列分布。

學(xué)習(xí)了多個(gè)領(lǐng)域的復(fù)雜高維分布之后,模型就捕捉到了進(jìn)化過(guò)程中的自然序列約束,包括各種位置之間的復(fù)雜依賴關(guān)系。

再?gòu)牡玫降慕坪篁?yàn)分布(Approximate Posterior Distribution)中取樣,評(píng)估每個(gè)單一氨基酸變體相對(duì)于野生型的相對(duì)可能性。

這種相對(duì)可能性被稱為“進(jìn)化指數(shù)”,與臨床標(biāo)簽進(jìn)行比較后發(fā)現(xiàn),區(qū)分致病性和良性標(biāo)簽的數(shù)值在不同的蛋白質(zhì)中是一致的,這說(shuō)明無(wú)監(jiān)督的方法能夠有效推斷致病性。

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

第二步,在所有單一氨基酸變體的進(jìn)化指數(shù)分布上擬合了一個(gè)雙組分(two-component)的全局-局部高斯混合模型。

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

這一步的輸出是在區(qū)間[0,1]內(nèi)定義的連續(xù)致病性值,0代表良性,1代表致病性。

然后將EVE模型運(yùn)用于ClinVar數(shù)據(jù)庫(kù)中的3219個(gè)人類基因上,得到的結(jié)果圖中的平均曲線面積(AUC)為0.91,說(shuō)明EVE模型對(duì)絕大多數(shù)的基因變異都能做到具有臨床意義的預(yù)測(cè):

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

優(yōu)于已知模型,與實(shí)驗(yàn)預(yù)測(cè)效果一致

研究團(tuán)隊(duì)也將EVE模型與已知的模型進(jìn)行了對(duì)比,可以看到,在預(yù)先確定已知的已標(biāo)注臨床數(shù)據(jù)的預(yù)測(cè)上,其效果優(yōu)于同類計(jì)算模型:

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

那么這樣一個(gè)AI計(jì)算模型與用于預(yù)測(cè)致病性的經(jīng)典方法——深度突變掃描實(shí)驗(yàn)(Deep Mutational Scan Experiment)相比效果又如何呢?

對(duì)比實(shí)驗(yàn)后可以看到,EVE模型在臨床預(yù)測(cè)方面的總體表現(xiàn)與經(jīng)典方法效果基本一致

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

而當(dāng)從ClinVar數(shù)據(jù)庫(kù)中選擇一組數(shù)量規(guī)模更大,但高質(zhì)量標(biāo)注較小的數(shù)據(jù)時(shí),EVE模型的表現(xiàn)甚至更好

Nature:哈佛&牛津開發(fā)最新AI模型,已預(yù)測(cè)3600萬(wàn)個(gè)致命基因突變

哈佛&牛津合作出品

這篇論文有三位共同一作,其中Jonathan Frazer和Mafalda Dias都來(lái)自哈佛大學(xué)的系統(tǒng)生物學(xué),他們同時(shí)也是Marks Group實(shí)驗(yàn)室中的一員。

[[432060]]
[[432061]]

而Pascal Notin則是來(lái)自牛津大學(xué)的計(jì)算機(jī)科學(xué)專業(yè)的博士生,主要研究領(lǐng)域包括貝葉斯深度學(xué)習(xí)、生成模型、因果推理和計(jì)算生物學(xué)的交叉領(lǐng)域。

[[432062]]

論文鏈接:
https://www.nature.com/articles/s41586-021-04043-8

 

 

責(zé)任編輯:張燕妮 來(lái)源: 量子位
相關(guān)推薦

2023-09-20 12:58:00

訓(xùn)練研究

2018-09-27 17:20:25

2025-06-27 08:56:51

2024-01-19 16:50:34

大數(shù)據(jù)KRAS突變癌癥生物學(xué)

2015-12-09 15:21:25

基因突變大數(shù)據(jù)能量

2022-03-17 17:55:08

深度學(xué)習(xí)人工智能Nature

2024-05-23 09:28:23

模型蛋白質(zhì)

2019-06-06 15:37:00

機(jī)器學(xué)習(xí)人工智能AI

2024-06-11 07:40:00

2025-03-31 09:30:00

數(shù)據(jù)訓(xùn)練模型

2023-03-11 13:15:01

AI模型系統(tǒng)

2025-03-17 08:37:00

NatureAI模型

2023-09-20 09:49:41

2024-07-25 13:56:49

2024-07-29 07:04:00

大模型AI訓(xùn)AI人工智能

2024-07-29 08:00:00

模型論文

2017-12-25 11:16:34

基因測(cè)試癌癥

2024-11-11 10:00:00

ChatGPT模型

2022-12-21 17:23:08

2022-02-22 10:40:27

漏洞網(wǎng)絡(luò)攻擊
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)