偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

新AI模型提高與疾病相關(guān)基因組學(xué)的預(yù)測能力

人工智能
為了了解DNA與疾病的關(guān)系,美國洛斯阿拉莫斯國家實(shí)驗(yàn)室的科學(xué)家開發(fā)了第一個(gè)多模態(tài)深度學(xué)習(xí)模型EPBDxDNABERT-2,該模型能夠利用DNA“呼吸”,即雙螺旋結(jié)構(gòu)自發(fā)打開和關(guān)閉,來確定轉(zhuǎn)錄因子(調(diào)節(jié)基因活動(dòng)的蛋白質(zhì))之間的精確關(guān)系。

為了了解DNA與疾病的關(guān)系,美國洛斯阿拉莫斯國家實(shí)驗(yàn)室的科學(xué)家開發(fā)了第一個(gè)多模態(tài)深度學(xué)習(xí)模型EPBDxDNABERT-2,該模型能夠利用DNA“呼吸”,即雙螺旋結(jié)構(gòu)自發(fā)打開和關(guān)閉,來確定轉(zhuǎn)錄因子(調(diào)節(jié)基因活動(dòng)的蛋白質(zhì))之間的精確關(guān)系。該模型有可能幫助設(shè)計(jì)用于治療源于基因活性疾病的藥物。

與DNA鏈結(jié)合的轉(zhuǎn)錄因子蛋白的表示與DNA鏈結(jié)合的轉(zhuǎn)錄因子蛋白的表示

洛斯阿拉莫斯國家實(shí)驗(yàn)室研究員、該論文的第一作者Anowarul Kabir說:“轉(zhuǎn)錄因子有很多種,人類基因組的規(guī)模大得令人生畏?!薄耙虼耍斜匾页瞿姆N轉(zhuǎn)錄因子與超長DNA結(jié)構(gòu)上的哪個(gè)位置結(jié)合。我們?cè)噲D用人工智能,特別是深度學(xué)習(xí)算法來解決這個(gè)問題。”

基于DNA訓(xùn)練的深度學(xué)習(xí)模型

DNA以相當(dāng)于30億個(gè)英文字母的數(shù)量寫入每個(gè)人類細(xì)胞,為人類生命的生長和維持提供了藍(lán)圖。轉(zhuǎn)錄因子結(jié)合到DNA的某些部分并影響基因表達(dá)的調(diào)控:單個(gè)基因如何為細(xì)胞的發(fā)育和功能提供特定的指令。因?yàn)檫@種表達(dá)可以在疾病中表現(xiàn)出來,如癌癥,預(yù)測與特定基因位置結(jié)合的轉(zhuǎn)錄因子可能對(duì)藥物開發(fā)有影響。

研究小組使用的基礎(chǔ)模型是在DNA序列上訓(xùn)練的。該團(tuán)隊(duì)構(gòu)建了一個(gè)DNA模擬程序,該程序捕獲了大量的DNA動(dòng)態(tài)并將其與基因組基礎(chǔ)模型集成,從而產(chǎn)生了EPBDxDNABERT-2,該程序能夠處理染色體上的基因組序列,并將相應(yīng)的DNA動(dòng)態(tài)作為輸入。一個(gè)這樣的輸入-DNA呼吸,或DNA雙螺旋結(jié)構(gòu)的局部和自發(fā)打開和關(guān)閉,與轉(zhuǎn)錄活性相關(guān),如轉(zhuǎn)錄因子結(jié)合。

洛斯阿拉莫斯國家實(shí)驗(yàn)室的研究員Manish Bhattarai說:“DNA呼吸特征與DNABERT-2基礎(chǔ)模型的整合大大增強(qiáng)了轉(zhuǎn)錄因子結(jié)合的預(yù)測?!薄拔覀儗NA編碼片段作為模型的輸入,并詢問模型是否在許多細(xì)胞系中與轉(zhuǎn)錄因子結(jié)合。這些結(jié)果提高了特定基因位置與許多轉(zhuǎn)錄因子結(jié)合的預(yù)測概率?!?/span>

使用Venado運(yùn)行AI算法

該團(tuán)隊(duì)在實(shí)驗(yàn)室最新的超級(jí)計(jì)算機(jī)Venado上運(yùn)行了他們的深度學(xué)習(xí)模型,Venado將中央處理單元與圖形處理單元相結(jié)合,以驅(qū)動(dòng)人工智能功能。深度學(xué)習(xí)模型的工作方式類似于大腦的神經(jīng)網(wǎng)絡(luò),結(jié)合圖像和文本,揭示復(fù)雜的模式來生成預(yù)測和見解。

為了訓(xùn)練模型,研究小組使用了690個(gè)實(shí)驗(yàn)結(jié)果的基因測序數(shù)據(jù),包括161種不同的轉(zhuǎn)錄因子和91種人類細(xì)胞類型。他們發(fā)現(xiàn),EPBDxDNABERT-2顯著提高了660多種轉(zhuǎn)錄因子結(jié)合的預(yù)測,在一個(gè)關(guān)鍵指標(biāo)上提高了9.6%。從受控環(huán)境中的實(shí)驗(yàn)中提取的體外數(shù)據(jù)集的進(jìn)一步實(shí)驗(yàn)補(bǔ)充了自然界數(shù)據(jù)集,或直接從活體生物(如小鼠)研究中提取的數(shù)據(jù)。

研究小組發(fā)現(xiàn),雖然單獨(dú)DNA呼吸可以幾乎準(zhǔn)確地估計(jì)轉(zhuǎn)錄活性,但多模態(tài)模型可以提取結(jié)合基序,即轉(zhuǎn)錄因子結(jié)合的特定DNA序列,這是解釋轉(zhuǎn)錄過程的關(guān)鍵因素。

Bhattarai說:“正如它在多個(gè)不同數(shù)據(jù)集上的表現(xiàn)所證明的那樣,我們的多模態(tài)基礎(chǔ)模型表現(xiàn)出了多功能性、魯棒性(健壯性)和有效性?!薄霸撃P蜆?biāo)志著計(jì)算基因組學(xué)的重大進(jìn)步,為分析復(fù)雜的生物機(jī)制提供了一種復(fù)雜的工具。”

責(zé)任編輯:華軒 來源: Ai時(shí)代前沿
相關(guān)推薦

2014-03-26 09:06:27

Google大數(shù)據(jù)

2025-03-31 09:30:00

數(shù)據(jù)訓(xùn)練模型

2025-06-26 10:08:34

谷歌模型AI

2022-10-12 23:12:32

戴爾

2025-09-24 09:00:25

2012-11-19 11:08:45

初志云存儲(chǔ)

2020-07-01 09:58:42

Java 編程語言開發(fā)

2021-01-27 11:12:54

極道科技

2025-06-27 08:45:31

2025-10-15 09:11:41

2016-05-04 15:26:21

戴爾HPC

2020-02-19 10:10:41

AI基因分析人工智能

2022-11-02 13:41:46

2024-11-15 13:42:25

2025-09-24 18:02:55

2024-05-06 08:46:57

AI基因編輯

2013-04-19 09:17:28

Internet2大數(shù)據(jù)SDN

2025-09-19 09:02:00

2023-09-20 09:49:41

2020-07-23 14:40:04

Java 程序開發(fā)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)