偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Nature發(fā)布Delphi-2M模型,提前20年預(yù)測你得什么病

人工智能 新聞
團(tuán)隊計劃給模型“喂”更多的數(shù)據(jù),比如基因組學(xué)、蛋白質(zhì)組學(xué)這些更深層次的生命信息,把它變得更強(qiáng)大。他們也希望能將模型與可穿戴健康設(shè)備結(jié)合,實現(xiàn)實時的健康監(jiān)測和風(fēng)險預(yù)警。

一個叫Delphi-2M的AI模型橫空出世,在科學(xué)界炸開了鍋。

這玩意兒能預(yù)測一個人未來可能得的1000多種病,有時候甚至能提前幾十年打招呼。相關(guān)的研究成果,2025年9月17日發(fā)表在了頂尖期刊《自然》上。

這不是科幻。

拆解一臺未來的健康預(yù)測機(jī)

這臺“預(yù)測機(jī)”的背后,是一群來自歐洲分子生物學(xué)實驗室(EMBL)、德國癌癥研究中心(DKFZ)和哥本哈根大學(xué)的頂尖科學(xué)家。

他們干了件很有想象力的事。

他們把AI聊天機(jī)器人ChatGPT背后的技術(shù),也就是生成式預(yù)訓(xùn)練轉(zhuǎn)換器(GPT,Generative Pre-trained Transformer)架構(gòu),給“魔改”了一下,讓它從一個語言天才,變成了一個精通人體疾病發(fā)展規(guī)律的醫(yī)學(xué)預(yù)言家。

語言模型處理的是單詞和句子,這個Delphi-2M處理的是診斷、癥狀和醫(yī)療事件。在它眼里,人的一生就是一篇待寫的文章,而各種疾病就是文章里可能出現(xiàn)的詞匯和段落。

具體的改造細(xì)節(jié)有點硬核,但非常關(guān)鍵。

GPT模型里有個叫“位置編碼”的東西,用來告訴模型一個詞在句子里的位置。但人生不是一頁頁的書,而是一條連續(xù)不斷的時間線。所以,研究人員用代表連續(xù)年齡的數(shù)學(xué)函數(shù),替換掉了原來的位置編碼。這樣一來,模型就能理解一個醫(yī)療事件發(fā)生在35歲和發(fā)生在65歲是完全不同的概念。

他們給模型加了第二個“輸出頭”。原來的語言模型只會預(yù)測下一個詞是什么,但改造后的Delphi-2M不僅能預(yù)測下一個醫(yī)療事件是什么病,還能預(yù)測這個病大概多久之后會發(fā)生。

他們修改了模型的“注意力掩碼”。這保證了模型在做預(yù)測時,絕對不會“偷看”未來的信息,它只能根據(jù)一個人的過去病史來推斷未來。

通過這些改造,Delphi-2M學(xué)會了讀懂醫(yī)療數(shù)據(jù)這種特殊的“語言”,理解了各種疾病之間盤根錯節(jié)的聯(lián)系,以及生活方式這些變量是如何影響故事走向的。

這個模型到底有多大?研究團(tuán)隊發(fā)現(xiàn),對于他們使用的數(shù)據(jù)集,200萬參數(shù)左右的規(guī)模效果最好。最終確定的一個版本,擁有12層結(jié)構(gòu),12個注意力頭,總參數(shù)量是220萬個。

所以它叫Delphi-2M,“2M”就是200萬參數(shù)的意思。

用幾十萬人的生命歷程當(dāng)教材

要訓(xùn)練出這么一個模型,得有足夠分量的教材。

這次的主教材是英國生物銀行(UK Biobank),這是目前世界上規(guī)模最大、信息最詳盡的生物醫(yī)學(xué)數(shù)據(jù)庫之一。里面有大約50萬英國中年人的各種表型和健康信息。

研究團(tuán)隊把這些數(shù)據(jù)分成了幾份:

超過40萬人的數(shù)據(jù)用作訓(xùn)練集,讓模型去學(xué)習(xí)疾病發(fā)展的普遍規(guī)律。

另外10萬人的數(shù)據(jù)用作驗證集,用來調(diào)試和優(yōu)化模型。

最后,用將近48萬名參與者在兩年內(nèi)的后續(xù)記錄作為縱向測試集,看看模型的預(yù)測到底準(zhǔn)不準(zhǔn)。

這還不夠。

為了證明模型不是只能“看懂”英國人的健康故事,團(tuán)隊還找來了一份覆蓋193萬丹麥國民、時間跨度長達(dá)40年的丹麥疾病登記數(shù)據(jù)進(jìn)行外部驗證。

結(jié)果證明,Delphi-2M在不同的醫(yī)療系統(tǒng)和人群中都表現(xiàn)出了很好的泛化能力。

它到底能干什么?

Delphi-2M最厲害的地方,在于它能一口氣同時預(yù)測1000多種疾病的風(fēng)險。

具體來說,是1258種不同的疾?。ǜ鶕?jù)國際疾病分類編碼ICD-10)外加死亡風(fēng)險。

它進(jìn)行預(yù)測的依據(jù),包括一個人的過往病史、年齡、性別,以及一些基本的生活方式信息,比如體重指數(shù)、抽不抽煙、喝不喝酒。

它給出的不是一個“你一定會得某某病”的死板結(jié)論,而是一個隨時間變化的風(fēng)險概率,有點像天氣預(yù)報說明天有70%的概率下雨。

以前的疾病預(yù)測模型,大多是“單線程”的,比如著名的Qrisk模型,專門用來算未來十年得心臟病或中風(fēng)的風(fēng)險。這種模型一次只能處理一種病。

Delphi-2M則是“多線程”的,它能把所有疾病放在一個大盤子里通盤考慮,時間跨度最長可以拉到20年。

德國慕尼黑路德維希馬克си米利安大學(xué)的計算機(jī)科學(xué)家斯特凡·福伊里格爾(Stefan Feuerriegel)評價說:這個工具一次性建模多種疾病的能力是“驚人的”,它可以生成整個未來的健康軌跡。

根據(jù)團(tuán)隊的評估,在五年內(nèi)的疾病預(yù)測上,Delphi-2M的平均準(zhǔn)確性指標(biāo)(AUC)達(dá)到了0.76。雖然隨著預(yù)測時間的拉長,準(zhǔn)確率會慢慢下降,但即便在十年這個時間點上,它依然保持著相當(dāng)高的預(yù)測能力。

對于大多數(shù)疾病,它的預(yù)測準(zhǔn)確性跟現(xiàn)有的單一疾病模型比起來,要么不相上下,要么更勝一籌。

它最讓人驚艷的特性,是它的“生成”能力。

你可以給模型提供一段某個人到目前為止的健康記錄,就像給AI一個開頭,然后它就能順著這個開頭,“續(xù)寫”出一段未來20年可能的健康軌跡。

它會一次次地采樣,生成下一個最可能發(fā)生的醫(yī)療事件,以及距離這個事件發(fā)生的時間。通過反復(fù)迭代,就能描繪出一幅完整的未來健康藍(lán)圖。

這種能力意義重大。比如,研究人員可以利用它生成大量統(tǒng)計上真實、但不涉及任何真實患者隱私的合成健康數(shù)據(jù)。這些“假數(shù)據(jù)”可以用來訓(xùn)練其他AI模型,極大地解決了醫(yī)療領(lǐng)域的數(shù)據(jù)隱私難題。

挑戰(zhàn)與未來之路

當(dāng)然,Delphi-2M并非完美。

研究團(tuán)隊坦誠,模型在學(xué)習(xí)數(shù)據(jù)的過程中,也把數(shù)據(jù)里潛藏的偏見學(xué)了進(jìn)來。比如,如果歷史數(shù)據(jù)顯示某個群體因為社會經(jīng)濟(jì)原因更難獲得及時的醫(yī)療服務(wù),那么模型在預(yù)測時就可能反映出這種不平等。

如何消除這些數(shù)據(jù)偏見,確保模型的公平性,是未來必須解決的問題。

同時,隱私保護(hù)是懸在頭頂?shù)倪_(dá)摩克利斯之劍。研究人員強(qiáng)調(diào),他們自始至終使用的都是匿名的患者數(shù)據(jù),并且嚴(yán)格遵守相關(guān)的隱私法規(guī)。

最重要的一點是,研究團(tuán)隊反復(fù)申明,Delphi-2M目前還只是一個研究工具,遠(yuǎn)沒有成熟到可以用于臨床實踐的程度。它應(yīng)該是醫(yī)生的助手,而不是替代品。

下面這個表格可以清晰地看出Delphi-2M與傳統(tǒng)模型的區(qū)別:

德國癌癥研究中心的莫里茨·格斯通(Moritz Gerstung)教授說:“這是理解人類健康和疾病進(jìn)展新方式的開始。像我們這樣的生成模型,有一天可能有助于個性化護(hù)理和預(yù)測醫(yī)療需求?!?/span>

未來,團(tuán)隊計劃給模型“喂”更多的數(shù)據(jù),比如基因組學(xué)、蛋白質(zhì)組學(xué)這些更深層次的生命信息,把它變得更強(qiáng)大。他們也希望能將模型與可穿戴健康設(shè)備結(jié)合,實現(xiàn)實時的健康監(jiān)測和風(fēng)險預(yù)警。

歐洲分子生物學(xué)實驗室的伊萬·伯尼(Ewan Birney)描繪了這樣一個場景:“你走進(jìn)醫(yī)生的診所,醫(yī)生很自然地使用這些工具,然后告訴你,‘這是你未來四個主要的健康風(fēng)險,這里有兩件事,如果你做了,就能真正改變這個局面?!?/span>

Delphi-2M的出現(xiàn),代表著AI在醫(yī)療領(lǐng)域的一次范式轉(zhuǎn)移。它讓我們看到,AI不僅能診斷已有的病,還能預(yù)見未發(fā)的病。它不再是簡單地回答“會不會生病”,而是嘗試描繪出“人的一生會如何生病”。

如果AI能提前告訴你未來的健康風(fēng)險,你愿意知道嗎?

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2015-08-24 09:23:25

2019-03-01 09:49:40

微軟瀏覽器Windows

2015-07-10 10:55:44

Android M谷歌

2017-11-24 14:07:09

2023-11-20 14:34:09

2024-12-23 15:44:25

2009-04-18 17:23:58

四核服務(wù)器AMD

2023-01-04 11:35:21

預(yù)測模型預(yù)售

2023-04-19 08:31:57

Node.jsLTS版本

2018-03-13 12:45:44

2016-12-01 11:12:22

2017-12-13 18:41:44

2023-06-20 08:01:09

RoseDB存儲數(shù)據(jù)

2016-12-01 16:57:44

2023-03-11 13:15:01

AI模型系統(tǒng)

2024-01-07 18:00:33

AI模型特點

2023-09-28 12:09:42

2012-12-25 17:21:39

CompuwareAPM

2013-12-09 10:07:43

CA Technolo

2010-12-23 14:12:16

點贊
收藏

51CTO技術(shù)棧公眾號