偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

比10年專業(yè)醫(yī)生準(zhǔn)4倍!微軟發(fā)布突破性醫(yī)療AI系統(tǒng)

人工智能 新聞
MAI-DxO最大技術(shù)創(chuàng)新在于其模型無關(guān)的設(shè)計(jì),使其能夠適配不同廠商、不同能力的語(yǔ)言模型,并普遍提升它們的診斷性能。

微軟首席執(zhí)行官Satya Nadella在社交平臺(tái)分享了,微軟最新發(fā)布的突破性醫(yī)療AI系統(tǒng)MAI-DxO。

MAI-DxO最大技術(shù)創(chuàng)新在于其模型無關(guān)的設(shè)計(jì),使其能夠適配不同廠商、不同能力的語(yǔ)言模型,并普遍提升它們的診斷性能。并且能模擬真實(shí)醫(yī)生的診斷流程,比專業(yè)醫(yī)生的準(zhǔn)確率更高。

圖片

根據(jù)微軟公布的測(cè)試數(shù)據(jù)顯示,在與21名擁有超過10年從醫(yī)經(jīng)驗(yàn)的專業(yè)醫(yī)生的測(cè)試對(duì)比中,人類醫(yī)生在《新英格蘭醫(yī)學(xué)雜志》的56例隱藏測(cè)試集上的平均準(zhǔn)確率僅為19.9%。

而MAI-DxO在無預(yù)算配置的情況下,使用OpenAI的o3模型時(shí)準(zhǔn)確率高達(dá)81.9%,使用集成模式下高達(dá)85.5%,比專業(yè)醫(yī)生準(zhǔn)4倍以上,成本方面也大幅度下降。

此外,微軟還發(fā)布了一個(gè)專業(yè)的醫(yī)療序貫診斷基準(zhǔn)SDBench。

圖片

醫(yī)學(xué)診斷是一個(gè)需要醫(yī)生通過不斷收集患者信息、提出假設(shè)、驗(yàn)證假設(shè)并逐步細(xì)化診斷范圍的復(fù)雜序貫過程。

在臨床實(shí)踐中,醫(yī)生們需要根據(jù)患者初步的癥狀和體征,提出一系列針對(duì)性的問題,進(jìn)一步了解患者的病史、生活習(xí)慣、家族病史等信息,同時(shí)結(jié)合各種實(shí)驗(yàn)室檢查和影像學(xué)檢查的結(jié)果,逐步縮小可能的疾病范圍,最終確定準(zhǔn)確的診斷。

而MAI-DxO主要通過模擬一組具有不同角色的虛擬醫(yī)生來共同解決診斷問題,從而在診斷準(zhǔn)確性和成本效益方面取得顯著的突破。

MAI-DxO簡(jiǎn)單介紹

MAI-DxO框架的核心思想是借鑒真實(shí)醫(yī)療團(tuán)隊(duì)中的協(xié)作模式,讓不同的“醫(yī)生”發(fā)揮各自的專業(yè)優(yōu)勢(shì),共同為診斷過程提供支持,同時(shí)通過精心設(shè)計(jì)的協(xié)調(diào)機(jī)制來避免個(gè)體認(rèn)知偏差和過度檢查等問題。

首先,Dr. Hypothesis負(fù)責(zé)維護(hù)一個(gè)按概率排序的鑒別診斷列表,列出最有可能的三種疾病,并在每次獲得新的發(fā)現(xiàn)后,以貝葉斯方式更新這些疾病的概率。確保了診斷過程中始終有一個(gè)清晰的診斷方向,并能夠根據(jù)新信息及時(shí)調(diào)整診斷假設(shè),從而為后續(xù)的檢查選擇和診斷決策提供依據(jù)。

圖片

Dr. Test-Chooser在每一輪中選擇最多三個(gè)能夠最大程度區(qū)分領(lǐng)先診斷假設(shè)的診斷檢查。通過精心挑選檢查項(xiàng)目,旨在以最小的信息成本獲取最有價(jià)值的診斷線索,從而提高診斷效率,減少不必要的檢查費(fèi)用。這一角色的存在,使得整個(gè)診斷過程更加注重檢查的針對(duì)性和成本效益。

Dr. Challenger則是監(jiān)督員身份,負(fù)責(zé)識(shí)別可能存在的錨定偏差,指出與當(dāng)前領(lǐng)先診斷相矛盾的證據(jù),并提出能夠證偽當(dāng)前領(lǐng)先診斷的檢查建議。這種挑戰(zhàn)性的思維方式有助于打破診斷過程中的思維定式,促使團(tuán)隊(duì)從多個(gè)角度審視診斷假設(shè),避免因過早確定某一診斷而忽視其他可能性。

Dr. Stewardship致力于推行成本意識(shí)的醫(yī)療服務(wù),會(huì)倡導(dǎo)在診斷上等效但更便宜的檢查替代方案,并否決那些收益低且昂貴的檢查。通過這種方式,Dr. Stewardship確保了整個(gè)診斷過程在追求準(zhǔn)確診斷的同時(shí),能夠有效控制成本,避免資源的浪費(fèi)。使得整個(gè)診斷過程更加符合實(shí)際醫(yī)療環(huán)境中的成本效益原則。

圖片

Dr. Checklist負(fù)責(zé)在幕后進(jìn)行質(zhì)量控制,確保模型生成的檢查名稱有效,并保持整個(gè)團(tuán)隊(duì)推理過程中的內(nèi)部一致性。這一角色的存在有助于減少因人為錯(cuò)誤或邏輯不一致而導(dǎo)致的診斷失誤,保障了整個(gè)診斷系統(tǒng)的穩(wěn)定性和可靠性。

為了評(píng)估MAI-DxO的性能,微軟將其與專業(yè)人類醫(yī)生進(jìn)行了綜合對(duì)比。在診斷準(zhǔn)確性這一關(guān)鍵指標(biāo)時(shí),在參與測(cè)試的21名醫(yī)生中,他們的平均診斷準(zhǔn)確率僅為19.9%;

在不同的配置下,MAI-DxO均展現(xiàn)出了遠(yuǎn)高于人類醫(yī)生的診斷準(zhǔn)確率。例如,在無預(yù)算配置下,MAI-DxO的診斷準(zhǔn)確率達(dá)到了81.9%,而其集成配置更是將準(zhǔn)確率提升至85.5%。

圖片

在成本效益方面,人類醫(yī)生在測(cè)試中平均每個(gè)案例的成本為2963美元。他們平均每個(gè)案例花費(fèi)11.8分鐘,提出6.6個(gè)問題并請(qǐng)求7.2項(xiàng)檢查。相比之下,MAI-DxO在控制成本方面表現(xiàn)得更為出色。例如,無預(yù)算配置的平均檢查成本為4735美元,而預(yù)算內(nèi)配置的成本進(jìn)一步降低至2396美元,同時(shí)仍保持較高的診斷準(zhǔn)確率。

MAI-DxO五大集成模式

為了使MAI-DxO適配不同的醫(yī)療場(chǎng)景,來控制成本、診斷效率、準(zhǔn)確性等,MAI-DxO提供了五種集成模式。

Instant Answer 模式,該模式完全依賴初始病例摘要進(jìn)行診斷,不進(jìn)行任何后續(xù)的提問或檢查操作。這種模式的設(shè)計(jì)靈感來源于臨床中對(duì)緊急情況的快速響應(yīng)需求,例如在資源極度匱乏的偏遠(yuǎn)地區(qū)或急診場(chǎng)景下,醫(yī)生需要基于有限信息迅速做出初步判斷。盡管其診斷準(zhǔn)確性相對(duì)較低,但能夠在最短時(shí)間內(nèi)提供一個(gè)基于模型知識(shí)的初步診斷方向,為后續(xù)的進(jìn)一步診療提供基礎(chǔ)。

在技術(shù)實(shí)現(xiàn)上,該模式直接調(diào)用語(yǔ)言模型對(duì)初始信息進(jìn)行處理,通過優(yōu)化提示詞結(jié)構(gòu)來最大化利用有限信息中的診斷線索,其優(yōu)勢(shì)在于診斷速度極快且成本幾乎為零,但缺點(diǎn)是無法處理復(fù)雜病例,適用于對(duì)時(shí)間要求極高而對(duì)準(zhǔn)確性要求相對(duì)較低的特殊場(chǎng)景。

Question Only 模式則將診斷手段嚴(yán)格限制在提問范圍內(nèi),不允許訂購(gòu)任何診斷檢查,成本僅包含一次醫(yī)生問診的固定費(fèi)用。這種模式模擬了初級(jí)診療場(chǎng)景中醫(yī)生通過詳細(xì)詢問病史來獲取診斷信息的過程,強(qiáng)調(diào)病史采集在診斷中的基礎(chǔ)作用。

在技術(shù)層面,該模式通過構(gòu)建層次化的提問策略來逐步深入挖掘患者信息,首先從一般情況和主訴相關(guān)問題入手,然后根據(jù)回答逐步細(xì)化到具體的癥狀特征、既往史、家族史等方面。其優(yōu)勢(shì)在于成本低廉且對(duì)患者無創(chuàng)傷,適合作為初步篩查手段,但在面對(duì)需要客觀檢查證據(jù)的疾病時(shí)診斷能力會(huì)受到限制。該模式的設(shè)計(jì)理念是充分發(fā)揮語(yǔ)言模型的對(duì)話理解能力,通過優(yōu)化提問序列來最大化從患者敘述中獲取的診斷信息量,在基層醫(yī)療和健康咨詢等場(chǎng)景中具有重要的應(yīng)用價(jià)值。

圖片

Budgeted模式引入了動(dòng)態(tài)預(yù)算控制機(jī)制,通過一個(gè)獨(dú)立協(xié)調(diào)的語(yǔ)言模型調(diào)用實(shí)現(xiàn)對(duì)累計(jì)診斷成本的實(shí)時(shí)跟蹤。該模式允許團(tuán)隊(duì)在看到每項(xiàng)檢查的預(yù)估成本后決定是否取消該檢查,從而在診斷過程中實(shí)現(xiàn)對(duì)成本的主動(dòng)管理。

技術(shù)實(shí)現(xiàn)上,該模式首先通過自然語(yǔ)言處理技術(shù)將檢查請(qǐng)求轉(zhuǎn)換為標(biāo)準(zhǔn)化的 CPT 代碼,然后基于預(yù)先構(gòu)建的成本數(shù)據(jù)庫(kù)進(jìn)行實(shí)時(shí)估算。當(dāng)累計(jì)成本接近預(yù)設(shè)預(yù)算時(shí),系統(tǒng)會(huì)觸發(fā)成本預(yù)警機(jī)制,促使 Dr. Stewardship 角色更嚴(yán)格地評(píng)估每項(xiàng)檢查的性價(jià)比。

No Budget 模式則是MAI-DxO 的完整形態(tài),不設(shè)置明確的成本跟蹤或預(yù)算限制,允許診斷團(tuán)隊(duì)以最大化診斷準(zhǔn)確性為目標(biāo)進(jìn)行決策。該模式充分發(fā)揮了虛擬醫(yī)生團(tuán)隊(duì)的協(xié)作優(yōu)勢(shì),通過 Dr. Hypothesis 的貝葉斯推理、Dr. Test-Chooser 的信息價(jià)值評(píng)估、Dr. Challenger 的偏差檢測(cè)等機(jī)制,實(shí)現(xiàn)對(duì)復(fù)雜病例的深度診斷。

在技術(shù)實(shí)現(xiàn)上,該模式通過強(qiáng)化學(xué)習(xí)算法優(yōu)化各角色之間的協(xié)作流程,不斷調(diào)整診斷策略以提高準(zhǔn)確性。其優(yōu)勢(shì)在于能夠處理最復(fù)雜的疑難病例,實(shí)現(xiàn)最高的診斷準(zhǔn)確性,但可能會(huì)產(chǎn)生相對(duì)較高的診斷成本。該模式適用于對(duì)診斷準(zhǔn)確性要求極高的場(chǎng)景,例如,三甲醫(yī)院的??茣?huì)診或罕見病診斷中心,為復(fù)雜病例提供了一個(gè)不受成本限制的精細(xì)化診斷方案。

Ensemble模式則通過模擬多個(gè)醫(yī)生團(tuán)隊(duì)并行工作來進(jìn)一步提升診斷準(zhǔn)確性,每個(gè)團(tuán)隊(duì)獨(dú)立運(yùn)行 No Budget 模式,最后通過一個(gè)額外的集成面板進(jìn)行診斷結(jié)果的聚合。該模式的技術(shù)核心在于構(gòu)建多樣化的診斷團(tuán)隊(duì),每個(gè)團(tuán)隊(duì)可能采用不同的基礎(chǔ)模型或參數(shù)配置,從而產(chǎn)生具有差異性的診斷思路。在結(jié)果聚合階段,系統(tǒng)不僅考慮各團(tuán)隊(duì)診斷結(jié)果的一致性,還會(huì)評(píng)估每個(gè)診斷的支持證據(jù)強(qiáng)度和推理過程的合理性。通過這種方式,Ensemble 模式能夠有效降低單一團(tuán)隊(duì)可能出現(xiàn)的偏差和錯(cuò)誤,實(shí)現(xiàn)診斷準(zhǔn)確性的進(jìn)一步提升。

序貫診斷基準(zhǔn)SDBench

SDBench是微軟AI團(tuán)隊(duì)精心打造的一個(gè)交互式評(píng)估框架,將《新英格蘭醫(yī)學(xué)雜志》臨床病理會(huì)議(CPC)系列中的304個(gè)具有挑戰(zhàn)性的診斷案例轉(zhuǎn)化為逐步診斷的交互式場(chǎng)景。這些案例涵蓋了從常見疾病到罕見疾病的多樣化臨床表現(xiàn),為評(píng)估診斷主體(無論是人類醫(yī)生還是AI)的序貫診斷能力提供了豐富而真實(shí)的素材。

在SDBench中,診斷過程從一個(gè)簡(jiǎn)短的病例摘要開始,例如“一位29歲的女性因咽喉疼痛、扁桃體周圍腫脹和出血入院,癥狀未因抗菌治療而緩解”。

診斷主體需要根據(jù)這個(gè)初步信息,決定接下來要詢問患者哪些問題、要求進(jìn)行哪些檢查,或者是否已經(jīng)準(zhǔn)備好做出最終診斷。這個(gè)過程是迭代進(jìn)行的,每次診斷主體提出請(qǐng)求后,都會(huì)由一個(gè)名為“守門人”的智能體模型來響應(yīng)。

圖片

守門人模型是一個(gè)經(jīng)過特殊設(shè)計(jì)的語(yǔ)言模型,擁有完整的病例文件,包括最終診斷,但只會(huì)根據(jù)診斷主體的明確查詢提供相應(yīng)的臨床發(fā)現(xiàn)信息,如果查詢過于模糊或不具體,會(huì)禮貌地拒絕回答。這種設(shè)計(jì)模擬了真實(shí)臨床場(chǎng)景中醫(yī)生獲取患者信息的過程,確保了診斷主體必須通過合理、有針對(duì)性的提問和檢查請(qǐng)求來逐步揭開病例的全貌。

為了進(jìn)一步增強(qiáng)評(píng)估的真實(shí)性,SDBench還引入了一個(gè)“法官”智能體來評(píng)估診斷的準(zhǔn)確性。由于不同醫(yī)生可能使用不同的術(shù)語(yǔ)來描述相同的疾病,但其臨床處理方式可能完全一致,因此法官智能體不會(huì)僅僅根據(jù)字面描述來評(píng)判診斷的正確與否,而是會(huì)從核心疾病實(shí)體、病因、解剖部位、特異性等多個(gè)維度進(jìn)行綜合評(píng)估。

例如,對(duì)于一個(gè)“細(xì)菌性心內(nèi)膜炎”的診斷,即使診斷主體使用的是“由金黃色葡萄球菌引起的感染性心內(nèi)膜炎”這樣的更具體描述,只要其核心診斷與真實(shí)情況相符,法官智能體就會(huì)將其視為正確的診斷。這種基于臨床實(shí)質(zhì)的評(píng)估方式能夠更準(zhǔn)確地反映診斷主體的實(shí)際診斷能力,避免了因術(shù)語(yǔ)差異而導(dǎo)致的誤判。

圖片

除了診斷準(zhǔn)確性,SDBench還將診斷過程中產(chǎn)生的成本作為一個(gè)重要的評(píng)估指標(biāo)。在現(xiàn)實(shí)的臨床實(shí)踐中,醫(yī)生在選擇檢查手段時(shí)需要考慮其成本效益,不能隨意地進(jìn)行昂貴的檢查。

因此,SDBench為每次診斷主體與患者之間的互動(dòng)設(shè)定了一個(gè)固定成本,對(duì)于診斷檢查的請(qǐng)求,則通過一個(gè)基于語(yǔ)言模型的查找系統(tǒng)將其轉(zhuǎn)換為標(biāo)準(zhǔn)化的現(xiàn)行程序術(shù)語(yǔ)代碼,并根據(jù)美國(guó)一個(gè)大型衛(wèi)生系統(tǒng)的2023年定價(jià)表來確定相應(yīng)的成本。這種成本評(píng)估方式不僅能夠促使診斷主體在診斷過程中更加注重成本控制,還能為不同診斷主體之間的成本效益比較提供一個(gè)標(biāo)準(zhǔn)化的參考。

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2020-08-24 18:16:37

人工智能AI

2018-02-25 14:10:33

2021-01-20 10:58:34

云計(jì)算公有云IT

2012-02-13 09:53:16

Marvell整合式芯片88EM8183 IC

2024-12-10 08:31:22

2018-11-20 09:48:22

AI量子科技

2018-11-27 16:42:19

AI數(shù)據(jù)科技

2021-08-28 23:19:35

Windows 10Windows微軟

2014-10-22 10:07:04

移動(dòng)醫(yī)療

2020-12-11 15:51:07

AI

2019-02-28 09:47:24

技術(shù)研發(fā)指標(biāo)

2009-10-28 18:10:47

TippingPoin突破性網(wǎng)絡(luò)安全平臺(tái)

2020-01-27 16:22:01

軟件區(qū)塊鏈物聯(lián)網(wǎng)

2020-01-28 18:41:14

軟件區(qū)塊鏈人工智能

2020-12-11 13:03:00

AI 數(shù)據(jù)人工智能

2020-07-31 17:23:05

人工智能醫(yī)療技術(shù)

2020-08-06 08:19:17

人工智能醫(yī)療技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)