谷歌研發(fā)AI系統(tǒng),可使異常病例檢測(cè)周轉(zhuǎn)時(shí)間縮短28%
近日,谷歌團(tuán)隊(duì)的又一重大研究成果登上 Nature 子刊。該研究成果主要揭示了正常和異常胸片深度學(xué)習(xí)的區(qū)別,以及對(duì)結(jié)核病和 COVID-19 兩種致病因子不明顯疾病的概括。
值得關(guān)注的是,在人工智能系統(tǒng)優(yōu)先處理異常病例的模擬工作流程中,異常病例的周轉(zhuǎn)時(shí)間可以縮短 28%,這關(guān)乎人工智能評(píng)估系統(tǒng)是否可以安全地用于以前未見(jiàn)異常標(biāo)記案例。
9 月 1 日,相關(guān)論文以《用于正常和異常胸片深度學(xué)習(xí)的區(qū)別以及對(duì)結(jié)核病和 COVID-19兩種看不見(jiàn)疾病的概括》(Deep learning for distinguishing normal versus abnormal chest radiographs and generalization to two unseen diseases tuberculosis and COVID-19)為題發(fā)表在 Scientific Reports 上。
圖|相關(guān)論文(來(lái)源:Scientific Reports)
由谷歌健康團(tuán)隊(duì)成員丹尼爾·謝(Daniel Tse)、博軒·卡梅倫·陳(音譯)(Po-Hsuan Cameron Chen)和什拉維亞·謝蒂(Shravya Shetty)擔(dān)任共同通訊作者。
胸腔放射成像作為使用頻率較高的胸腔臨床成像模式,在指導(dǎo)心胸疾病管理方面具有至關(guān)重要的作用。一直以來(lái),檢測(cè)特定的胸腔放射異常(Chest Radiography,CXR)研究是多個(gè)人工智能系統(tǒng)的主要焦點(diǎn)。
圖|胸部X放射(來(lái)源:YouTube 視頻截圖)
然而,由于 CXR 異常范圍十分廣泛,每個(gè)人工智能系統(tǒng)都需檢測(cè)一個(gè)或多個(gè)預(yù)先指定的條件。因此,試圖通過(guò)制備數(shù)個(gè)單獨(dú)的人工智能系統(tǒng),檢測(cè)每個(gè)有可能出現(xiàn)的情況與實(shí)際情況不相匹配。
面對(duì)這一挑戰(zhàn),該團(tuán)隊(duì)對(duì)人工智能系統(tǒng)進(jìn)行了開(kāi)發(fā)與深度評(píng)估,將 CXR 射線分為正常和異常兩種。為了對(duì) CXR 系統(tǒng)進(jìn)行調(diào)整,該團(tuán)隊(duì)開(kāi)發(fā)了一個(gè)深度學(xué)習(xí)系統(tǒng) (Deep Learning System,DLS),在印度五個(gè)城市的五家醫(yī)院對(duì)約 2.48 萬(wàn)名患者做了數(shù)據(jù)集識(shí)別,他們還對(duì)印度、中國(guó)和美國(guó)的 6 個(gè)國(guó)際數(shù)據(jù)集做了 CXR 系統(tǒng)通用性評(píng)估。
圖|DLS 研究設(shè)計(jì)示意圖(來(lái)源:Scientific Reports)
在這些數(shù)據(jù)集中,有四個(gè)側(cè)重于 AI 未受過(guò)檢測(cè)培訓(xùn)的疾病,另外四個(gè)分別是兩個(gè)結(jié)核病數(shù)據(jù)集和兩個(gè) 2019 年冠狀病毒疾病數(shù)據(jù)集。該團(tuán)隊(duì)的研究成果表明,AI 系統(tǒng)可以使用包含各種胸腔放射異常的大型數(shù)據(jù)集進(jìn)行培訓(xùn),這些異常情況可以被分為新患者和癥狀不明的疾病人群。為了促進(jìn) CXR AI 模型的持續(xù)開(kāi)發(fā),該團(tuán)隊(duì)發(fā)布了他們收集的,用于公開(kāi)提供數(shù)據(jù)集的標(biāo)簽。
該研究成果表明,可信賴的 AI 系統(tǒng)可區(qū)分正 CXR 的正常或異常狀態(tài),對(duì)于患者的日常鍛煉和管理具有一定的益處。
首先,在放射科醫(yī)生較大的審查情況下,AI 算法可用于識(shí)別不太可能患病的病例,幫助醫(yī)療保健專業(yè)人員能夠快速地排除某些差異診斷,將更多的工作時(shí)間用于其他方向的疾病診斷。然后,將可能患病案例統(tǒng)一劃分到一組,以便進(jìn)行優(yōu)先審查,進(jìn)而縮短檢測(cè)周轉(zhuǎn)的時(shí)間。
其次,在大規(guī)模疾病爆發(fā)期間,當(dāng)臨床需求超過(guò)放射科醫(yī)生可用性的環(huán)境中,這種人工智能系統(tǒng)可能被用作非放射科醫(yī)生的前線護(hù)理點(diǎn)工具。更重要的是,需要對(duì)在開(kāi)發(fā)過(guò)程中未遇到的異常 CXR 進(jìn)行人工智能評(píng)估,以驗(yàn)證其對(duì)新疾病或新疾病表現(xiàn)的穩(wěn)健性。
谷歌研究人員在論文中指出,在某些情況下,他們的深度學(xué)習(xí)模型在放射檢測(cè)方面具有較大的優(yōu)勢(shì),可以較大地提高放射科科醫(yī)生工作效率。
該團(tuán)隊(duì)研究成員表示:“不論在相對(duì)健康的門(mén)診實(shí)踐,還是在異常繁忙的住院或門(mén)診環(huán)境中,DLS 系統(tǒng)都有助于將異常的 CXR 置于優(yōu)先級(jí),以便快速地向放射科醫(yī)生解釋。
在這項(xiàng)工作中,該團(tuán)隊(duì)在一定的條件下,對(duì)這些有助于驗(yàn)證 DLS 的數(shù)據(jù)性能進(jìn)行了評(píng)估,并使用相同的數(shù)據(jù)進(jìn)行其他研究的基準(zhǔn)測(cè)試。
為了更好地了解 DLS 在逆轉(zhuǎn)錄聚合酶鏈?zhǔn)椒磻?yīng) (Reverse Transcription-Polymerase Chain Reaction ,RT-PCR)靈敏度方面的潛在影響,該團(tuán)隊(duì)對(duì) COVID-19 案例進(jìn)行了更加詳細(xì)的分析。該案例在初始測(cè)試中具有 “假陰性”RT-PCR 測(cè)試結(jié)果,定義為陰性 RT-PCR 測(cè)試,然后在五天內(nèi)檢測(cè)為陽(yáng)性,在 21 個(gè)此類案例中,DLS 的靈敏度達(dá)到 95.2%。
圖|真陽(yáng)性和假陽(yáng)性的樣本 CXR(來(lái)源:Scientific Reports)
為了解他們可發(fā)的 DLS 是具體如何幫助練習(xí)放射科醫(yī)生的,他們調(diào)查了兩個(gè)基于 DLS 的模擬工作流程。假設(shè)放射科醫(yī)生尚未審查 DLS 陰性病例,并認(rèn)為這些案例被解釋為 “正常”,基于評(píng)估目的,其有效的即時(shí)表現(xiàn)令人滿意。
放射科醫(yī)生和按照順序 DLS 放射科醫(yī)生設(shè)置之間的性能差異很小,但 DS-1 和 CXR-14 的有效“緊急”案例量減少了 25%-30%,結(jié)核病數(shù)據(jù)集減少了約 40%,COVID-19 數(shù)據(jù)集減少了約 5-10%。
圖|DLS 放射性圖譜(來(lái)源:Scientific Reports)
該團(tuán)隊(duì)開(kāi)發(fā)的 DLS 可以解釋 CXR 是否為異常,并用六個(gè)數(shù)據(jù)集進(jìn)一步驗(yàn)證了它的適應(yīng)性,其中包含兩個(gè)廣泛的臨床數(shù)據(jù)集,兩個(gè)未見(jiàn)疾病的數(shù)據(jù)集以及兩個(gè)帶有第二種未發(fā)現(xiàn)疾病的數(shù)據(jù)集。
總之,該團(tuán)隊(duì)已經(jīng)開(kāi)發(fā)并評(píng)估了一個(gè)與臨床相關(guān)的,可用于胸部X射線檢測(cè)的人工智能模型,并評(píng)估了其在 6 個(gè)不同數(shù)據(jù)集上的適用性。該團(tuán)隊(duì)希望,其研究成果中的性能分析以及公開(kāi)可用的 CXR-14 圖像的專屬標(biāo)簽發(fā)布,可以促進(jìn)臨床 CXR 人工智能模型的持續(xù)發(fā)展。