放射科醫(yī)生再臨危機!國外五大機構(gòu)聯(lián)合發(fā)布「胸部X光」最新基準
胸部X光(CXR)檢查是一種廣泛應(yīng)用于各種疾病的篩查、診斷檢查的臨床成像方式。
臨床診斷中,不僅包括常見的疾病類型,往往還會描述相應(yīng)嚴重程度和不確定性,目前的醫(yī)學圖像數(shù)據(jù)庫往往滿足于預測疾病類型,而忽視了具有重大臨床意義的后者。
最近,德州州立阿靈頓分校、NIH、理化學研究所、東京大學以及日本國立癌癥研究中心的研究人員從臨床角度出發(fā),提出了提出一個包含疾病嚴重程度和不確定性的全新數(shù)據(jù)集并提出了一種用于CXR疾病分類的解剖結(jié)構(gòu)感知的多關(guān)系圖學習方法。
論文地址:https://arxiv.org/abs/2309.03331
項目主頁:https://github.com/MengRes/Uncertain-Label.git
數(shù)據(jù)集:https://physionet.org/content/cad-chest/1.0/
這篇論文的主要貢獻有兩點:
1. 提出一個包含疾病嚴重程度和不確定性的數(shù)據(jù)集。
2. 提出了一種使用醫(yī)學知識的多關(guān)系圖學習方法用于CXR疾病分類。
全新數(shù)據(jù)集
診斷疾病的嚴重程度在臨床診斷中至關(guān)重要,超越了疾病類別存在或不存在的二元分類,在MIMIC-CXR數(shù)據(jù)集中(最大的胸片數(shù)據(jù)集之一)以及隨附的放射學報告,疾病嚴重程度的描述(例如圖1中的「small pleural effusion」或「mild cardiomegaly」)很常見。
圖1:放射學報告中關(guān)于疾病不確定性和嚴重程度的描述(疾病用紅色字體標出,嚴重程度用綠色高亮,不確定性用藍色高亮)
據(jù)了解,之前沒有研究解決報告的疾病嚴重程度的問題。
其次,由于胸片的基本復雜性和難度,對醫(yī)生的疾病不確定性進行建模非常重要。放射科醫(yī)生經(jīng)常在臨床記錄中使用「可能」、「不排除」和「也許」等術(shù)語在臨床記錄中表明不同程度的不確定性。
大多數(shù)先前的研究將這種不確定性視為負面類別,這可能會誤導臨床決策。
研究人員使用了基于規(guī)則的提取方法從放射學報告中提取疾病的名稱,嚴重程度和不確定性信息。
對于疾病名稱,研究人員列出每一種疾病可能使用的表述,對于疾病嚴重程度,并列出了表示嚴重程度的詞語,并將嚴重程度量化為輕度(mild),中度(moderate)和嚴重(sever)三個等級,如表1所示。
對于疾病的不確定性,研究人員與醫(yī)生合作,制定了不同的不確定性詞語與標簽值的映射,將不同的嚴重程度對應(yīng)于不同的標簽值,對疾病的描述越肯定,標簽值越高,如表2所示。
表1:表示疾病嚴重程度的詞語
表2:表示疾病不確定性的詞語
研究人員邀請經(jīng)驗豐富的醫(yī)生評估提取的標簽的準確性,向醫(yī)生提供了500份隨機選擇的放射學報告及其相應(yīng)提取的疾病,嚴重程度和不確定性標簽。
根據(jù)醫(yī)生的反饋統(tǒng)計了標簽的準確性,如表3所示。
表3:提取的標簽的準確性評估
方法
基于上述提取的標簽上使用圖網(wǎng)絡(luò)對疾病分類。
根據(jù)醫(yī)生提供的醫(yī)學知識,構(gòu)建出了三種圖網(wǎng)絡(luò)關(guān)系,分別為spatial graph(表示解剖學結(jié)構(gòu)之間的關(guān)系),semantic graph(疾病之間的關(guān)系)和implicit graph(表示潛在的關(guān)系)。
模型結(jié)構(gòu)如圖2所示,具體介紹情參見論文。
圖2:方法的網(wǎng)絡(luò)結(jié)構(gòu)
實驗
研究人員在提取的標簽上進行實驗并和其他方法比較,結(jié)果如表4所示。
表4:與其他方法的比較結(jié)果
研究人員使用二元標簽和不確定標簽來訓練模型,記為Ours(0-1)和Ours(Uncertain)。
為了更深入地研究方法的性能,文中還進行了消融研究。每個實驗都針對具有二元標簽和不確定標簽的spatial graph、semantic graph和implicit graph進行單獨訓練。
作者將疾病感興趣區(qū)域與在ResNet-50模型上使用Grad-CAM生成結(jié)果進行比較。從報告中提取異常區(qū)域如下圖所示??梢园l(fā)現(xiàn),放射學報告顯示雙側(cè)下肺(左下肺和右下肺)出現(xiàn)混濁。
此外,右肺的混濁可能代表肺炎。ResNet-50模型在不透明和肺炎的情況下重點關(guān)注右下肺、右中肺和心臟區(qū)域。
從報告中可以發(fā)現(xiàn)心臟區(qū)域沒有異常,而左下肺的疾病被遺漏,使得Grad-CAM結(jié)果不太準確。研究人員提出的模型同時關(guān)注左下肺和右下肺,并且比ResNet-50方法表現(xiàn)更好。
圖4:報告中的異常描述以紅色突出顯示,從文本中提取的異常和位置在報告下方提供。為每個異常提供兩張圖像以進行比較。(a)和(c)是ResNet-50模型中Grad-CAM獲得的異常感興趣區(qū)域。(b)和(d)是通過研究人員的方法獲得的感興趣的節(jié)點。在結(jié)果中,每個邊界框?qū)?yīng)一個解剖區(qū)域的節(jié)點,紅色邊界框是關(guān)注度最高的節(jié)點,黃色邊界框?qū)?yīng)與紅色邊界框密切相關(guān)的節(jié)點。綠色箭頭表示節(jié)點之間的連接。
結(jié)論
在這項研究中,作者提出CXR疾病診斷在臨床中存在的疾病嚴重性和不確定性描述的問題。
針對此問題作者使用基于規(guī)則的方法從放射學報告中提取包含疾病嚴重程度和不確定性的標簽。
在該數(shù)據(jù)集上,作者使用基于醫(yī)學知識的圖神經(jīng)網(wǎng)絡(luò)來預測疾病的嚴重程度和不確定性。