人工智能和知識圖譜六:知識圖譜的行業(yè)用例

一、醫(yī)療保健與生命科學(xué)
在制藥和生物技術(shù)領(lǐng)域,知識圖譜正在加速藥物發(fā)現(xiàn)和再利用。這些知識圖譜將異構(gòu)生物醫(yī)學(xué)數(shù)據(jù)整合到單一知識網(wǎng)絡(luò)中,比如基因、蛋白質(zhì)、疾病、藥物、臨床試驗(yàn)、文獻(xiàn)等。研究人員可以查詢或分析該圖譜,以發(fā)現(xiàn)不明顯的聯(lián)系,例如,與兩種看似不相關(guān)的疾病有關(guān)的基因可能暗示著共同的靶向途徑。
一個(gè)具體的案例是:阿斯利康建立了一個(gè)全面的生物醫(yī)學(xué)知識圖譜,將基因與疾病和化合物聯(lián)系起來,他們的科學(xué)家利用該圖譜預(yù)測新的藥物靶點(diǎn)并重新定位現(xiàn)有藥物。另一個(gè)例子是一家初創(chuàng)公司,它使用知識圖譜通過將癥狀、遺傳標(biāo)記和已知的藥物機(jī)制聯(lián)系起來,尋找罕見疾病的候選藥物。其工作原理:知識圖譜通過將化合物與蛋白質(zhì)靶點(diǎn)和已知效應(yīng)聯(lián)系起來,從而實(shí)現(xiàn)靶點(diǎn)識別,因此 AI 算法可以確定優(yōu)先研究的靶點(diǎn)。它們還支持藥物重新利用:通過映射藥物和疾病之間的關(guān)系,知識圖譜可以突出顯示與不同疾病的生物途徑相互作用的現(xiàn)有藥物,從而表明存在重新利用的機(jī)會 。
2023 年,生物醫(yī)學(xué)知識圖譜甚至已與人工智能相結(jié)合,以預(yù)測新的聯(lián)系:例如,人工智能可能會遍歷知識圖譜并假設(shè)藥物 X可能治療疾病 Y,因?yàn)槁窂筋愃朴?X -> 靶向酶 A -> 與疾病 Y 有關(guān)。《自然》雜志的一篇文章描述了一些案例研究,其中知識圖譜通過揭示這些隱藏的聯(lián)系來幫助發(fā)現(xiàn)治療乳腺癌和阿爾茨海默氏癥藥物的新用途。這樣做的好處是,研究人員不必從零開始或淹沒在數(shù)據(jù)中——知識圖譜會組織所有已知知識,以便人工智能或人類可以對其進(jìn)行有效地查詢和推理。這可以更快地生成假設(shè),并可以更明智地決定進(jìn)行哪些實(shí)驗(yàn)或試驗(yàn)。有公司報(bào)告稱,使用知識圖譜幫助他們篩選出最有前景的候選藥物,速度比人工審查數(shù)千篇論文要快得多。另一個(gè)運(yùn)營優(yōu)勢是協(xié)作:這些知識圖譜通常作為單一事實(shí)來源,不同的專家(生物學(xué)家、化學(xué)家、數(shù)據(jù)科學(xué)家)可以貢獻(xiàn)和查詢,從而打破化學(xué)和臨床研究等部門之間的數(shù)據(jù)孤島。
此外,在醫(yī)療保健領(lǐng)域,醫(yī)院系統(tǒng)使用知識圖譜進(jìn)行患者數(shù)據(jù)整合并提供護(hù)理建議。例如,知識圖譜可以將患者癥狀、實(shí)驗(yàn)室結(jié)果、診斷和治療與醫(yī)學(xué)知識(指南、藥物相互作用)聯(lián)系起來。這可以為臨床決策支持系統(tǒng)提供支持,該系統(tǒng)可以為患者提供可能的診斷建議或標(biāo)記危險(xiǎn)的藥物相互作用。例如,梅奧診所嘗試使用知識圖譜將患者記錄與醫(yī)學(xué)本體相結(jié)合,以提高診斷準(zhǔn)確性和個(gè)性化護(hù)理。例如:知識圖譜在 COVID-19 疫情中得到應(yīng)用——將病毒基因、出版物和藥物數(shù)據(jù)庫聯(lián)系起來,以快速識別可能對該病毒有效的現(xiàn)有藥物(這發(fā)生在疫情初期,當(dāng)時(shí)知識圖譜方法識別出了可重新利用的候選藥物)。關(guān)鍵在于:在醫(yī)療保健領(lǐng)域,知識圖譜 (KG) 提供了可解釋的 AI——例如,通過追蹤知識圖譜中的路徑(患者具有生物標(biāo)志物 A -> 與疾病 B 相關(guān) -> 可用藥物 C 治療)來解釋為什么建議患者使用某種藥物。這種透明度對于醫(yī)療決策至關(guān)重要,并能建立人們對 AI 建議的信任。
二、財(cái)務(wù)金融方面
金融機(jī)構(gòu)處理著龐大的交易、賬戶、公司和個(gè)人網(wǎng)絡(luò)。知識圖譜可以自然地模擬這些網(wǎng)絡(luò),使其非常適合檢測復(fù)雜的欺詐計(jì)劃、洗錢和風(fēng)險(xiǎn)評估。與傳統(tǒng)的基于規(guī)則的系統(tǒng)不同,傳統(tǒng)的基于規(guī)則的系統(tǒng)只能捕捉簡單的欺詐行為(同一張卡同時(shí)在兩個(gè)地方使用),而知識圖譜可以揭示微妙的、間接的模式——例如,一組表面上看似無關(guān)但實(shí)際上存在中間聯(lián)系(例如,共享地址或資金通過中間賬戶轉(zhuǎn)移)的賬戶,這些聯(lián)系表明存在欺詐團(tuán)伙。案例研究:金融軟件公司Intuit使用圖數(shù)據(jù)庫 (TigerGraph) 打擊其支付網(wǎng)絡(luò)中的欺詐行為,發(fā)現(xiàn)了常規(guī)手段無法檢測到的欺詐用戶團(tuán)伙。據(jù)報(bào)道,通過分析圖中的關(guān)系(例如,常見的設(shè)備 ID、IP 地址或收款人重疊),Intuit 識別出的欺詐行為增加了 20%,誤報(bào)率也降低了。同樣,PayPal和Mastercard也討論了基于圖的方法來識別欺詐團(tuán)伙和合謀商家。
欺詐圖譜通常整合來自各種來源的數(shù)據(jù):交易、客戶信息、商戶信息等,形成一個(gè)多實(shí)體、多關(guān)系的網(wǎng)絡(luò)。在這些知識圖譜上運(yùn)行的社群檢測或鏈接分析等圖算法可以標(biāo)記異常情況——例如,一組形成循環(huán)的交易是不尋常的(表明存在洗錢的分層),或者一群共享聯(lián)系方式的人可能是一個(gè)欺詐共謀團(tuán)伙。其結(jié)果是,可以更早地發(fā)現(xiàn)復(fù)雜的欺詐行為并減少損失。ACM 通訊的一篇文章(2024)強(qiáng)調(diào),圖數(shù)據(jù)庫使金融機(jī)構(gòu)能夠捕捉傳統(tǒng)關(guān)系數(shù)據(jù)庫遺漏的隱藏模式,從而更快、更高效地檢測欺詐。其好處還在于減少了誤報(bào)——通過知識圖譜考慮上下文,系統(tǒng)可以更加精確。例如,基于知識圖譜的系統(tǒng)不會將單筆大額交易標(biāo)記為欺詐,而是可能會發(fā)現(xiàn)發(fā)送方和接收方之間存在長期的業(yè)務(wù)關(guān)系(通過合約、共享董事會成員等在圖中建立聯(lián)系),從而避免誤報(bào)。另一方面,它可能會捕捉到一些看似正常,但在考慮具體情況后實(shí)際上卻很可疑的情況(例如,賬戶網(wǎng)絡(luò)之間進(jìn)行的許多小額交易加起來金額很大——單獨(dú)來看不會觸發(fā)規(guī)則,但圖表會揭示出一個(gè)累積的方案)。銀行也使用知識圖譜來了解你的客戶(KYC)。以及風(fēng)險(xiǎn)評估,將公司所有權(quán)、制裁名單、新聞和交易關(guān)聯(lián)起來,以獲得客戶的整體風(fēng)險(xiǎn)評分。例如,如果新客戶的知識圖譜顯示與空殼公司或受制裁個(gè)人的聯(lián)系,銀行就可以進(jìn)一步調(diào)查。這為運(yùn)營帶來了便利——分析師無需手動(dòng)拼湊來自各個(gè)數(shù)據(jù)庫的信息,知識圖譜 (KG) 會將這些信息整合在一起,通常還會使用可視化圖表探索工具來追蹤資金和所有權(quán)的流向。
三、電子商務(wù)和零售
像亞馬遜、eBay、沃爾瑪這樣的在線零售商經(jīng)營著數(shù)百萬種產(chǎn)品,即使查詢與產(chǎn)品文本不完全匹配,也需要幫助顧客找到他們想要的東西。知識圖譜可以通過捕捉產(chǎn)品、類別和屬性之間的關(guān)系,極大地改善電子商務(wù)網(wǎng)站上的語義搜索。例如,知識圖譜可能知道“電視”是一種“電子產(chǎn)品”,并具有屏幕尺寸、分辨率、品牌等屬性。如果用戶搜索“三星 4K 50 英寸智能電視”,那么具有知識圖譜的語義搜索系統(tǒng)可以從結(jié)構(gòu)化方面理解此查詢:品牌=三星,分辨率=4K,尺寸≈50 英寸,類別=電視(屬于電子產(chǎn)品)。這樣,即使產(chǎn)品的標(biāo)簽略有不同,它也可以檢索到相關(guān)的產(chǎn)品(產(chǎn)品標(biāo)題可能為“三星 50 英寸 4K LED 智能電視 - 型號 X”,如果單詞不同,純關(guān)鍵詞搜索可能無法正確排名)。知識圖譜 (KG) 提供了一個(gè)語義主干來映射同義詞和關(guān)系——例如,它知道“TV”和“television”是一樣的,“4K”表示最低分辨率,或者“blouse”是“shirt”的一種,所以查詢“red blouse”應(yīng)該匹配歸類為襯衫的產(chǎn)品。構(gòu)建產(chǎn)品、類別和屬性的知識圖譜對于實(shí)現(xiàn)直觀的搜索體驗(yàn)至關(guān)重要,在這種體驗(yàn)中,引擎可以理解意圖和上下文。亞馬遜的產(chǎn)品知識圖譜 (KG) 將從品牌關(guān)系到互補(bǔ)商品的所有內(nèi)容聯(lián)系起來;沃爾瑪?shù)?Polaris 搜索引擎通過產(chǎn)品分類的語義知識得到了改進(jìn)。除了搜索之外,推薦系統(tǒng)還可以從知識圖譜中受益,因?yàn)樗梢猿健百徺I X 的人也購買了 Y”的范疇。有了知識圖譜,人們可以利用產(chǎn)品屬性甚至外部知識進(jìn)行基于內(nèi)容的推薦。例如,知識圖譜可以將一本書與其作者聯(lián)系起來,并與該作者的其他書籍或同一類型的書籍聯(lián)系起來,從而實(shí)現(xiàn)直觀的推薦(“既然你喜歡阿加莎·克里斯蒂的這本推理小說,這里還有其他推理小說及其作者”)。像 eBay 這樣的公司已經(jīng)使用知識圖譜將產(chǎn)品數(shù)據(jù)與語義信息(例如,捕捉風(fēng)格、模式和趨勢的時(shí)尚知識圖譜)鏈接起來,以增強(qiáng)推薦和瀏覽功能。知識圖譜還可以存儲客戶評論分析——例如,將產(chǎn)品 ID 與經(jīng)常被稱贊或抱怨的方面聯(lián)系起來,然后根據(jù)用戶關(guān)心的方面推薦產(chǎn)品。
總而言之,對于電子商務(wù)而言,知識圖譜提高了可發(fā)現(xiàn)性和轉(zhuǎn)化率:它們通過理解查詢意圖更快地引導(dǎo)客戶找到合適的產(chǎn)品(從而降低挫敗感和跳出率),并通過更智能的推薦來增加追加銷售/交叉銷售(例如,推薦兼容的配件,因?yàn)橹R圖譜知道哪些配件與某種電子產(chǎn)品型號搭配)。另一個(gè)好處是可解釋性:電子商務(wù) KG 可以實(shí)現(xiàn)諸如“為什么向我推薦這個(gè)?”之類的功能,答案是“推薦這款相機(jī),因?yàn)樗悄榭催^的相機(jī)的較新型號,并且分辨率更高”,直接從圖中的關(guān)系中繪制。
四、制造業(yè)和工業(yè)領(lǐng)域
制造商使用知識圖譜 (KG) 來建模設(shè)備、流程、材料和供應(yīng)商之間的復(fù)雜關(guān)系。例如,語義數(shù)字孿生——博世和西門子已經(jīng)討論過使用知識圖譜來創(chuàng)建富含語義數(shù)據(jù)(元數(shù)據(jù)、維護(hù)記錄、傳感器類型)的工廠資產(chǎn)的數(shù)字化表示。這些知識圖譜可以將物聯(lián)網(wǎng)數(shù)據(jù)與領(lǐng)域知識相集成:例如,將傳感器讀數(shù)與機(jī)器及其所在的部件、該部件的維護(hù)歷史記錄以及該部件的供應(yīng)商關(guān)聯(lián)起來。其優(yōu)勢在于故障排除和預(yù)測性維護(hù)——如果供應(yīng)商 X 的某一批次組件出現(xiàn)故障,知識圖譜可以通過將故障事件與組件類型和供應(yīng)商聯(lián)系起來,快速揭示該模式。另一個(gè)用例是供應(yīng)鏈知識圖譜:像捷豹路虎這樣的公司(根據(jù) TigerGraph 案例研究)構(gòu)建了一個(gè)知識圖譜,通過映射數(shù)千個(gè)供應(yīng)商、組件和車輛之間的關(guān)系來優(yōu)化供應(yīng)鏈。查詢此圖譜有助于回答“假設(shè)”問題,例如“如果 Y 地區(qū)的供應(yīng)商 A 出現(xiàn)故障,哪些車型面臨風(fēng)險(xiǎn),哪些替代供應(yīng)商可以滿足需求?”。它提高了彈性和規(guī)劃能力。
五、能源與公用事業(yè)
能源公司使用知識圖譜 (KG) 來整合資產(chǎn)數(shù)據(jù)、網(wǎng)絡(luò)拓?fù)浜蛯?shí)時(shí)傳感器數(shù)據(jù)。電網(wǎng)知識圖譜可以展現(xiàn)變電站、變壓器和線路的連接方式,以及它們的規(guī)格和當(dāng)前負(fù)載。這有助于斷電管理:當(dāng)故障傳感器跳閘時(shí),知識圖譜查詢可以查找該組件下游的客戶以及可用的重新路由選項(xiàng)。在一個(gè)案例中,一家公用事業(yè)公司構(gòu)建了一個(gè)知識圖譜,以統(tǒng)一來自地理信息系統(tǒng) (GIS)、資產(chǎn)管理和氣象系統(tǒng)的數(shù)據(jù),從而能夠更快地分析斷電原因和受影響的基礎(chǔ)設(shè)施。其優(yōu)勢在于響應(yīng)速度更快,并能更好地進(jìn)行預(yù)測性維護(hù)調(diào)度(通過類似組件在特定條件下發(fā)生故障的模式來捕獲高風(fēng)險(xiǎn)組件)。
六、媒體和娛樂行業(yè)
流媒體服務(wù)和媒體公司經(jīng)常使用知識圖譜來豐富內(nèi)容元數(shù)據(jù)并驅(qū)動(dòng)推薦。例如,Netflix 就以使用復(fù)雜的標(biāo)記系統(tǒng)(可以看作是知識圖譜的一種形式,將電影與情緒、類型等屬性關(guān)聯(lián)起來)而聞名,它實(shí)現(xiàn)了超越簡單協(xié)同過濾的個(gè)性化推薦。同樣,Spotify 也收購了一些公司,構(gòu)建了一個(gè)音樂知識圖譜,將藝術(shù)家、專輯、類型,甚至情緒或播客聯(lián)系起來,以增強(qiáng)音樂發(fā)現(xiàn)能力。這些知識圖譜捕捉了內(nèi)容中豐富的關(guān)系:電影中的演員、導(dǎo)演的風(fēng)格、電影之間的主題聯(lián)系等等。因此,如果用戶喜歡某部電影,知識圖譜可以幫助找到另一部具有共同關(guān)鍵元素(相同導(dǎo)演或相似情節(jié)主題)的電影,即使第二部電影歷史上從未被同一觀眾共同觀看過(通過內(nèi)容相似性解決冷啟動(dòng)問題)。
七、公共部門和知識管理
政府機(jī)構(gòu)使用知識圖譜來鏈接跨部門數(shù)據(jù)(知識圖譜支撐著許多開放的政府?dāng)?shù)據(jù)門戶,將預(yù)算數(shù)據(jù)與結(jié)果關(guān)聯(lián)起來等等),并用于情報(bào)收集(例如,反恐機(jī)構(gòu)將來自不同情報(bào)來源的人員、地點(diǎn)和事件關(guān)聯(lián)起來以識別威脅)。在這些高風(fēng)險(xiǎn)場景中,知識圖譜的可解釋性至關(guān)重要——分析師可以看到通往已識別威脅網(wǎng)絡(luò)的連接鏈,這使得它比黑盒機(jī)器學(xué)習(xí)輸出更可信。
八、教育與研究
像 Microsoft Academic Graph(現(xiàn)已停止服務(wù),但它曾是一個(gè)涵蓋出版物、作者和機(jī)構(gòu)的知識圖譜)或 OpenAlex 這樣的學(xué)術(shù)知識圖譜有助于發(fā)現(xiàn)研究聯(lián)系。大學(xué)也使用知識圖譜整合學(xué)生數(shù)據(jù)、課程設(shè)置、研究項(xiàng)目等,以獲得內(nèi)部洞察。
在所有這些領(lǐng)域,知識圖譜的核心優(yōu)勢在于提供基于上下文且具有關(guān)聯(lián)性的數(shù)據(jù)理解。其結(jié)果往往是改進(jìn)決策:藥物研究人員能夠選擇更精準(zhǔn)的目標(biāo),欺詐調(diào)查人員能夠發(fā)現(xiàn)更多欺詐行為,消費(fèi)者能夠找到他們真正想要的產(chǎn)品(從而提高銷量),機(jī)器能夠在故障前得到修復(fù)(從而節(jié)省成本),等等。更重要的是,許多用例都表明,知識圖譜通常與其他人工智能/分析技術(shù)協(xié)同工作——它們提供結(jié)構(gòu)化的支撐,使機(jī)器學(xué)習(xí)更加智能(例如機(jī)器學(xué)習(xí)模型的特征),并使結(jié)果易于人類解釋。正是這種互補(bǔ)性,使得知識圖譜日益成為構(gòu)建智能自適應(yīng)系統(tǒng)的行業(yè)工具包的重要組成部分。

































