大數據會讓我們避免下一場瘟疫么?
這一幕將不僅僅只出現在好萊塢的科技大片里。事實上,未來真正的大數據積累應該是可以提前預測人的疾病情況,因為疾病不是一天出現的,而是天長日久累計出來的,各種數據一定發(fā)生變化。所以在大數據之上的慢數據才是真正有價值的,那么,究竟大數據和慢數據會對我們的生活產生什么樣的影響呢?
挖掘“慢數據”的價值
現在每天產生大量數據,但很多是沒有價值的數據,這些數據沒有顯示出足夠的威力??v觀相關行業(yè)里,醫(yī)療行業(yè)尤其是流行病的疾控和預警是表現最為明顯的也是最需要急切的,因為健康和每個人、每個家庭、每個城市、每個國家都息息相關。
例如我們每天刷牙,如果能夠通過牙刷等人工智能設備收集唾液的一些樣本,通過體溫等指標這樣的“慢數據”才具有醫(yī)學和參考價值。醫(yī)學領域“生理數據”比“物理數據”更有實用價值。
疾控現狀:
由于現代醫(yī)學技術的高度發(fā)達和迅猛發(fā)展,在大多數人心里,大規(guī)模流行病的發(fā)生好像是很遙遠的事。但事實證明,它從不曾離我們遠去。
據世界衛(wèi)生組織數據,在2009年發(fā)生的那場H1N1流感(國內又稱豬流感)里,全球造成至少12220人死亡,一周內新增死亡人數704人,全球股市因此下跌10%左右。
有數據顯示,在全球,隨著人口增長和日益加快的城市化進程致使數億人居住環(huán)境衛(wèi)生惡化,疾病隨著人口的增長以及人們向擁擠的城市遷移而肆虐。容易在人群中傳播的疾病如流感都容易在城市中流行。
在這其中,中國是表現最為明顯的國家之一,由于人口眾多,隨著經濟的發(fā)展,人員跨區(qū)域流動性加大、城市化加劇、城市人口密度增加、結構變化等都加劇了流行病發(fā)生、傳播、蔓延的幾率及傳播速度。同時科學技術的進步、醫(yī)療手段的提高、抗生藥物等廣泛使用,也加速了病毒、細菌等病原體的擴散、變異和進化,出現一系列新的致命新病原體感染傳播。
過去十多年發(fā)生的各種大規(guī)模流行病歷歷在目:SARS、甲型H1N1流感、手足口病、H7N9禽流感等,幾乎每隔一段時間,流行病就會以不同的形式卷土重來一次。
去年衛(wèi)生部發(fā)言人就曾提到:“中國面臨傳統(tǒng)流行病威脅持續(xù)存在、新發(fā)流行病不斷出現的嚴峻形勢。”基于原有監(jiān)控系統(tǒng)和流程的衛(wèi)生防疫系統(tǒng)已經有些力不從心跟不上節(jié)奏,基于互聯(lián)網大數據的流行病監(jiān)測就變得非常重要且非常緊迫。
美國管理咨詢公司麥肯錫全球研究院(MGI)預測,如果美國的醫(yī)療行業(yè)能夠有效利用不斷增長的大數據來提高效率和質量,那么每年可創(chuàng)造超過3000億美元的額外價值,可以挽救無數本可不應該失去的生命。
如何監(jiān)控預防:
我們應該如何利用現代科技和互聯(lián)網技術避免下一場H1N1的發(fā)生呢?大數據可以做到嗎?
首先發(fā)現:在基于海量使用用戶搜索、社交app、LBS等產生的大數據,還有用戶人口統(tǒng)計學等數據,結合原有疾病監(jiān)控系統(tǒng)中的流行疾病法定報告數據、流行疾病病例,結合疾病、環(huán)境數據,及時發(fā)現并繪制出流行病風險地圖。
比如,國內H1N1最早發(fā)現于廣東地區(qū),當這個地區(qū)搜索發(fā)熱等關鍵詞超過一定數量時,結合醫(yī)院和疾控中心的流行病監(jiān)控等數據,就能很快發(fā)現并定位新的流行病的發(fā)生及相關情況評估。
確定情況:在基于搜索數據和LBS數據,分析不同時空尺度人口流動性、移動模式和參數進一步結合病原學、人口統(tǒng)計學、地理、氣象和人群移動遷徙、地域之間等因素和信息,建立流行病時空傳播模型,確定流感等流行病在各流行區(qū)域間傳播的時空路線和規(guī)律,得到更加準確的態(tài)勢評估、預測。
同時機器學習(machine learning)和人工智能等技術的發(fā)展,促進了流行病監(jiān)測、傳播動力學研究和風險評估,并成為傳統(tǒng)分析方式的有效增強和升級,更加準確的判斷下一場流行病的發(fā)生區(qū)域等信息。
預警及應對:結合LBS、社交app相關信息,從更加微觀尺度上更加精準的進行流行病監(jiān)測和預測,同時通過權威途徑及時告知流行病的發(fā)展狀況和預防措施,讓用戶了解周邊流行病活動真實情況,為生活提供可信參考,避免傳謠信謠,以便及時采取疫苗接種等預防措施。公共衛(wèi)生、醫(yī)療機構、衛(wèi)生行政部門人員將更容易獲取各類疾病發(fā)生風險的動態(tài)分析結果,促進醫(yī)療人員、疫苗等資源優(yōu)化和配置,有力的阻擊病毒和事態(tài)的進一步惡化和擴撒,成功的避免下一次大規(guī)模的流行病的發(fā)生。
著名的《大數據時代》(維克托·邁爾-舍恩伯格、肯尼思·庫克耶著)里就記載了谷歌怎么用大數據來預測病毒爆發(fā)的:2009年爆發(fā)了新的流感病毒,如果按照原有處理流程是這樣的:醫(yī)生發(fā)現病例——報告疾控中心——公共衛(wèi)生專家分析信息——采取應對措施,但是在這個流程中會存在信息和數據滯后,這種滯后導致公共衛(wèi)生機構在疫情爆發(fā)的關鍵時期反而無所適從。
谷歌通過建立在大數據的基礎上***的解決了這個問題,它通過觀察人們在網上的搜索記錄來完成這個預測,它保存了多年來所有的搜索記錄,而且每天都會收到來自全球超過30億條的搜索指令,如此龐大的數據資源足以支撐和幫助它完成這項工作。通過對海量數據進行分析,獲得以一種***的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見。這就是大數據的力量和魅力。
相信隨著大數據和慢數據挖掘、人工智能技術的發(fā)展,成功預測并避免下一次瘟疫不再是夢想!
























