隨著醫(yī)療衛(wèi)生信息化迅速發(fā)展
醫(yī)學(xué)研究正步入大數(shù)據(jù)時(shí)代
大數(shù)據(jù)的許多承諾正在醫(yī)療行業(yè)變成現(xiàn)實(shí)
大數(shù)據(jù)的實(shí)時(shí)處理和數(shù)據(jù)分析
可以讓醫(yī)療領(lǐng)域的從業(yè)者
更快更全面的做出決策和行動(dòng)
該領(lǐng)域正在慢慢成熟
隨著云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新技術(shù)水平的提高,各行各業(yè)所累計(jì)的數(shù)據(jù)已經(jīng)呈現(xiàn)指數(shù)級(jí)的增長(zhǎng)?!按髷?shù)據(jù)” 時(shí)代已經(jīng)出現(xiàn)。
近年來(lái),大數(shù)據(jù)解決方案與大數(shù)據(jù)分析工具開(kāi)始被廣泛運(yùn)用于醫(yī)療衛(wèi)生領(lǐng)域。通過(guò)數(shù)據(jù),可以把醫(yī)學(xué)專家積累的寶貴經(jīng)驗(yàn),轉(zhuǎn)化成標(biāo)準(zhǔn)化的知識(shí)基礎(chǔ),做到數(shù)據(jù)驅(qū)動(dòng)醫(yī)療服務(wù),因此從而大大提高服務(wù)能力和效率,解決中國(guó)醫(yī)療領(lǐng)域存在的諸多需求。然而健康醫(yī)療大數(shù)據(jù)究竟指的是何種數(shù)據(jù)?其“大”又體現(xiàn)在何處?
一.大數(shù)據(jù)
大數(shù)據(jù)的類型大致可以分為以下兩種:
第一種類型是通過(guò)對(duì)海量數(shù)據(jù)進(jìn)行分析,獲得巨大價(jià)值的產(chǎn)品、服務(wù)和見(jiàn)解,我們稱之為“動(dòng)詞定義”。
第二種類型是基于多源異構(gòu)、跨域關(guān)聯(lián)的海量數(shù)據(jù)(數(shù)據(jù)量、數(shù)據(jù)形態(tài)、數(shù)據(jù)分析處理方式),通過(guò)分析所產(chǎn)生的決策流程、商業(yè)模式、科學(xué)范式、生活方式和觀念形態(tài)上的顛覆性變化的總和,我們稱之為“名詞定義”。
二.醫(yī)療數(shù)據(jù)
醫(yī)生對(duì)患者診療和治療過(guò)程中產(chǎn)生的數(shù)據(jù),包括患者的基本數(shù)據(jù)、電子病歷、診療數(shù)據(jù)、醫(yī)學(xué)影像數(shù)據(jù)、醫(yī)學(xué)管理、經(jīng)濟(jì)數(shù)據(jù)、醫(yī)療設(shè)備和儀器數(shù)據(jù)等,以患者為中心,成為醫(yī)療數(shù)據(jù)的主要來(lái)源。
三.醫(yī)療數(shù)據(jù)來(lái)源
首先來(lái)講,“醫(yī)療數(shù)據(jù)”的主要來(lái)源有四個(gè)方面,第一種是患者就醫(yī),第二種是臨床研究和科研,第三種是生命制藥,第四種是可穿戴設(shè)備。
第一種“患者就醫(yī)”,源于患者,患者的體征數(shù)據(jù)、患者的化驗(yàn)數(shù)據(jù)、患者的描述,患者的住院數(shù)據(jù)、醫(yī)生對(duì)患者的問(wèn)診數(shù)據(jù)、醫(yī)生對(duì)患者的臨床診治、用藥、手術(shù)等數(shù)據(jù)。
第二種“臨床研究和科研”主要是實(shí)驗(yàn)中產(chǎn)生的數(shù)據(jù),也包含患者產(chǎn)生的數(shù)據(jù)。
第三種“生命制藥”主要是實(shí)驗(yàn)產(chǎn)生的數(shù)據(jù),與用藥相關(guān)的用藥量,用藥時(shí)間,用藥成分,實(shí)驗(yàn)對(duì)象反應(yīng)時(shí)間,癥狀改善表象等數(shù)據(jù),與生命等基因組學(xué)相關(guān)的數(shù)據(jù)。
第四種“可穿戴設(shè)備”主要通過(guò)各種穿戴設(shè)備(手環(huán)、起搏器、眼鏡等)收集人體的各種體征數(shù)據(jù)。
四.醫(yī)療數(shù)據(jù)特性
醫(yī)療數(shù)據(jù)首先它屬于數(shù)據(jù)的一種,所以其大數(shù)據(jù)也必定具備一般的數(shù)據(jù)特性:規(guī)模大、結(jié)構(gòu)多樣、增長(zhǎng)快速、價(jià)值巨大,但是其作為醫(yī)療領(lǐng)域產(chǎn)生的數(shù)據(jù)也同樣具備醫(yī)療性:多態(tài)性、不完整性、冗余性、時(shí)間性、隱私性。
多態(tài)性:醫(yī)療數(shù)據(jù)包含有像化驗(yàn)產(chǎn)生的純數(shù)據(jù),也會(huì)有像體檢產(chǎn)生的圖像數(shù)據(jù)類似心電圖等信號(hào)圖譜,醫(yī)生對(duì)患者的癥狀描述以及跟進(jìn)自己經(jīng)驗(yàn)或者數(shù)據(jù)結(jié)果做出的判斷等文字描述,另外還有像心跳聲,哭聲,咳嗽聲等類似的聲音資料,同時(shí)現(xiàn)代醫(yī)院的數(shù)據(jù)中還有各種動(dòng)畫(huà)數(shù)據(jù)(像胎動(dòng)的影像等)。
不完整性:由于各種原因?qū)е掠泻芏噌t(yī)學(xué)數(shù)據(jù)是不完整的,像醫(yī)生的主觀判斷以及文字描述的不完整,患者治療中斷導(dǎo)致的數(shù)據(jù)不完整,患者描述不清導(dǎo)致的數(shù)據(jù)不完整等。
冗余性:醫(yī)療數(shù)據(jù)量巨大,每天會(huì)產(chǎn)生大量多余的數(shù)據(jù),這給數(shù)據(jù)分析的篩選帶來(lái)了很大困難。
時(shí)間性:大多醫(yī)療數(shù)據(jù)都是具有時(shí)間性、持續(xù)性的,像心電圖,胎動(dòng)思維圖均屬于時(shí)間維度內(nèi)的數(shù)據(jù)變化圖譜。
隱私性:隱私性也是醫(yī)療數(shù)據(jù)的一個(gè)重要特性,同時(shí)也是現(xiàn)在大部分醫(yī)療數(shù)據(jù)不愿對(duì)外開(kāi)放的一個(gè)原因,很多醫(yī)院的臨床數(shù)據(jù)系統(tǒng)都是相對(duì)獨(dú)立的局域網(wǎng)絡(luò),甚至不會(huì)去對(duì)外聯(lián)網(wǎng)。
五、數(shù)據(jù)的處理
數(shù)據(jù)的處理一般分為6個(gè)步驟:挖掘數(shù)據(jù)、收集數(shù)據(jù)、分析數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)、數(shù)據(jù)轉(zhuǎn)化實(shí)用,最終在實(shí)用過(guò)程中產(chǎn)生數(shù)據(jù),如此循環(huán)。
六.醫(yī)療大數(shù)據(jù)的用途
醫(yī)療大數(shù)據(jù)的主要用途有:用藥分析、病因分析、移動(dòng)醫(yī)療、基因組學(xué)、疾病預(yù)防、可穿戴醫(yī)療等。
隨著醫(yī)療大數(shù)據(jù)的發(fā)展和分析方法、人工智能等技術(shù)的不斷革新,能夠準(zhǔn)確利用醫(yī)療大數(shù)據(jù)來(lái)進(jìn)行分析和預(yù)測(cè)的場(chǎng)景會(huì)越來(lái)越多,到時(shí)大數(shù)據(jù)將會(huì)成為醫(yī)療決策的一種重要輔助依據(jù)。
七.醫(yī)療大數(shù)據(jù)
醫(yī)療大數(shù)據(jù)企業(yè)主要分為三類:慢病及健康管理(輔助患者)、臨床決策支持(輔助醫(yī)生)、醫(yī)藥研發(fā)。
醫(yī)療大數(shù)據(jù)的服務(wù)對(duì)象主要有:居民、醫(yī)生、科研、管理機(jī)構(gòu)、公眾健康。
醫(yī)療大數(shù)據(jù)的主要用途有:用藥分析、病因分析、移動(dòng)醫(yī)療、基因組學(xué)、疾病預(yù)防、可穿戴醫(yī)療等。
八.統(tǒng)計(jì)學(xué)在醫(yī)療方面的運(yùn)用
統(tǒng)計(jì)學(xué)是醫(yī)學(xué)科學(xué)研究的重要工具,運(yùn)用概率論與數(shù)理統(tǒng)計(jì)的原理及方法,結(jié)合醫(yī)學(xué)實(shí)際,研究數(shù)字資料的搜集、整進(jìn)行理分析與推斷。正確的統(tǒng)計(jì)分析能夠幫助人們正確認(rèn)識(shí)客觀事物的規(guī)律性,做到胸中有數(shù),有的放矢地開(kāi)展工作,提高工作質(zhì)量。
在統(tǒng)計(jì)分析領(lǐng)域中,有一種用途極其廣泛的特征曲線,叫做接受者操作特性曲線。
得此名的原因在于曲線上各點(diǎn)反映著相同的感受性,它們都是對(duì)同一信號(hào)刺激的反應(yīng),只不過(guò)是在幾種不同的判定標(biāo)準(zhǔn)下所得的結(jié)果而已。
接受者操作特性曲線就是以虛驚概率為橫軸,擊中概率為縱軸所組成的坐標(biāo)圖,和被試在特定刺激條件下由于采用不同的判斷標(biāo)準(zhǔn)得出的不同結(jié)果畫(huà)出的曲線。
在統(tǒng)計(jì)學(xué)中常講到的AUC就是”Area Under the ROC curve“,它的值是介于0.1到1之間,是當(dāng)前分類算法根據(jù)計(jì)算所得的一個(gè)score值,AUC值越大說(shuō)明正樣本越有可能排在負(fù)樣本之前,從而能更好進(jìn)行統(tǒng)計(jì)樣本的分類。
在現(xiàn)有的一個(gè)統(tǒng)計(jì)學(xué)方法中,我們對(duì)樣本的診斷通常是分為兩類,一個(gè)是健康類,另一類是得病類。除了這兩類以外,還存在一種人群叫亞健康人群,如果我們還是按照原有的方法去給病人進(jìn)行分類的話,那么我們所得到的一些結(jié)果可能是具有誤導(dǎo)性的。
在統(tǒng)計(jì)學(xué)中概率樣本的置信區(qū)間是對(duì)樣本的某個(gè)總體參數(shù)的區(qū)間,估計(jì)通常來(lái)說(shuō),比如說(shuō)我們說(shuō)有95%的置信區(qū)間,那么就是說(shuō)測(cè)試者有95%的統(tǒng)計(jì)量是落在置信區(qū)間內(nèi)的。
它其實(shí)展示了這個(gè)參數(shù)的真實(shí)值,有一定概率落在測(cè)試結(jié)果周?chē)囊粋€(gè)程度,也給出被測(cè)量參數(shù)測(cè)試測(cè)量值的一個(gè)可信程度。
怎么去判斷這個(gè)診斷的一個(gè)精確性,我們需要看的是置信區(qū)間的一個(gè)覆蓋率,如果這個(gè)覆蓋率越接近于既定的一個(gè)概率的話,那么這個(gè)方法就越精確。
廣泛搜尋,就是把所有的值結(jié)合在一起,然后去比較它們之間的大小,用這種比對(duì)的方法來(lái)找出最大的不同。
如此可見(jiàn),隨著醫(yī)療服務(wù)提供者越來(lái)越善于從患者數(shù)據(jù)中提取有意義的見(jiàn)解,他們也將學(xué)習(xí)更好的提供治療的方法,提高服務(wù)質(zhì)量。隨著大數(shù)據(jù)技術(shù)領(lǐng)域的成熟,許多組織將受益于運(yùn)營(yíng)的改善、費(fèi)用的降低和健康狀況的改善。
通過(guò)許多方式,大數(shù)據(jù)和人工智能可以幫助解決日益嚴(yán)重的護(hù)理提供者短缺問(wèn)題。醫(yī)療服務(wù)提供商也將充分利用大數(shù)據(jù)技術(shù)為醫(yī)療技術(shù)框架持續(xù)提供動(dòng)力。