久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

醫(yī)療數(shù)據(jù)典型特征及架構(gòu)發(fā)展方向研究

 樂(lè)納己 2019-12-06

前言

醫(yī)療健康產(chǎn)業(yè)目前呈高速發(fā)展?fàn)顟B(tài),,處在互聯(lián)網(wǎng)對(duì)醫(yī)療行業(yè)賦能的關(guān)鍵階段,,由于醫(yī)療行業(yè)數(shù)據(jù)的隱私性較強(qiáng),,通過(guò)傳統(tǒng)方式很難獲取公開(kāi)的醫(yī)療健康數(shù)據(jù)進(jìn)行研究,,根據(jù)阿里云天池比賽賽題設(shè)置研究及提供的脫敏數(shù)據(jù)集著手進(jìn)行分析是比較理想的手段,。本文的目的在于對(duì)醫(yī)院的信息系統(tǒng)流程進(jìn)行思考,,結(jié)合公開(kāi)數(shù)據(jù)集對(duì)于醫(yī)療健康數(shù)據(jù)特征進(jìn)行分析,,從而得出未來(lái)醫(yī)療健康產(chǎn)業(yè)數(shù)據(jù)架構(gòu)模式的發(fā)展方向。

醫(yī)療健康數(shù)據(jù)特征

首先看一下天池比賽近期的兩場(chǎng)比賽,,都是針對(duì)醫(yī)療數(shù)據(jù)進(jìn)行研究并進(jìn)行挖掘的,,采用脫敏數(shù)據(jù),,數(shù)據(jù)來(lái)源于實(shí)際病例因此參考價(jià)值較高:

醫(yī)療數(shù)據(jù)典型特征及架構(gòu)發(fā)展方向研究

醫(yī)療數(shù)據(jù)典型特征及架構(gòu)發(fā)展方向研究

分析兩個(gè)比賽提供的數(shù)據(jù)集形式,,可以明顯感到醫(yī)療數(shù)據(jù)集的特征為數(shù)據(jù)異構(gòu),,即因?yàn)獒t(yī)療檢測(cè)手段的關(guān)系,,數(shù)據(jù)圖像化比例較高,,但是因?yàn)橛?xùn)練數(shù)據(jù)集需要根據(jù)患者其他特征包括性別、年齡,、身高、體重等進(jìn)行統(tǒng)籌分析,,因此也包含了一部分結(jié)構(gòu)化數(shù)據(jù),,因此醫(yī)療數(shù)據(jù)集是典型的非結(jié)構(gòu)化數(shù)據(jù)和結(jié)構(gòu)化數(shù)據(jù)并存的異構(gòu)數(shù)據(jù)集。

常用預(yù)測(cè)算法分析

醫(yī)療數(shù)據(jù)所需要的預(yù)測(cè)結(jié)果一般為分類(lèi),,由于結(jié)果的主要目的并非直接作出定性結(jié)論而更多的是為醫(yī)生提供參考因此二分類(lèi)(即是或不是)和多分類(lèi)(分為幾類(lèi))都有實(shí)際價(jià)值,。

從宮頸癌風(fēng)險(xiǎn)智能診斷比賽要求結(jié)果看,初賽惡性細(xì)胞檢測(cè)算法屬于二分類(lèi)問(wèn)題,,而復(fù)賽宮頸癌惡性細(xì)胞檢測(cè)分類(lèi)算法屬于多分類(lèi)問(wèn)題即需要將檢測(cè)結(jié)果分類(lèi)成5類(lèi)典型宮頸癌,。

數(shù)據(jù)處理方面,需要結(jié)合訓(xùn)練集圖像輸入和醫(yī)生的手工標(biāo)注信息和患者特征信息,,因此深度學(xué)習(xí)算法的普遍使用成為必然,,由于單張CT圖片和標(biāo)注信息只能屬于一個(gè)患者因此JSON文件被采用作為記錄文件形式是非常合適的,單張CT文件對(duì)應(yīng)單個(gè)JSON文件相比結(jié)構(gòu)化表單能夠更好的記錄數(shù)據(jù),。

醫(yī)療數(shù)據(jù)典型特征及架構(gòu)發(fā)展方向研究

從數(shù)據(jù)量大小分析,,數(shù)千份宮頸癌細(xì)胞學(xué)圖片和對(duì)應(yīng)異常鱗狀上皮細(xì)胞位置標(biāo)注,每張數(shù)據(jù)在20倍數(shù)字掃描儀下獲取,,大小300~400M,。因此以訓(xùn)練集包含800張圖片計(jì)算訓(xùn)練數(shù)據(jù)集大小約為273G,非結(jié)構(gòu)化數(shù)據(jù)占了絕大部分,。

從心電人機(jī)智能大賽比賽要求結(jié)果看,,心電異常事件分類(lèi)屬于多分類(lèi)問(wèn)題即需要將檢測(cè)結(jié)果分類(lèi)成訓(xùn)練集中的異常事件種類(lèi),。4萬(wàn)個(gè)醫(yī)療心電樣本,。每個(gè)樣本有8個(gè)導(dǎo)聯(lián),分別是I,,II,,V1,V2,,V3,,V4,V5和V6,。單個(gè)樣本采樣頻率為500 HZ,,長(zhǎng)度為10秒,,單位電壓為4.88微伏(microvolts)。因此在檢測(cè)設(shè)備輸出時(shí)已經(jīng)將數(shù)據(jù)結(jié)構(gòu)化,,相比CT圖片的特征提取和數(shù)據(jù)處理并不需要采用深度學(xué)習(xí)算法,,常規(guī)數(shù)據(jù)預(yù)處理手段即能滿(mǎn)足需求。

從算法角度進(jìn)行分析,,針對(duì)圖片進(jìn)行計(jì)算需要用到深度學(xué)習(xí)算法,,各類(lèi)神經(jīng)網(wǎng)絡(luò)中RNN即卷積神經(jīng)網(wǎng)絡(luò)被使用頻率較高,也是目前圖像識(shí)別的主流算法,。對(duì)兩個(gè)比賽中選手公開(kāi)的算法進(jìn)行統(tǒng)計(jì),,宮頸癌風(fēng)險(xiǎn)智能診斷比賽所采用的算法幾乎全部為基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)算法,差異無(wú)非是所采用的深度學(xué)習(xí)框架不同和基于神經(jīng)網(wǎng)絡(luò)衍生的算法采用不同,。代表數(shù)據(jù)科學(xué)界對(duì)于未來(lái)非結(jié)構(gòu)化醫(yī)療數(shù)據(jù)所采用的算法大方向上是統(tǒng)一的,。心電人機(jī)智能大賽采用算法為機(jī)器學(xué)習(xí)分類(lèi)算法,目前基于決策樹(shù)的分類(lèi)算法占據(jù)絕對(duì)主導(dǎo)地位,,在決策樹(shù)的基礎(chǔ)上衍生的機(jī)器學(xué)習(xí)算法如RF即隨機(jī)森林算法,、GBDT算法和LIGHTLGBM算法又占了多數(shù),LIGHTLGBM算法最普遍被使用,。

從交叉驗(yàn)證集調(diào)參和測(cè)試集驗(yàn)證效果評(píng)估來(lái)說(shuō),,面向癌癥算法和其他如心臟異常情況算法需要關(guān)注的角度不一樣,癌癥因?yàn)闄z測(cè)結(jié)果對(duì)于病員包括家屬心理沖擊很大,,因此對(duì)于測(cè)準(zhǔn)率和召回率的平衡問(wèn)題需要非常關(guān)注,,防止算法過(guò)擬合而造成的草木皆兵情況,同時(shí)也加大了醫(yī)生復(fù)核的工作量,。而心臟異常算法或是其他普通生化指標(biāo)數(shù)據(jù),,則過(guò)擬合的問(wèn)題沒(méi)有那么嚴(yán)重,因?yàn)閿?shù)據(jù)的體量到了一定的程度根據(jù)大數(shù)定理即使過(guò)擬合也會(huì)逐步的傾向于往較為準(zhǔn)確的趨勢(shì)發(fā)展,。特別對(duì)于心臟異常情況判斷,,高測(cè)準(zhǔn)率極其重要,因?yàn)閿?shù)據(jù)的實(shí)時(shí)性強(qiáng)并且隨時(shí)間變化價(jià)值下降速度較快,,即使過(guò)擬合而誤報(bào),,能讓病員或家屬重視總是沒(méi)有錯(cuò)的。

醫(yī)療數(shù)據(jù)處理架構(gòu)方案

根據(jù)以上對(duì)于醫(yī)療健康數(shù)據(jù)特征,、所采用的數(shù)據(jù)挖掘算法分析結(jié)果,,對(duì)于醫(yī)療數(shù)據(jù)處理所用的架構(gòu)方案進(jìn)行研究。

醫(yī)療數(shù)據(jù)結(jié)構(gòu)化和非結(jié)構(gòu)化并存的特征造成需要使用CPU和GPU結(jié)合的異構(gòu)計(jì)算,。從醫(yī)院現(xiàn)實(shí)條件來(lái)說(shuō),,非結(jié)構(gòu)化數(shù)據(jù)的來(lái)源主要為放射性檢查設(shè)備等產(chǎn)生的圖像,如CT每張圖片的大小就約為350M,而生化指標(biāo)包括心電指標(biāo)能夠以結(jié)構(gòu)化數(shù)據(jù)呈現(xiàn),。非結(jié)構(gòu)化數(shù)據(jù)的處理需要消耗大量GPU計(jì)算力,,無(wú)法在現(xiàn)實(shí)情況下要求醫(yī)院對(duì)于本地IDC機(jī)房進(jìn)行大規(guī)模擴(kuò)容并增加GPU集群,。因此從架構(gòu)上來(lái)說(shuō)云-霧-邊協(xié)同會(huì)是比較理想的架構(gòu)方式。

1 邊緣計(jì)算節(jié)點(diǎn)

各類(lèi)檢測(cè)設(shè)備附近的計(jì)算節(jié)點(diǎn)(包括設(shè)備自帶的和醫(yī)生查看結(jié)果的PC機(jī))構(gòu)成協(xié)同體系內(nèi)邊緣計(jì)算節(jié)點(diǎn),,但是現(xiàn)有技術(shù)條件下邊緣計(jì)算的計(jì)算力相對(duì)偏弱,,無(wú)法要求邊緣節(jié)點(diǎn)進(jìn)行大規(guī)模圖像識(shí)別計(jì)算,因此邊緣計(jì)算節(jié)點(diǎn)的主要任務(wù)是數(shù)據(jù)清洗并負(fù)責(zé)向霧端傳送,,由于醫(yī)院的檢查種類(lèi)較多,,各種報(bào)告和圖像信息數(shù)據(jù)格式并不統(tǒng)一,因此預(yù)先在邊緣端進(jìn)行數(shù)據(jù)清洗有助于霧端和云端降低計(jì)算壓力并幫助醫(yī)院未來(lái)實(shí)現(xiàn)統(tǒng)一數(shù)據(jù)中臺(tái)可能,。

2 霧計(jì)算節(jié)點(diǎn)

醫(yī)院現(xiàn)有本地IDC機(jī)房可以考慮作為霧計(jì)算節(jié)點(diǎn),,霧計(jì)算節(jié)點(diǎn)目前對(duì)于醫(yī)療行業(yè)尤其重要,雖然5G技術(shù)在時(shí)延上和傳輸速度上都滿(mǎn)足大規(guī)模數(shù)據(jù)傳輸要求但是由于醫(yī)院的環(huán)境較為復(fù)雜,,如果邊緣計(jì)算節(jié)點(diǎn)的數(shù)據(jù)需要直接傳送到云端則在網(wǎng)絡(luò)層會(huì)極其依賴(lài)無(wú)線通信手段,,而無(wú)線通信特別是5G較高的頻率在全方位全覆蓋性的邊緣計(jì)算節(jié)點(diǎn)與云端通信過(guò)程中是否會(huì)對(duì)醫(yī)療設(shè)備產(chǎn)生干擾和其他預(yù)料之外的問(wèn)題需要在實(shí)際應(yīng)用中再研究,短期內(nèi),,邊緣計(jì)算節(jié)點(diǎn)數(shù)據(jù)通過(guò)有線通信手段傳送到霧計(jì)算節(jié)點(diǎn)是最合適的方法,。

霧計(jì)算節(jié)點(diǎn)的現(xiàn)實(shí)作用非常多,如集中邊緣計(jì)算節(jié)點(diǎn)數(shù)據(jù)和區(qū)分應(yīng)用場(chǎng)景并進(jìn)行計(jì)算,,特別如果個(gè)別醫(yī)院本地IDC服務(wù)器集群配置較強(qiáng)則可以就地對(duì)于結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘,、訓(xùn)練模型并進(jìn)行預(yù)測(cè)工作而不必傳送到云端。此外從通信角度,,霧端作為統(tǒng)一數(shù)據(jù)出口向云端無(wú)線傳輸數(shù)據(jù)可以最大可能避免無(wú)線信號(hào)對(duì)于醫(yī)療設(shè)備可能的干擾作用,。短期5G未普及情況或者費(fèi)用較高的情況下可以采用本地IDC與云端專(zhuān)線通信方式作為過(guò)渡手段。

在具有多個(gè)院區(qū)的醫(yī)院中,,不同地域的本地IDC作為霧端能夠進(jìn)行異地容災(zāi)建設(shè),。多個(gè)本地IDC機(jī)房在不同地域互為災(zāi)備,確保單一節(jié)點(diǎn)故障能夠及時(shí)遷移確保業(yè)務(wù)不中斷及存儲(chǔ)數(shù)據(jù)的可用性和完整性,。

3 云端

云計(jì)算平臺(tái)能夠很好的解決醫(yī)院異構(gòu)數(shù)據(jù)計(jì)算需求大但又短時(shí)間無(wú)法配置大規(guī)模GPU集群的現(xiàn)實(shí)情況,,CT等放射性檢查設(shè)施產(chǎn)生的高清圖像文件及其他需要采用深度學(xué)習(xí)算法的數(shù)據(jù)可以統(tǒng)一通過(guò)霧端傳輸?shù)皆贫诉M(jìn)行計(jì)算,云計(jì)算彈性伸縮的優(yōu)勢(shì)在面對(duì)醫(yī)院計(jì)算力需求隨患者數(shù)量呈時(shí)間性波動(dòng)的情況時(shí)也可以最大可能的減小醫(yī)院異構(gòu)計(jì)算成本,,GPU集群的配置通過(guò)彈性伸縮在醫(yī)院計(jì)算力需求大時(shí)自動(dòng)擴(kuò)充計(jì)算節(jié)點(diǎn),,而需求小時(shí)自動(dòng)減小集群內(nèi)虛擬機(jī)規(guī)模。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶(hù)發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買(mǎi)等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶(hù) 評(píng)論公約

    類(lèi)似文章 更多