隨著大數據時代的到來,,移動健康App的普及應用,、互聯網與醫(yī)療的深度融合使得醫(yī)療數據呈指數級增長趨勢,基于基因測序,、生物分析,、云計算等技術的進步與發(fā)展,醫(yī)療健康大數據被廣泛應用于臨床決策支持,、藥物研發(fā),、遠程病人數據分析,、公共衛(wèi)生領域等方面。由于醫(yī)療數據分布廣而無序,、醫(yī)學信息的極度不對稱及相關數據標準的缺乏,,并不能確保數據采集的準確性、完整性,、和及時性,,對于醫(yī)療健康大數據應用的關鍵要素—數據質量也就無法保證。在現階段醫(yī)療數據劇增時期,,大數據治理顯得尤為重要,。 1 大數據治理概述 《DAMA 數據管理知識體系指南》中將數據治理(Data Governance)定義為數據資產管理的權威性和控制性活動,是對數據管理的高層計劃與控制,,包括在數據管理和使用層面進行規(guī)劃,、監(jiān)督和強制執(zhí)行。我國ITSS WG1則認為數據治理包含對信息利益相關者的評估,、有效助力業(yè)務的決策機制和方向及對合規(guī)績效的監(jiān)督,。數據治理多關注過程,即管理職責的范圍和對數據進行有效管理所采取的政策和方法,。大數據治理則是廣義信息治理計劃的一部分,,制定與大數據相關的數據優(yōu)化、隱私保護或數據變現的政策和目標,。數據治理提供相關政策,、應用方法等保證數據的有效管理;而大數據治理更關注通過運用不同技術工具挖掘大數據應用價值,,映射到醫(yī)療領域則是通過大數據治理為醫(yī)療健康大數據的融合,、共享營造安全和諧發(fā)展環(huán)境,從而推進醫(yī)療健康大數據各業(yè)務領域和層級的創(chuàng)新應用,。 1.1 國外現狀 國際相關組織在數據治理領域進行相關研究與實踐,,如ISO 38500的IT治理模型、國際數據管理協會(DAMA)關于數據治理的七大環(huán)境要素,、數據治理協會(DGI)的數據治理框架模型,、國際商業(yè)機器公司(IBM)提出的數據治理成熟度模型等。美國一項調查顯示,,大多數醫(yī)療保健機構并未開展數據治理相關項目的研究,;已開展的研究則多關注于數據傳輸標準制定和患者隱私安全,較局限于具有直接強制性,、合規(guī)性的領域,;并提出有效的數據治理框架應包括原則、政策,、標準和過程,、技術等元素,。也有學者從IT數據治理出發(fā)提出數據治理的五大決策域,即數據原則,、數據質量,、元數據、數據獲取的便捷性和數據生命周期,。此外,,還有機構通過實施數據倉庫治理計劃確保數據的完整性和患者的隱私安全。 1.2 國內現狀 我國數據治理相關研究較多,,且多應用于通信,、金融、互聯網等領域,,在醫(yī)療領域研究較少,大多只停留在理論層面,。有學者認為戰(zhàn)略,、機制、專題及實施構成數據治理體系的完整框架,;廖宇峰提出大數據治理參考模型的4大要素:原則,、關鍵域、實施和評估,,涵蓋大數據治理工作的方方面面,。我國ITSS WG1組織曾提出數據治理三大關鍵要素:數據治理準則、數據治理域和數據治理實施方法論,,并在國際上形成共識,。此外,以時間,、空間,、語義和語境構成的全局數據也被認為是大數據時代數據治理的新范式,全局數據下的數據治理是關注信息系統執(zhí)行層面的體系,,通過流程,、策略、標準和組織的有效組合來保證信息化建設的全過程監(jiān)管,,從而解決提高數據質量,。 2 醫(yī)療健康大數據資源特性及治理問題 2.1 醫(yī)療健康大數據來源及特征 根據醫(yī)療健康大數據的來源及作用效果不同,可分為四大類:診療輔助類:包括亞健康及患病人群通過醫(yī)療機構,、第三方檢驗機構或網絡平臺參與病情的咨詢,、預約、診斷,、治療等過程所產生的醫(yī)療數據,;健康監(jiān)測類:指基于移動物聯網對個人身體體征及日常行為進行監(jiān)測的生命體征類數據,,常被應用于慢性病患者的自我管理;公共衛(wèi)生類:主要指區(qū)域性的醫(yī)療服務平臺,、公共衛(wèi)生信息系統等產生的醫(yī)療數據,;定向生物醫(yī)學類:主要是關于新藥品研發(fā)、生物標本和基因測序的信息,,多應用于個性診療,、精準醫(yī)療、臨床藥物實驗等醫(yī)學研究,。 醫(yī)療健康大數據除具有大數據5V(volume,、variety、value,、velocity,、veracity)特征外,還具備自身鮮明特性,,即階段性,、時效性和冗余性:階段性:由于醫(yī)療數據種類繁多、收集較為廣泛,,加之部分醫(yī)療數據帶有主觀性質,,醫(yī)療信息存在明顯的階段性特征;時效性:疾病的發(fā)生和發(fā)展過程及醫(yī)學影像,、病理等信息有很強的時間維度屬性,,床旁監(jiān)護等儀器產生的數據也具有很強的時效性;冗余性:信息孤島,、信息煙囪及疾病的多發(fā)性常導致醫(yī)療數據存在大量垃圾數據,,如常見病病情描述、慢性病患者的重復性檢查等,。 2.2 面臨問題 現階段我國醫(yī)療行業(yè)數據治理主要存在以下問題:一是缺乏有效管理規(guī)范體系:現有醫(yī)療數據管理辦法較散,,缺少較為完善的針對醫(yī)療健康大數據所制定的治理體系,且多數醫(yī)療機構并未采取必要的治理措施,。二是應用數據質量較低:醫(yī)療健康大數據多為非結構/半結構數據,,如互聯網云端數據、移動健康設備采集數據等,,各醫(yī)療衛(wèi)生應用平臺存在大量的異構數據,,導致挖掘醫(yī)療健康大數據時采集的原始數據質量差,且數據處理過程繁瑣,,影響最終的應用數據質量,。三是數據共享困難:多機構/企業(yè)/組織/政府間醫(yī)療信息的共享是開展數據挖掘項目的必要條件,但目前醫(yī)療數據開放程度小,作用并不顯著,。四是數據安全隱患較大:網上預約診療,、健康監(jiān)測設備的普及應用必然加大醫(yī)療健康大數據泄露風險,雖已有相關的隱私保護條例,,但仍需從大數據角度出發(fā),,系統化建立醫(yī)療健康大數據的安全防范措施。 3 醫(yī)療健康大數據治理體系 醫(yī)療健康大數據治理體系是實施大數據治理的基礎,,應針對醫(yī)療健康大數據特性及數據管理現存問題,,從大數據視角出發(fā),系統化,、規(guī)范化,、科學性的建立醫(yī)療健康大數據治理體系。完整的醫(yī)療健康大數據治理體系應包含五方面:原則,、核心指標,、關鍵組件、技術及大數據治理評估,,具體如圖1所示,。原則指導著大數據治理全過程,是實現治理目標的基本指導思想,,包括戰(zhàn)略一致、風險可控,、運營合規(guī)和績效提升,;核心指標是醫(yī)療健康大數據治理應實現的目標,組織關于大數據治理的所有活動都應圍繞該目標進行實施,,其中應用服務,、數據質量、數據認責,、數據安全與合規(guī)性為大數據治理的重要參考指標,;關鍵組件是實施大數據治理的重點內容,包括組織,、標準,、業(yè)務策略和流程;此外,,為確保高的數據質量,、可用性及安全性,組織急需建立大數據環(huán)境下的IT基礎架構,,從而為大數據治理提供技術支撐,;對大數據治理實施過程及治理效果進行評估可深入了解組織當前治理現狀,便于為及時調整、優(yōu)化實施方案提供管理決策,。
4 醫(yī)療健康大數據治理實施步驟 4.1 成立大數據治理組織 機構啟動數據治理項目的首要步驟是設計健全的大數據治理組織結構,,它是全面開展治理工作的基礎。定義角色與職責:治理團隊成員應來源于不同層次,,組織需嚴格劃分成員類別并分配特定職責,,執(zhí)行個人參與數據治理問責制。團隊成員包括管理人員,、審計人員,、制度/標準制定人員、業(yè)務人員,、技術人員和評估人員,;組織角色可分為治理委員會、管理委員會,、業(yè)務組,、技術組、評估組,。培訓與教育:組織各成員需定期參與培訓活動及繼續(xù)教育,,目的是將大數據治理提升到戰(zhàn)略層面,使各類人員樹立大數據治理意識及權責意識,,提高大數據治理水平,。戰(zhàn)略與規(guī)劃:通過評估現階段大數據治理現狀,依照四大原則制定或調整大數據治理的指導綱領及戰(zhàn)略規(guī)劃,;并對機構相關業(yè)務,、管理、決策等數據的全生命周期各階段進行分析,,識別各自需求,,設計規(guī)劃方案,其中規(guī)劃需與機構總體發(fā)展戰(zhàn)略,、大數據發(fā)展戰(zhàn)略相匹配,,且各階段參與人員也需要參與大數據規(guī)劃制定。制度與組織變革管理:制定大數據治理各階段管理制度,,并根據治理環(huán)境變化對組織制度或流程進行適當變革,。 4.2 建立大數據標準體系 醫(yī)療健康大數據必須遵循統一標準進行管理,才能有效保證各業(yè)務部門,、系統間數據的規(guī)范性,、流通性及共享性,是機構進行大數據治理的重要環(huán)節(jié),。大數據治理相關標準分為基礎性和應用性標準,,包括數據定義與分類(元數據),、主數據、參考數據(數據字典),、數據模型,、管理與技術類、質量評估類等內容,,管理委員會及業(yè)務組人員可參考已有標準,,并與現有醫(yī)療系統、業(yè)務流程相結合,,開展醫(yī)療健康大數據標準體系的建立,、實施、修改等工作,。 4.3 制定業(yè)務策略和流程管理 建立和執(zhí)行圍繞醫(yī)療健康大數據生命周期的業(yè)務策略及流程管理是大數據治理實踐基礎,,組織需定義與數據相關的業(yè)務規(guī)則,控制數據的訪問與交換,,建立持續(xù)的監(jiān)測機制,,并對業(yè)務流程進行監(jiān)管。元數據管理:明確元數據管理策略,,確定實現元數據管理策略所需的元數據集成體系結構,,結合業(yè)務需求選擇合適的業(yè)務元數據和技術元數據管理工具,并制定相應的元數據管理策略進行全面的元數據管理,??蓞⒖荚獢祿芾沓墒於饶P停瑑?yōu)化,、提升元數據管理水平,。數據生命周期管理:大數據時代管理重點是以相對可控的成本創(chuàng)造更多價值,一般包括數據生成,、傳輸、存儲,、清洗,、集成、應用和數據銷毀等過程,?;诖髷祿卫響?zhàn)略規(guī)劃,根據數據質量及應用情況,,對大數據生命周期進行管理,,是實現醫(yī)療健康大數據治理目標的重要過程,包括主數據,、參考數據的管理等,。流程監(jiān)管:是對整個大數據治理流程進行監(jiān)控和管理,保證治理項目實施進度及評估質量,包括流程目標,、流程任務,、流程分級的管理。質量與安全管理:組織需依據風險可控和數據的合規(guī)性原則,,建立相應的大數據質量管控和安全規(guī)范及策略,,定期檢查、評估各階段數據質量及安全可靠程度,,保證大數據的質量和安全,。質量管理可分為元數據質量管理(真實性/完整性等)和過程質量管理(存儲/傳輸/集成/分析/應用質量等);安全管理包括基礎數據的使用安全,、終端訪問安全等,。應用服務管理:應用服務管理是對醫(yī)療健康大數據深度加工、分析和應用的管理,,從而提供應用創(chuàng)新服務,,使之更好地服務于公眾、管理決策人員等,。 4.4 建立大數據基礎架構 大數據環(huán)境下,,為保障治理工作的順利實施,除各階段必要的信息技術或工具外,,如質量控制,、數據保護/訪問、審計/安全工具等,,組織還需搭建大數據基礎架構,,包括大數據集成基礎設施、大數據分析平臺,、大數據處理平臺,、大數據質量監(jiān)控平臺等。 4.5 醫(yī)療健康大數據治理評估 大數據治理實施需與評估交叉配合完成,,組織需對治理實施過程及效果進行評估,。醫(yī)療健康大數據治理評估方法可分為成熟度評估和審計,前者反映組織在大數據治理規(guī)劃設計,、流程管理,、保障機制(制度/標準/技術)等方面的水平,可采用IBM數據治理成熟度模型度量數據治理能力,;后者是組織內部審計人員基于全局的視角,,依據相關法律、法規(guī),、政策,、制度及標準對大數據治理環(huán)境,、治理現狀進行獨立、客觀的監(jiān)督,、風險分析,、評價和咨詢,利于提升組織大數據治理能力,,保證治理目標的實現,。 5 小結 個人醫(yī)療健康信息的激增、醫(yī)療數據互聯融合的發(fā)展趨勢,,對隱私安全和數據質量提出新的挑戰(zhàn),,對醫(yī)療健康大數據進行治理必然引發(fā)醫(yī)療行業(yè)各機構/組織的共鳴。醫(yī)療健康大數據治理是提高醫(yī)療行業(yè)大數據質量,、應用水平及信息化管理水平的有效手段,,加速“數據即服務”理念的深入理解和普及,同時也是醫(yī)療衛(wèi)生事業(yè)健康,、穩(wěn)步發(fā)展的重要環(huán)節(jié),。技術的進步與發(fā)展為醫(yī)療健康大數據治理提供可能,但治理意識的培育和強化,、參與主體的能動性才是實現醫(yī)療健康大數據治理的根本保障,。 (來源:《中國數字醫(yī)學》雜志2016年第9期 作者:常朝娣 陳敏 單位:華中科技大學同濟醫(yī)學院醫(yī)藥衛(wèi)生管理學院) |
|