1. 基礎(chǔ)理論知識1.1. 數(shù)據(jù)數(shù)據(jù)(Data),,或稱數(shù)據(jù)資源,,是指所有能輸入到計算機并被計算機程序處理的符號的介質(zhì)的總稱,是用于輸入電子計算機進行處理,,具有一定意義的數(shù)字,、字母、符號和模擬量等的通稱,,是組成信息系統(tǒng)的最基本要素,。 1.2. 大數(shù)據(jù)大數(shù)據(jù)(Big Data)指一種規(guī)模大到在獲取、存儲,、管理,、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫軟件工具能力范圍的數(shù)據(jù)集合,具有海量的數(shù)據(jù)規(guī)模,、快速的數(shù)據(jù)流轉(zhuǎn),、多樣的數(shù)據(jù)類型和價值密度低四大特征。 大數(shù)據(jù)包括結(jié)構(gòu)化,、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),,非結(jié)構(gòu)化數(shù)據(jù)越來越成為數(shù)據(jù)的主要部分。大數(shù)據(jù)技術(shù)的不在于掌握龐大的數(shù)據(jù)信息,,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理,。換而言之,如果把大數(shù)據(jù)比作一種產(chǎn)業(yè),,那么這種產(chǎn)業(yè)實現(xiàn)盈利的關(guān)鍵,,在于提高對數(shù)據(jù)的“加工能力”,通過“加工”實現(xiàn)數(shù)據(jù)的“增值”,。 1.3. 數(shù)據(jù)源數(shù)據(jù)源(Data Source)是提供某種所需要數(shù)據(jù)的器件或原始媒體,。在數(shù)據(jù)源中存儲了所有建立數(shù)據(jù)庫連接的信息。就像通過指定文件名稱可以在文件系統(tǒng)中找到文件一樣,,通過提供正確的數(shù)據(jù)源名稱,,可以找到相應(yīng)的數(shù)據(jù)庫連接。 常見的數(shù)據(jù)源類型有:關(guān)系數(shù)據(jù)庫,、時序數(shù)據(jù)庫,、鍵值存儲數(shù)據(jù)庫、列存儲數(shù)據(jù)庫,、文檔數(shù)據(jù)庫,、圖形數(shù)據(jù)庫,、搜索引擎存儲、對象數(shù)據(jù)庫,、MPP數(shù)據(jù)庫,、大數(shù)據(jù)庫、工具或文件等,。 1.4. 數(shù)據(jù)倉庫數(shù)據(jù)倉庫(Data Warehouse)是為企業(yè)所有級別的決策制定過程,,提供所有類型數(shù)據(jù)支持的數(shù)據(jù)集合。一般情況下,,它是主要職能是數(shù)據(jù)存儲,,為了給組織輸出分析性報告,為支撐決策的目的而創(chuàng)建的,。同時,,也可以提供指導(dǎo)業(yè)務(wù)流程改進,監(jiān)視和管理數(shù)據(jù)接入時間,、數(shù)據(jù)成本,、數(shù)據(jù)質(zhì)量。 由于數(shù)據(jù)倉庫是數(shù)據(jù)匯總的數(shù)據(jù)存儲空間,,一般情況下,,會對數(shù)據(jù)倉庫進行分層,常見分層有貼源層(ODS),、數(shù)據(jù)整合層(EDW)、主題模型層(FDM),、共性計算層/共性加工層(ADM),、應(yīng)用集市層/數(shù)據(jù)集市層(ADS)。每種分層組合會根據(jù)具體實施情況,,完成數(shù)據(jù)倉庫分層設(shè)計,。下圖是實施常見的分層架構(gòu)圖。 圖1 數(shù)據(jù)倉庫分層架構(gòu)圖 1.5. 數(shù)據(jù)中臺數(shù)據(jù)中臺是一套可持續(xù)“讓企業(yè)的數(shù)據(jù)用起來”的機制,,一種戰(zhàn)略選擇和組織形式,是依據(jù)企業(yè)特有的業(yè)務(wù)模式和組織架構(gòu),,通過有形的產(chǎn)品和實施方法論支撐,,構(gòu)建一套持續(xù)不斷把數(shù)據(jù)變成資產(chǎn)并服務(wù)于業(yè)務(wù)的機制。數(shù)據(jù)中臺需要具備數(shù)據(jù)匯聚整合,、數(shù)據(jù)提純加工,、數(shù)據(jù)服務(wù)可視化、數(shù)據(jù)價值變現(xiàn)四個核心能力,,讓組織的員工,、客戶,、伙伴能夠方便地應(yīng)用數(shù)據(jù)。 數(shù)據(jù)中臺是一種概念,、理論,,并不是一個獨立系統(tǒng)的名稱,它是在數(shù)據(jù)倉庫(數(shù)據(jù)中心)的基礎(chǔ)上引申出來的新的概念,。職能定位是所有數(shù)據(jù)的匯聚之所,,以及為上層數(shù)據(jù)應(yīng)用提供支撐的平臺基礎(chǔ),即數(shù)據(jù)賦能,。 若想全面了解數(shù)據(jù)中臺,,區(qū)分數(shù)據(jù)倉庫和數(shù)據(jù)中臺的異同,需要從數(shù)據(jù)來源,、建設(shè)目標,、數(shù)據(jù)應(yīng)用三個層面進行說明。
數(shù)據(jù)倉庫的數(shù)據(jù)來源主要是業(yè)務(wù)數(shù)據(jù)庫,,數(shù)據(jù)格式也是以結(jié)構(gòu)化數(shù)據(jù)為主,。 數(shù)據(jù)中臺的數(shù)據(jù)來源期望是全域數(shù)據(jù)包括業(yè)務(wù)數(shù)據(jù)、日志數(shù)據(jù),、埋點數(shù)據(jù),、爬蟲數(shù)據(jù)、外部數(shù)據(jù)等,。數(shù)據(jù)格式可以是結(jié)構(gòu)化數(shù)據(jù),,也可以是非結(jié)構(gòu)化的數(shù)據(jù)。
數(shù)據(jù)倉庫建設(shè)主要用來做BI報表,,目的性單一,,只抽取和清洗該相關(guān)分析報表用到基礎(chǔ)數(shù)據(jù)。若新增一張報表,,需要從ODS到ADS做一遍數(shù)據(jù)加工,。 建立數(shù)據(jù)中臺的目標是為了融合組織的全部數(shù)據(jù),打通數(shù)據(jù)之間的隔閡,,消除數(shù)據(jù)標準和口徑不一致的問題,。數(shù)據(jù)中臺通常會對來自多方面的的基礎(chǔ)數(shù)據(jù)進行清洗,按照主題域概念建立多個以事物為主的主題域比如用戶主題域,,商品主題域,,渠道主題域,門店主題域等等,。數(shù)據(jù)中臺遵循三個one的概念:One Data, One ID, One Service,,基于該理念,數(shù)據(jù)中臺不僅僅是匯聚企業(yè)各種數(shù)據(jù),,而且讓這些數(shù)據(jù)遵循相同的標準和口徑,,對事物的標識能統(tǒng)一或者相互關(guān)聯(lián),,并且提供統(tǒng)一的數(shù)據(jù)服務(wù)接口,完成數(shù)據(jù)賦能,。
數(shù)據(jù)倉庫主要是面向BI報表,,數(shù)據(jù)應(yīng)用的建設(shè)就是傳統(tǒng)煙囪式建設(shè),每次都從頭再來的開發(fā)方式,。 數(shù)據(jù)中臺上的數(shù)據(jù)應(yīng)用不僅僅只是面向于BI報表,,更多面向營銷推薦、用戶畫像,、AI決策分析,、風(fēng)險評估、經(jīng)營分析等,。而且這些數(shù)據(jù)應(yīng)用,,基于數(shù)據(jù)中臺已經(jīng)匯總、沉淀完畢,,能快速為相關(guān)系統(tǒng)提供數(shù)據(jù),,完成快速數(shù)據(jù)開發(fā)工作,同時之前工作成果都能被多個應(yīng)用共享,。 1.6. 數(shù)據(jù)管理數(shù)據(jù)管理(Data Management)是為實現(xiàn)數(shù)據(jù)和信息資產(chǎn)價值的獲取,、控制、保護,、交付以及提升,,對政策、實踐和項目所做的計劃,、執(zhí)行和監(jiān)督,。 一般包含以下三層含義: (1)數(shù)據(jù)管理包含一系列業(yè)務(wù)職能,包括政策,、計劃、實踐和項目的計劃和執(zhí)行,; (2)數(shù)據(jù)管理包含一套嚴格的管理規(guī)范和過程,,用于確保業(yè)務(wù)職能得到有效履行; (3)數(shù)據(jù)管理包含多個由業(yè)務(wù)領(lǐng)導(dǎo)和技術(shù)專家組成的管理團隊,,負責落實管理規(guī)范和過程,。 1.7. 數(shù)據(jù)治理國際數(shù)據(jù)管理協(xié)會(DAMA)給出的定義:數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動集合。 《GBT34960.5-2018 信息技術(shù)服務(wù) 治理 第5部分》給出的定義:數(shù)據(jù)資源及其應(yīng)用過程中相關(guān)管控活動,、績效和風(fēng)險管理的集合,。數(shù)據(jù)治理域包括數(shù)據(jù)管理體系和數(shù)據(jù)價值體系。 國際數(shù)據(jù)治理研究所(DGI)給出的定義:數(shù)據(jù)治理是一個通過一系列信息相關(guān)的過程來實現(xiàn)決策權(quán)和職責分工的系統(tǒng),,這些過程按照達成共識的模型來執(zhí)行,,該模型描述了誰(Who)能根據(jù)什么信息,,在什么時間(When)和情況(Where)下,用什么方法(How),,采取什么行動(What),。 另一種解釋: 俠義數(shù)據(jù)治理為了滿足內(nèi)部風(fēng)險管理和外部監(jiān)管合規(guī)的需要。通過一系列信息相關(guān)的過程來實現(xiàn)決策權(quán)和職責分工的系統(tǒng),。 廣義的數(shù)據(jù)治理是對數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動集合(規(guī)劃,、監(jiān)控和執(zhí)行),指導(dǎo)其他數(shù)據(jù)管理職能如何執(zhí)行,,在高層次上執(zhí)行數(shù)據(jù)管理制度,。組織為實現(xiàn)數(shù)據(jù)資產(chǎn)價值最大化所開展的一系列持續(xù)工作過程,明確數(shù)據(jù)相關(guān)方的責權(quán),、協(xié)調(diào)數(shù)據(jù)相關(guān)方達成數(shù)據(jù)利益一致,、促進數(shù)據(jù)相關(guān)方采取聯(lián)合數(shù)據(jù)行動。 最終目標是提升數(shù)據(jù)的價值,,數(shù)據(jù)治理非常必要,,是企業(yè)實現(xiàn)數(shù)字戰(zhàn)略的基礎(chǔ),它是一個管理體系,,包括組織,、制度、流程,、工具,。 再來一種解釋: 數(shù)據(jù)治理(Data Governance)是指將數(shù)據(jù)作為企業(yè)資產(chǎn)而展開的一系列的具體化工作,是對數(shù)據(jù)的全生命周期管理,。 我的理解: 數(shù)據(jù)治理從詞組組成上分數(shù)據(jù)和治理,,治理有改革的意思。既然有改革,,那么就需要有相關(guān)制度,、流程、工具完成對數(shù)據(jù)的重新梳理,、歸類,,以滿足數(shù)據(jù)的使用要求。 數(shù)據(jù)治理的目標是提高數(shù)據(jù)質(zhì)量(準確性和完整性),,保證數(shù)據(jù)的安全性(保密性,、完整性及可用性),實現(xiàn)數(shù)據(jù)資源在各組織機構(gòu)部門的共享,;推進信息資源的整合,、對接、共享和綜合應(yīng)用,,從而提升企業(yè)管理水平,,充分發(fā)揮信息化在經(jīng)營管理中的作用,。 數(shù)據(jù)治理相關(guān)制度、流程會引申出數(shù)據(jù)治理咨詢,,如《數(shù)據(jù)治理組織架構(gòu)及人才管理方案》,、《數(shù)據(jù)治理實施路徑》、《數(shù)據(jù)應(yīng)用場景實施路徑》,、《元數(shù)據(jù)管理辦法及流程》,、《數(shù)據(jù)標準管理辦法及流程》、《數(shù)據(jù)質(zhì)量問題分析及整改方案》,、《未來N年數(shù)據(jù)治理發(fā)展規(guī)劃》等,;數(shù)據(jù)治理工具會引申出相關(guān)管理系統(tǒng),如元數(shù)據(jù)管理系統(tǒng),、數(shù)據(jù)安全系統(tǒng),、數(shù)據(jù)標準系統(tǒng)、數(shù)據(jù)質(zhì)量系統(tǒng)等,,一般偏向基于數(shù)據(jù)治理咨詢成果完成當期數(shù)據(jù)治理實施與落地,。 1.8. 數(shù)據(jù)資產(chǎn)數(shù)據(jù)資產(chǎn)(Data Asset)是指由企業(yè)擁有或者控制的,能夠為企業(yè)帶來未來經(jīng)濟利益的,,以物理或電子的方式記錄的數(shù)據(jù)資源,,如文件資料、電子數(shù)據(jù)等,。在企業(yè)中,,并非所有的數(shù)據(jù)都構(gòu)成數(shù)據(jù)資產(chǎn),數(shù)據(jù)資產(chǎn)是能夠為企業(yè)產(chǎn)生價值的數(shù)據(jù)資源,。 《GBT34960.5-2018 信息技術(shù)服務(wù) 治理 第5部分》給出的定義:組織擁有和控制的,、能夠產(chǎn)生效益的數(shù)據(jù)資源。 2. 數(shù)據(jù)治理相關(guān)理論知識2.1. 數(shù)據(jù)模型數(shù)據(jù)模型(Data Model),,經(jīng)常簡稱為模型,,是現(xiàn)實世界數(shù)據(jù)特征的抽象,用于描述一組數(shù)據(jù)的概念和定義,。數(shù)據(jù)模型從抽象層次上描述了數(shù)據(jù)的靜態(tài)特征,、動態(tài)行為和約束條件。數(shù)據(jù)模型所描述的內(nèi)容有三部分:數(shù)據(jù)結(jié)構(gòu),、數(shù)據(jù)操作(其中ER圖數(shù)據(jù)模型中無數(shù)據(jù)操作)和數(shù)據(jù)約束,形成數(shù)據(jù)結(jié)構(gòu)的基本藍圖,,也是企業(yè)數(shù)據(jù)資產(chǎn)的戰(zhàn)略地圖,。數(shù)據(jù)模型按不同的應(yīng)用層次分成主題域數(shù)據(jù)模型、概念數(shù)據(jù)模型,、邏輯數(shù)據(jù)模型,、物理數(shù)據(jù)模型四種類型,。 主題域數(shù)據(jù)模型:簡稱主題域模型,是最高視角的規(guī)劃藍圖,,是在較高層次上將企業(yè)信息系統(tǒng)中的數(shù)據(jù)綜合,、歸類,并進行分析利用的抽象,。一般情況下主題域模型按業(yè)務(wù),、系統(tǒng)、部門等劃分,。 概念數(shù)據(jù)模型:簡稱概念模型,,是一種面向用戶、面向客觀世界的模型,,主要用來描述現(xiàn)實世界的概念化結(jié)構(gòu),,與具體的數(shù)據(jù)庫管理系統(tǒng)(DBMS,Database Management System)無關(guān),,一般只有實體集,,聯(lián)系集的分析結(jié)構(gòu)。 邏輯數(shù)據(jù)模型:簡稱邏輯模型,,是一種以概念模型為基礎(chǔ),,根據(jù)業(yè)務(wù)條線、業(yè)務(wù)事項,、業(yè)務(wù)流程,、業(yè)務(wù)場景的需要,設(shè)計的面向業(yè)務(wù)實現(xiàn)的數(shù)據(jù)模型,,一般包括具體的功能和處理信息,。邏輯模型是面向DBMS的模型,用于指導(dǎo)在不同的DBMS系統(tǒng)中實現(xiàn),。邏輯數(shù)據(jù)模型常見形式有網(wǎng)狀數(shù)據(jù)模型,、層次數(shù)據(jù)模型等。 物理數(shù)據(jù)模型:簡稱物理模型,,是一種面向計算機物理表示的模型,,描述了數(shù)據(jù)在儲存介質(zhì)上的組織結(jié)構(gòu)。物理模型的設(shè)計應(yīng)基于邏輯模型的成果,,以保證實現(xiàn)業(yè)務(wù)需求,。它不但與具體的DBMS有關(guān),而且還與操作系統(tǒng)和硬件有關(guān),,因此,,在設(shè)計模型時需要考慮系統(tǒng)性能的相關(guān)要求。 2.2. 元模型&元數(shù)據(jù)元模型(Meta Model)是關(guān)于模型的模型,是描述某一模型的規(guī)范,,具體來說就是組成模型的元素和元素之間的關(guān)系,。元模型是相對與模型的概念,離開了模型元模型就沒有了意義,。 元數(shù)據(jù)(Metadata),,又稱中介數(shù)據(jù)、中繼數(shù)據(jù),,為描述數(shù)據(jù)的數(shù)據(jù)(data about data),,主要是描述數(shù)據(jù)屬性(property)的信息,用來支持如指示存儲位置,、歷史數(shù)據(jù),、資源查找、文件記錄等功能,。元數(shù)據(jù)是關(guān)于數(shù)據(jù)的組織,、數(shù)據(jù)域及其關(guān)系的信息,簡言之,,元數(shù)據(jù)就是關(guān)于數(shù)據(jù)的數(shù)據(jù),。元數(shù)據(jù)按用途不同分為技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù),、操作元數(shù)據(jù),、管理元數(shù)據(jù)。 數(shù)據(jù)模型,、元模型,、元數(shù)據(jù)之間的關(guān)系:模型是數(shù)據(jù)特征的抽象,是組建元模型的理論基礎(chǔ),。元模型是元數(shù)據(jù)的模型,,是存儲元數(shù)據(jù)的數(shù)據(jù)模型,由于元數(shù)據(jù)的多樣性,,因此不同類型及子類對應(yīng)的元模型也不盡相同,,需要根據(jù)具體的元數(shù)據(jù)進行設(shè)計。
技術(shù)元數(shù)據(jù)(Technical Metadata):描述數(shù)據(jù)系統(tǒng)中技術(shù)領(lǐng)域相關(guān)概念,、關(guān)系和規(guī)則的數(shù)據(jù),;包括數(shù)據(jù)平臺內(nèi)對象和數(shù)據(jù)結(jié)構(gòu)的定義、源數(shù)據(jù)到目的數(shù)據(jù)的映射,、數(shù)據(jù)轉(zhuǎn)換的描述等,。 技術(shù)元數(shù)據(jù)如果細分,還可以分為結(jié)構(gòu)性技術(shù)元數(shù)據(jù)和關(guān)聯(lián)性技術(shù)元數(shù)據(jù),。 結(jié)構(gòu)性技術(shù)元數(shù)據(jù):結(jié)構(gòu)性技術(shù)元數(shù)據(jù)提供了在信息技術(shù)的基礎(chǔ)架構(gòu)中對數(shù)據(jù)的說明,,如數(shù)據(jù)的存放位置、數(shù)據(jù)的存儲類型、數(shù)據(jù)的血緣關(guān)系等,。 關(guān)聯(lián)性技術(shù)元數(shù)據(jù):描述了數(shù)據(jù)之間的關(guān)聯(lián)和數(shù)據(jù)在信息技術(shù)環(huán)境之中的流轉(zhuǎn)情況。技術(shù)元數(shù)據(jù)的范圍主要包括:技術(shù)規(guī)則(計算/統(tǒng)計/轉(zhuǎn)換/匯總),、數(shù)據(jù)質(zhì)量規(guī)則技術(shù)描述,、字段、衍生字段,、事實/維度,、統(tǒng)計指標、表/視圖/文件/接口,、報表/多維分析,、數(shù)據(jù)庫/視圖組/文件組/接口組、源代碼/程序,、系統(tǒng),、軟件、硬件等,。 在實踐中,,技術(shù)元數(shù)據(jù)的采集的內(nèi)容會根據(jù)不同數(shù)據(jù)庫做具體內(nèi)容的調(diào)整,如關(guān)系數(shù)據(jù)庫常見的表,、字段,、存儲過程、函數(shù),、視圖,,鍵值存儲數(shù)據(jù)庫就沒有視圖、存儲過程這種概念,。
描述數(shù)據(jù)系統(tǒng)中業(yè)務(wù)領(lǐng)域相關(guān)概念,、關(guān)系和規(guī)則的數(shù)據(jù);包括業(yè)務(wù)術(shù)語,、信息分類,、指標、統(tǒng)計口徑等,。從另一個維度來說,,業(yè)務(wù)元數(shù)據(jù)是數(shù)據(jù)倉庫環(huán)境的關(guān)鍵元數(shù)據(jù),是用戶訪問時了解業(yè)務(wù)數(shù)據(jù)的途徑,,內(nèi)容來源包括多個方面:用例建模(Case Modeling)工具,、控制數(shù)據(jù)庫、數(shù)據(jù)庫目錄和數(shù)據(jù)抽?。D(zhuǎn)換/加載的工具,。 在實踐中,常見的數(shù)據(jù)指標、數(shù)據(jù)元素(數(shù)據(jù)元),、數(shù)據(jù)標簽,、報表表頭等都屬于業(yè)務(wù)元數(shù)據(jù)。
與元數(shù)據(jù)管理相關(guān)的組織,、崗位,、職責、流程,,以及系統(tǒng)日常運行產(chǎn)生的操作數(shù)據(jù),。操作元數(shù)據(jù)管理的內(nèi)容主要包括:與元數(shù)據(jù)管理相關(guān)的組織、崗位,、職責,、流程、項目,、版本,,以及系統(tǒng)生產(chǎn)運行中的操作記錄,如運行記錄,、應(yīng)用程序,、運行作業(yè)。 簡單理解,,操作元數(shù)據(jù)是描述數(shù)據(jù)處理過程的數(shù)據(jù),。 在實踐中,一般操作元數(shù)據(jù)主要存儲的數(shù)據(jù)是:數(shù)據(jù)ETL信息,、數(shù)據(jù)加工處理策略數(shù)據(jù)信息,、數(shù)據(jù)處理調(diào)度信息、數(shù)據(jù)處理異常信息等,。
描述了數(shù)據(jù)的管理屬性,,包括管理部門、管理責任人等,,通過明確管理屬性,,有利于數(shù)據(jù)管理責任到部門和個人,是數(shù)據(jù)安全管理的基礎(chǔ),。常見的管理元數(shù)據(jù)包括:數(shù)據(jù)所有者,、數(shù)據(jù)質(zhì)量定責、數(shù)據(jù)安全等級等,。 簡單理解,,管理元數(shù)據(jù)是描述數(shù)據(jù)管理歸屬的數(shù)據(jù)。 在實踐中,,一般管理元數(shù)據(jù)主要存儲的數(shù)據(jù)是:數(shù)據(jù)歸屬信息(業(yè)務(wù)歸屬,、系統(tǒng)歸屬,、運維歸屬、數(shù)據(jù)權(quán)限歸屬),、各個數(shù)據(jù)庫里面創(chuàng)建的用戶訪問庫\表\視圖\存儲過程等的權(quán)限信息(含數(shù)據(jù)安全信息)等,。 2.3. 數(shù)據(jù)標準數(shù)據(jù)標準(Data Standards)是指保障數(shù)據(jù)的內(nèi)外部使用和交換的一致性和準確性的規(guī)范性約束。在數(shù)字化過程中,,數(shù)據(jù)是業(yè)務(wù)活動在信息系統(tǒng)中的真實反映,。由于業(yè)務(wù)對象在信息系統(tǒng)中以數(shù)據(jù)的形式存在,數(shù)據(jù)標準相關(guān)管理活動均需以業(yè)務(wù)為基礎(chǔ),,并以標準的形式規(guī)范業(yè)務(wù)對象在各信息系統(tǒng)中的統(tǒng)一定義和應(yīng)用,以提升企業(yè)在業(yè)務(wù)協(xié)同,、監(jiān)管合規(guī),、數(shù)據(jù)共享開放、數(shù)據(jù)分析應(yīng)用等各方面的能力,。 數(shù)據(jù)標準是一個從業(yè)務(wù),、技術(shù)、管理三方面達成一致的規(guī)范化體系,,同時也是是建立一套符合自身實際,,涵蓋定義、操作,、應(yīng)用多層次數(shù)據(jù)的標準化體系,。它包括基礎(chǔ)類標準和指標類標準。
基礎(chǔ)類數(shù)據(jù)標準是為了統(tǒng)一組織所有業(yè)務(wù)活動相關(guān)數(shù)據(jù)的一致性和準確性,,解決業(yè)務(wù)間數(shù)據(jù)一致性和數(shù)據(jù)整合,,按照數(shù)據(jù)標準管理過程制定的數(shù)據(jù)標準。 基礎(chǔ)類數(shù)據(jù)標準主要的內(nèi)容,,包括數(shù)據(jù)元,、代碼集、數(shù)據(jù)集,、編碼規(guī)則,。 數(shù)據(jù)元( Data Element),也稱為數(shù)據(jù)元素,,是用一組屬性描述其定義,、標識、表示和允許值的數(shù)據(jù)單元,,在一定語境下,,通常用于構(gòu)建一個語義正確、獨立且無歧義的特定概念語義的信息單元,。數(shù)據(jù)元可以理解為數(shù)據(jù)的基本單元,,將若干具有相關(guān)性的數(shù)據(jù)元按一定的次序組成一個整體結(jié)構(gòu)即為數(shù)據(jù)模型,。對應(yīng)的是數(shù)據(jù)元標準。 代碼集是用于說明信息基本數(shù)據(jù)集中數(shù)據(jù)元素的分類編碼,。代碼基于某一個代碼集的分類編碼下的可排序數(shù)據(jù)集合,,一般情況下代碼是無序的對象集合,包含唯一值CODE,,和對應(yīng)的值VALUE,。為了擴展性,體現(xiàn)樹狀代碼模式,,還會有父類CODE,。由于代碼一詞在業(yè)務(wù)人員理解中會產(chǎn)生開發(fā)代碼的概念,有時候會將代碼集改成編碼集,,對應(yīng)的是編碼標準,。
指標類數(shù)據(jù)標準一般分為基礎(chǔ)指標標準和計算指標(又稱組合指標)?;A(chǔ)指標具有特定業(yè)務(wù)和經(jīng)濟含義,,且僅能通過基礎(chǔ)類數(shù)據(jù)加工獲得,計算指標通常由兩個以上基礎(chǔ)指標計算得出,。 2.4. 數(shù)據(jù)質(zhì)量數(shù)據(jù)質(zhì)量(Data Quality)是保證數(shù)據(jù)應(yīng)用效果的基礎(chǔ),,是描述數(shù)據(jù)價值含量的指標。 衡量數(shù)據(jù)質(zhì)量的指標體系有很多,,典型的指標有:完整性(數(shù)據(jù)是否缺失),、規(guī)范性(數(shù)據(jù)是否按照要求的規(guī)則存儲)、一致性(數(shù)據(jù)的值是否存在信息含義上的沖突),、準確性(數(shù)據(jù)是否錯誤),、唯一性(數(shù)據(jù)是否是重復(fù)的)、時效性(數(shù)據(jù)是否按照時間的要求進行上傳),。 通常從技術(shù)方面,、業(yè)務(wù)方面、管理方面尋找數(shù)據(jù)質(zhì)量問題,。
在技術(shù)方面,,一般從數(shù)據(jù)庫表設(shè)計、數(shù)據(jù)生產(chǎn),、數(shù)據(jù)采集,、數(shù)據(jù)傳輸、數(shù)據(jù)裝載,、數(shù)據(jù)存儲整個數(shù)據(jù)生命周期的各個環(huán)點尋找數(shù)據(jù)質(zhì)量問題,。 數(shù)據(jù)庫表設(shè)計環(huán)節(jié):在業(yè)務(wù)系統(tǒng)建設(shè)時對表結(jié)構(gòu)、字段約束,、數(shù)據(jù)校驗規(guī)則的設(shè)計不合理,,造成數(shù)據(jù)錄入無校驗或校驗不當,,引起數(shù)據(jù)重復(fù)、不準確,、不完整等,。 數(shù)據(jù)生產(chǎn)環(huán)節(jié):指業(yè)務(wù)系統(tǒng)產(chǎn)生生產(chǎn)數(shù)據(jù),在業(yè)務(wù)系統(tǒng)中未控制數(shù)據(jù)寫入權(quán)限,、對數(shù)據(jù)收集頁面未做數(shù)據(jù)校驗,、對數(shù)據(jù)重復(fù)提交未做限制、數(shù)據(jù)之間的邏輯未做控制等引發(fā)數(shù)據(jù)重復(fù),、不準確,、不一致等。各個業(yè)務(wù)系統(tǒng)通用或者依賴數(shù)據(jù)未做統(tǒng)一的管理,,各業(yè)務(wù)系統(tǒng)各自為政,,煙囪式建設(shè)系統(tǒng),導(dǎo)致系統(tǒng)之間的數(shù)據(jù)不一致,。 數(shù)據(jù)采集環(huán)節(jié):數(shù)據(jù)通過API、DB Link等方式獲取數(shù)據(jù),,在采集點,、采集頻率、采集內(nèi)容,、映射關(guān)系,、采集參數(shù)和流程設(shè)置的不合理,導(dǎo)致數(shù)據(jù)采集效率低下,、采集失敗,、數(shù)據(jù)丟失、數(shù)據(jù)映射與轉(zhuǎn)換失敗等問題,。 數(shù)據(jù)傳輸環(huán)節(jié):網(wǎng)絡(luò)不可控,、數(shù)據(jù)傳輸過程中未加密,造成數(shù)據(jù)傳輸環(huán)節(jié)數(shù)據(jù)被篡改,、丟失引發(fā)的數(shù)據(jù)質(zhì)量問題,。 數(shù)據(jù)加工環(huán)節(jié):指通過ETL、數(shù)據(jù)開發(fā)等方式,,在編制數(shù)據(jù)清洗規(guī)則,、數(shù)據(jù)轉(zhuǎn)換規(guī)則、數(shù)據(jù)裝載規(guī)則時,,未做合理的限制,、驗證等方式,造成數(shù)據(jù)重復(fù),、映射錯誤等問題,。 數(shù)據(jù)存儲環(huán)節(jié):數(shù)據(jù)存儲區(qū)設(shè)置不合理,、人為在數(shù)據(jù)存儲上調(diào)整數(shù)據(jù),引發(fā)數(shù)據(jù)丟失,、無效,、失真、重復(fù)等問題,。
在業(yè)務(wù)方面,,由于需求不清晰、需求頻繁變更,、數(shù)據(jù)輸入格式不規(guī)范,、數(shù)據(jù)造假造成數(shù)據(jù)質(zhì)量問題。 需求不清晰:業(yè)務(wù)規(guī)則,、業(yè)務(wù)流程,、業(yè)務(wù)采集信息項不清晰,影響設(shè)計環(huán)節(jié)構(gòu)建的數(shù)據(jù)模型不合理,,進而引發(fā)數(shù)據(jù)生產(chǎn)環(huán)節(jié)數(shù)據(jù)質(zhì)量問題,。 需求頻繁變更:一般也是由于需求不清晰導(dǎo)致需求變更頻繁,影響數(shù)據(jù)在技術(shù)層面所有環(huán)節(jié),,在頻繁變更的情況下,,稍有疏忽或者設(shè)計不合理或者數(shù)據(jù)遷移邏輯錯誤,導(dǎo)致數(shù)據(jù)質(zhì)量問題頻繁發(fā)生,,且不好治理,。 數(shù)據(jù)輸入格式不規(guī)范:一般主要針對大范圍內(nèi)容數(shù)據(jù)的輸入場景,由于輸入內(nèi)容的大小寫,、全半角,、特殊字符未留心注意,造成數(shù)據(jù)失真,、數(shù)據(jù)丟失等問題,。 數(shù)據(jù)造假:操作人員為了提高或降低考核指標,亦或是快速完成相關(guān)數(shù)據(jù)收集工作,,對一些數(shù)據(jù)在錄入時進行了處理,,使得數(shù)據(jù)真實性無法滿足質(zhì)量要求。
在管理方面,,主要是對數(shù)據(jù)質(zhì)量認知薄弱,,沒有或者未履行數(shù)據(jù)質(zhì)量制度,數(shù)據(jù)認責,、數(shù)據(jù)考核機制匱乏,,導(dǎo)致數(shù)據(jù)管理方面缺失引發(fā)的數(shù)據(jù)質(zhì)量問題。 數(shù)據(jù)質(zhì)量認知:沒有認識到數(shù)據(jù)質(zhì)量的重要性,,關(guān)注系統(tǒng)建設(shè)缺少對數(shù)據(jù)生產(chǎn)的關(guān)注,,認為系統(tǒng)是萬能的,,數(shù)據(jù)質(zhì)量差些也沒關(guān)系。 數(shù)據(jù)質(zhì)量制度:數(shù)據(jù)質(zhì)量問題從輸入,、發(fā)現(xiàn),、指派、處理,、優(yōu)化沒有一個統(tǒng)一的流程和制度支撐,,造成數(shù)據(jù)生產(chǎn)時數(shù)據(jù)不規(guī)范、數(shù)據(jù)丟失,、數(shù)據(jù)沖突等問題,,接下來的數(shù)據(jù)發(fā)現(xiàn)、指標,、處理,、優(yōu)化也沒有控制和管理,出現(xiàn)數(shù)據(jù)問題也沒有相應(yīng)的數(shù)據(jù)認責,、考核機制做到行為約束,,導(dǎo)致整個數(shù)據(jù)質(zhì)量問題沒有形成閉環(huán)。 影響數(shù)據(jù)質(zhì)量也可以從客觀因素和主觀因素分析,。在數(shù)據(jù)各環(huán)節(jié)流轉(zhuǎn)中,,由于系統(tǒng)異常和流程設(shè)置不當?shù)瓤陀^因素,引起的數(shù)據(jù)質(zhì)量問題,。在數(shù)據(jù)各環(huán)節(jié)處理中,由于人員數(shù)據(jù)意識低和管理缺陷等主觀因素,,造成操作不當而引起的數(shù)據(jù)質(zhì)量問題,。 2.5. 數(shù)據(jù)交換數(shù)據(jù)交換(Data Switching)在基于數(shù)據(jù)中臺、數(shù)據(jù)倉庫,、數(shù)據(jù)治理場景下,,不是指基于多個數(shù)據(jù)終端設(shè)備(DTE)之間,為任意兩個終端設(shè)備建立數(shù)據(jù)通信臨時互連通路的過程,;而是指將分散建設(shè)的若干應(yīng)用信息系統(tǒng)中的數(shù)據(jù)進行整合,,使若干個應(yīng)用子系統(tǒng)進行信息/數(shù)據(jù)的傳輸及共享,提高信息資源的利用率,,成為進行信息化建設(shè)的基本目標,,保證分布異構(gòu)系統(tǒng)之間互聯(lián)互通。 簡單理解,,當前的數(shù)據(jù)交換主要將應(yīng)用系統(tǒng)產(chǎn)生的數(shù)據(jù),,通過數(shù)據(jù)卸數(shù)、數(shù)據(jù)裝數(shù)完成異構(gòu)數(shù)據(jù)庫(源)之間的互聯(lián)互通,。常見的數(shù)據(jù)交換模式有庫到庫,、庫到文件,、文件到庫、文件到文件,。 2.6. 數(shù)據(jù)服務(wù)數(shù)據(jù)服務(wù)(Data Service)是將全企業(yè)級的數(shù)據(jù)提供服務(wù)能力,,通過服務(wù)化包裝,以服務(wù)接口的方式對業(yè)務(wù)系統(tǒng)提供數(shù)據(jù),。 數(shù)據(jù)服務(wù)除了將原來散布各處的數(shù)據(jù)服務(wù)整合,,實現(xiàn)數(shù)據(jù)服務(wù)的統(tǒng)一對接及出口,也可以支持基于數(shù)據(jù)服務(wù)配置數(shù)據(jù)API,,通過統(tǒng)一接入統(tǒng)一管理的方式,,實現(xiàn)全企業(yè)級數(shù)據(jù)服務(wù)的發(fā)布、申請,、對接調(diào)用,、鑒權(quán)、監(jiān)控,、限流管控,,從而實現(xiàn)數(shù)據(jù)服務(wù)的統(tǒng)一管控。 數(shù)據(jù)服務(wù)是從系統(tǒng)應(yīng)用層面為數(shù)據(jù)使用方提供安全,、統(tǒng)一的數(shù)據(jù),。 2.7. 數(shù)據(jù)生命周期任何事物都具有一定的生命周期,數(shù)據(jù)也不例外,。數(shù)據(jù)生命周期(Data Life Cycle)是從數(shù)據(jù)的產(chǎn)生,、加工、使用乃至消亡,,基于有一個科學(xué)的管理辦法,,將極少或者不再使用的數(shù)據(jù)從系統(tǒng)中剝離出來,并通過核實的存儲設(shè)備進行保留,,不僅能夠提高系統(tǒng)的運行效率,,更好的服務(wù)客戶,還能大幅度減少因為數(shù)據(jù)長期保存帶來的儲存成本,。 數(shù)據(jù)生命周期一般包含在線階段,、歸檔階段(有時還會進一步劃分為在線歸檔階段和離線歸檔階段)、銷毀階段三大階段,,管理內(nèi)容包括建立合理的數(shù)據(jù)類別,,針對不同類別的數(shù)據(jù)制定各個階段的保留時間、存儲介質(zhì),、清理規(guī)則和方式,、注意事項等。 2.8. 數(shù)據(jù)開發(fā)數(shù)據(jù)開發(fā)(Data Development)指圍繞數(shù)據(jù)全生命周期打造全流程統(tǒng)一標準化的工具能力,對數(shù)據(jù)模型設(shè)計,、數(shù)據(jù)加工處理程序開發(fā),、測試、上線等進行統(tǒng)一管理的活動,。一般情況下,,數(shù)據(jù)開發(fā)包含離線開發(fā)和實時開發(fā)。 離線開發(fā),,又叫做離線數(shù)據(jù)開發(fā),,指通過編制數(shù)據(jù)加工表達式處理昨天或者更久前的數(shù)據(jù),時間單位通常是天,、小時,。 實時開發(fā),又叫做實時數(shù)據(jù)開發(fā),,處理即時收到數(shù)據(jù),,時效主要取決于傳輸和存儲速度,時間單位通常是秒,、毫秒,。 2.9. 數(shù)據(jù)安全數(shù)據(jù)安全(Data Security)為數(shù)據(jù)處理系統(tǒng)建立和采用的技術(shù)和管理的安全保護,保護計算機硬件,、軟件和數(shù)據(jù)不因偶然和惡意的原因遭到破壞,、更改和泄露。由此計算機網(wǎng)絡(luò)安全可以理解為:通過采用各種技術(shù)和管理措施,,使網(wǎng)絡(luò)系統(tǒng)正常運行,,從而確保網(wǎng)絡(luò)數(shù)據(jù)的可用性、完整性和保密性,。 數(shù)據(jù)分類目錄,,又稱數(shù)據(jù)目錄,指根據(jù)組織數(shù)據(jù)的屬性或特征,,將其按照一定的原則和方法進行區(qū)分和歸類,并建立起一定的分類體系和排列順序,,以便更好地管理和使用組織數(shù)據(jù)的過程,。 數(shù)據(jù)目錄是數(shù)據(jù)保護工作中的一個關(guān)鍵部分,是建立統(tǒng)一,、準確,、完善的數(shù)據(jù)架構(gòu)的基礎(chǔ),是實現(xiàn)集中化,、專業(yè)化,、標準化數(shù)據(jù)管理的基礎(chǔ),也是數(shù)據(jù)資產(chǎn)盤點重要的依賴數(shù)據(jù)。 圖2 數(shù)據(jù)分類(示例) 數(shù)據(jù)分級,,又稱敏感等級,是指在數(shù)據(jù)分類的基礎(chǔ)上,,采用規(guī)范,、明確的方法區(qū)分數(shù)據(jù)的重要性和敏感度差異,按照一定的分級原則對其進行定級,,從而為組織數(shù)據(jù)的開放和共享安全策略制定提供支撐的過程,。 圖 3 基于《金融數(shù)據(jù)安全分級指南》梳理數(shù)據(jù)等級(示例) ?靜態(tài)脫敏,,是將數(shù)據(jù)抽取進行脫敏處理后,,下發(fā)至測試庫,脫敏后的數(shù)據(jù)與生產(chǎn)環(huán)境隔離,,滿足業(yè)務(wù)需要的同時保障生產(chǎn)數(shù)據(jù)庫的安全,。靜態(tài)脫敏是不可逆的動作,可以概括為數(shù)據(jù)的“搬移并仿真替換”,。 動態(tài)脫敏,,是基于脫敏規(guī)則,對敏感數(shù)據(jù)的查詢和調(diào)用結(jié)果進行實時脫敏,,確保返回數(shù)據(jù)可用性和安全性,。動態(tài)脫敏可以概括為“邊脫敏,邊使用”,。 3. 數(shù)據(jù)資產(chǎn)相關(guān)理論知識3.1. 業(yè)務(wù)數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)(Business Data)是業(yè)務(wù)處理過程中或事物處理所產(chǎn)生的數(shù)據(jù),,也稱交易數(shù)據(jù)。業(yè)務(wù)數(shù)據(jù)生成主要有三種情況:一,、業(yè)務(wù)交易過程中產(chǎn)生的數(shù)據(jù),,例如:計劃單、銷售單,、生產(chǎn)單,、采購單等,這部分數(shù)據(jù)多數(shù)人為產(chǎn)生,;二,、系統(tǒng)產(chǎn)生的數(shù)據(jù),包括,,硬件運行狀況,、軟件運行狀況、資源消耗狀況,、應(yīng)用使用狀況,、接口調(diào)用狀況、服務(wù)健康狀況等;三,、自動化設(shè)備所產(chǎn)生的數(shù)據(jù),,IOT物聯(lián)網(wǎng)的各類設(shè)備運行數(shù)據(jù)、生產(chǎn)采集數(shù)據(jù)等等,。不論來源何處,,這里數(shù)據(jù)有一個共同的特點就是時效性強、響應(yīng)高,、數(shù)據(jù)量大,。 3.2. 主數(shù)據(jù)主數(shù)據(jù)(Master Data)是指用來描述企業(yè)核心業(yè)務(wù)實體的數(shù)據(jù),是企業(yè)核心業(yè)務(wù)對象,、交易業(yè)務(wù)的執(zhí)行主體,。是在整個價值鏈上被重復(fù)、共享應(yīng)用于多個業(yè)務(wù)流程的,、跨越各個業(yè)務(wù)部門和系統(tǒng)的,、高價值的基礎(chǔ)數(shù)據(jù),是各業(yè)務(wù)應(yīng)用和各系統(tǒng)之間進行數(shù)據(jù)交互的基礎(chǔ),。從業(yè)務(wù)角度,,主數(shù)據(jù)是相對“固定”的,變化緩慢,。主數(shù)據(jù)是企業(yè)信息系統(tǒng)的神經(jīng)中樞,,是業(yè)務(wù)運行和決策分析的基礎(chǔ)。例如客戶,、企業(yè)組織機構(gòu)和員工,、產(chǎn)品、渠道,、科目等,。 3.3. 數(shù)據(jù)價值數(shù)據(jù)價值(Data Value)是對數(shù)據(jù)內(nèi)在價值的度量,可以從數(shù)據(jù)成本和數(shù)據(jù)應(yīng)用價值兩方面來開展,。數(shù)據(jù)成本一般包括采集,、存儲和計算的費用(人工費用、IT設(shè)備等直接費用和間接費用等)和運維費用(業(yè)務(wù)操作費,、技術(shù)操作費等),。數(shù)據(jù)應(yīng)用價值主要從數(shù)據(jù)的分類、使用頻次,、使用對象,、使用效果和共享流通等方面計量,。 3.4.資產(chǎn)目錄數(shù)據(jù)資產(chǎn)目錄(Data Asset Catalog),,簡稱資產(chǎn)目錄,是指對數(shù)據(jù)中有價值、可用于分析和應(yīng)用的數(shù)據(jù)進行提煉形成的目錄體系,。編制數(shù)據(jù)資產(chǎn)目錄主要是建立業(yè)務(wù)場景和數(shù)據(jù)資源的關(guān)聯(lián)關(guān)系,,降低理解系統(tǒng)數(shù)據(jù)的門檻。 4. 相關(guān)關(guān)系4.1. 數(shù)據(jù)管理&數(shù)據(jù)治理&數(shù)據(jù)資產(chǎn)的關(guān)系數(shù)據(jù)管理包含數(shù)據(jù)治理,,“治理是整體數(shù)據(jù)管理的一部分”這個概念目前已經(jīng)得到了業(yè)界的廣泛認同,。數(shù)據(jù)管理包含多個不同的領(lǐng)域,其中一個最顯著的領(lǐng)域就是數(shù)據(jù)治理,。數(shù)據(jù)資產(chǎn)是在數(shù)據(jù)治理的基礎(chǔ)上,,核心是如何實現(xiàn)數(shù)據(jù)價值,體現(xiàn)數(shù)據(jù)價值,,完成數(shù)據(jù)賦能,。數(shù)據(jù)管理、數(shù)據(jù)治理,、數(shù)據(jù)資產(chǎn)管理三者關(guān)系如圖所示,。 ?圖 4 數(shù)據(jù)管理,、數(shù)據(jù)治理,、數(shù)據(jù)資產(chǎn)管理三者關(guān)系 4.2.數(shù)據(jù)治理框架GB/T34960《信息技術(shù)服務(wù)治理》第5部分提到,數(shù)據(jù)治理框架包含頂層設(shè)計,、數(shù)據(jù)治理環(huán)境,、數(shù)據(jù)治理域和數(shù)據(jù)治理過程四大部分。 圖 5 數(shù)據(jù)治理框架 ??頂層設(shè)計包含數(shù)據(jù)相關(guān)的戰(zhàn)略規(guī)劃,、組織構(gòu)建和架構(gòu)設(shè)計,是數(shù)據(jù)治理實施的基礎(chǔ),。數(shù)據(jù)治理環(huán)境包含內(nèi)外部環(huán)境及促成因素,,是數(shù)據(jù)治理實施的保障。數(shù)據(jù)治理域包含數(shù)據(jù)管理體系和數(shù)據(jù)價值體系,,是數(shù)據(jù)治理實施的對象,。數(shù)據(jù)治理過程包含統(tǒng)籌和規(guī)劃、構(gòu)建和運行,、監(jiān)控和評價以及改進和優(yōu)化,,是數(shù)據(jù)治理實施的方法。 在數(shù)據(jù)治理域中,,數(shù)據(jù)管理體系主要組織應(yīng)圍繞數(shù)據(jù)標準,、數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全,、元數(shù)據(jù)管理和數(shù)據(jù)生存周期等,,開展數(shù)據(jù)管理體系的治理,,至少包括:a) 評估數(shù)據(jù)管理的現(xiàn)狀和能力,分析和評估數(shù)據(jù)管理的成熟度,;b) 指導(dǎo)數(shù)據(jù)管理體系治理方案的實施,,滿足數(shù)據(jù)戰(zhàn)略和管理要求;c) 監(jiān)督數(shù)據(jù)管理的績效和符合性,,并持續(xù)改進和優(yōu)化,。 數(shù)據(jù)價值體系主要組織應(yīng)圍繞數(shù)據(jù)流通、數(shù)據(jù)服務(wù)和數(shù)據(jù)洞察等,,開展數(shù)據(jù)資產(chǎn)運營和應(yīng)用的治理,,至少包括:a) 評估數(shù)據(jù)資產(chǎn)的運營和應(yīng)用能力,支撐數(shù)據(jù)價值轉(zhuǎn)化和實現(xiàn),;b) 指導(dǎo)數(shù)據(jù)價值體系治理方案的實施,,滿足數(shù)據(jù)資產(chǎn)的運營和應(yīng)用要求;c) 監(jiān)督數(shù)據(jù)價值實現(xiàn)的績效和符合性,,并持續(xù)改進和優(yōu)化,。 4.3.數(shù)據(jù)治理&數(shù)據(jù)資產(chǎn)&數(shù)據(jù)的關(guān)系從數(shù)據(jù)層面來看,數(shù)據(jù)體系包括治理,、管理和應(yīng)用三個部分,。治理是負責解決人與人、人與數(shù)據(jù)之間的事,,管理負責各個職能領(lǐng)域,,應(yīng)用則是數(shù)據(jù)價值的實現(xiàn)。根據(jù)這三個維度,,數(shù)據(jù)治理重點在治理,,一般包含數(shù)據(jù)治理咨詢和數(shù)據(jù)治理實施,是數(shù)據(jù)在治理與管理的結(jié)合,;數(shù)據(jù)資產(chǎn)偏重的是資產(chǎn),,一般重點體現(xiàn)數(shù)據(jù)的價值和數(shù)據(jù)的應(yīng)用,基于數(shù)據(jù)資產(chǎn)盤點及價值分析,,展示數(shù)據(jù)資產(chǎn)的價值和提供數(shù)據(jù)應(yīng)用,。 或者說,數(shù)據(jù)治理是在高層次上執(zhí)行數(shù)據(jù)管理制度,,對數(shù)據(jù)行使權(quán)力和控制的活動集合(規(guī)劃,、監(jiān)控和執(zhí)行),數(shù)據(jù)資產(chǎn)重點是發(fā)現(xiàn)數(shù)據(jù)價值,,通過提供數(shù)據(jù)應(yīng)用的能力助力企業(yè)發(fā)展,、提升企業(yè)運營能力。 數(shù)據(jù)是企業(yè)信息化的原料,,數(shù)據(jù)治理是企業(yè)信息化的基石,,數(shù)據(jù)資產(chǎn)基于數(shù)據(jù)治理的數(shù)據(jù),,挖掘數(shù)據(jù)價值,通過數(shù)據(jù)運營,、數(shù)據(jù)分析的手段,為企業(yè)賦能,,助力企業(yè)信息化的騰飛,。 |
|
來自: blackhappy > 《職場》