互聯(lián)網(wǎng)行業(yè)分析三---大數(shù)據(jù)發(fā)展

黃元章553333 2019-03-24

展開全文

“小沃”為客戶開發(fā)項目中經(jīng)常遇到開發(fā)后的平臺軟件系統(tǒng)產(chǎn)品實際運營中效果不是太好,，“小沃”也是一個刨根問底的工作狂，所以收集了對應(yīng)各行業(yè)的市場調(diào)研報告進行分析,，一方面可以精準的了解客戶開發(fā)需求,；另一方便也是能為客戶提供相關(guān)建議，避免不必要的投資,。所以萌生了每天為大家分享各行業(yè)市場調(diào)研報告的想法,，希望能給大家?guī)矸奖恪?/strong>

今天“小沃”就跟各位朋友分享下'2018年中國互聯(lián)網(wǎng)行業(yè)發(fā)展態(tài)勢'！

記不住的可以收藏或者拉倒頁尾有下載原版文件方式哦?。ù宋闹唤厝≡闹胁糠謹?shù)據(jù),，如需要原文件，請按文章尾部進行操作）

麻煩大家多多關(guān)注幫忙轉(zhuǎn)發(fā),，謝謝大家支持,！

一、大數(shù)據(jù)安全技術(shù)發(fā)展情況

面對上述大數(shù)據(jù)安全挑戰(zhàn)與威脅,，產(chǎn)業(yè)各界在安全防護技術(shù)方面進行了針對性的實踐與探索,。

（一）大數(shù)據(jù)平臺安全技術(shù)

隨著市場對大數(shù)據(jù)安全需求的增加，Hadoop開源社區(qū)增加了身份認證,、訪問控制,、數(shù)據(jù)加密等安全機制。商業(yè)化Hadoop平臺也逐步開發(fā)了集中化安全管理,、細粒度訪問控制等安全組件,，對平臺進行了安全升級。部分安全服務(wù)提供商也致力于通用的大數(shù)據(jù)平臺安全加固技術(shù)和產(chǎn)品的研發(fā)，已有多款大數(shù)據(jù)平臺安全產(chǎn)品上市,。這些安全機制的應(yīng)用為大數(shù)據(jù)平臺安全提供了基礎(chǔ)機制保障,。

1、Hadoop開源社區(qū)增加了基本安全機制,，但安全能力不能滿足現(xiàn)實需求

Hadoop開源系統(tǒng)中提供了身份認證,、訪問控制、安全審計,、數(shù)據(jù)加密等基本安全功能,。身份認證方面，Hadoop 支持兩種身份驗證機制：簡單機制和 Kerberos 機制,。簡單機制是默認設(shè)置,，根據(jù)客戶進程的有效 UID 確定用戶名，只能避免內(nèi)部人員的誤操作,。Kerberos 機制支持集群中服務(wù)器間的認證和 Client 到服務(wù)器的認證,。因為Kerberos 可以實現(xiàn)較強的安全性，同時保證較高的運行性能,，目前還沒有哪種認證方式可以取代 Kerberos認證,。基于Kerberos 的認證方式對于系統(tǒng)外部可以實現(xiàn)強安全認證,，但Kerberos 的認證顆粒度基于操作系統(tǒng)用戶,，無法支持系統(tǒng)內(nèi)組件之間的身份認證。訪問控制方面,，目前大數(shù)據(jù)安全開源技術(shù)在訪問控制方面主要有基于權(quán)限的訪問控制,、訪問控制列表、基于角色的訪問控制,、基于標簽的訪問控制和基于操作系統(tǒng)的訪問控制等幾種方式,。POSIX權(quán)限和訪問控制列表方式可用于HDFS、MapReduce,、HBase中,，Hive支持基于角色的訪問控制，HBase和Accumulo提供了基于標簽的訪問控制,。

在以上幾種訪問控制方式中,，企業(yè)主流使用的是基于權(quán)限的訪問控制和基于角色的訪問控制。大數(shù)據(jù)場景下用戶角色眾多,，用戶需求更加多樣化,，難以精細化和細粒度地控制每個角色的實際權(quán)限，導致無法準確為用戶指定其可以訪問的數(shù) 據(jù)范圍,，實現(xiàn)細粒度訪問控制較為困難,。大數(shù)據(jù)環(huán)境訪問控制的復雜性不僅在于訪問控制的形式多樣,，另一方面在于大數(shù)據(jù)系統(tǒng)允許在不同系統(tǒng)層面廣泛共享數(shù)據(jù)，需要實現(xiàn)一種集中統(tǒng)一的訪問控制從而簡化控制策略和部署,。安全審計方面,，Hadoop開源系統(tǒng)各組件均提供日志和審計文件，可以記錄數(shù)據(jù)訪問過程,，為追蹤數(shù)據(jù)流向和發(fā)現(xiàn)違規(guī)數(shù)據(jù)操作提供原始依據(jù),。但 Hadoop 各組件分別進行基本的日志和審計記錄，并存儲在其內(nèi)部,，實現(xiàn)全系統(tǒng)的安全審計較為困難,，需要使用外部的日志聚合系統(tǒng)從集群中所有節(jié)點拉取審計日志，放入集中化的位置進行存儲和分析,。數(shù)據(jù)加密方面，大數(shù)據(jù)環(huán)境下需要實現(xiàn)數(shù)據(jù)在靜態(tài)存儲及傳輸過程的加密保護,，其難點在于密鑰管理,。從 Hadoop2.6 開始，HDFS 支持原生靜態(tài)加密——應(yīng)用層加密,，是一種基于加密區(qū)的透明加密方法,，需要加密的目錄被分解為若干加密區(qū)，當數(shù)據(jù)寫入加密區(qū)時被透明地加密,，客戶端讀取數(shù)據(jù)時被透明地解密。對于動態(tài)傳輸數(shù)據(jù)，對應(yīng) RPC,、TCP/IP 和 HTTP,，Hadoop 提供了不同的動態(tài)加密方法，保證客戶端與服務(wù)器傳輸?shù)陌踩?。目?Hadoop 開源技術(shù)能夠支持通過基于硬件的加密方案,，大幅提高數(shù)據(jù)加解密的性能，實現(xiàn)最低性能損耗的端到端和存儲層加密,。加密的有效使用需要安全靈活的密鑰管理和分發(fā)機制,，目前在開源環(huán)境下沒有很好的解決方式，需要借助商業(yè)化的密鑰管理產(chǎn)品,。

2,、商業(yè)化大數(shù)據(jù)平臺解決方案已經(jīng)具備相對完善的安全機制

商業(yè) 化的大數(shù) 據(jù) 平臺，如Cloudera公司的CDH（Cloudera Distribution Hadoop）,、Hortenworks 公司的 HDP(Hortonworks Data Platform ）華為公司的FusionInsight,、星環(huán)信息科技的 TDH（Transwarp Data Hub)等，在平臺安全機制上,，做了如下幾個方面的優(yōu)化,。集中安全管理和審計方面,，通過專門的集中化的組件（如 Manager、 Ranger,、Guardian）形成了大數(shù)據(jù)平臺總體安全管理視圖,，實現(xiàn)集中的系統(tǒng)運維、安全策略管理和審計,，通過統(tǒng)一的配置管理界面,，解決了安全策略配置和管理繁雜的難題。身份認證方面,，通過邊界防護,，保證Hadoop集群入口的安全，通過集中身份管理和單點登錄等方式,，簡化了認證機制,，通過界面化的配置管理方式，可以方便的管理和啟用基于Kerberos 的認證,。訪問控制方面,，通過集中角色管理和批量授權(quán)等機制，降低集群管理的難度,，通過基于角色或標簽的訪問控制策略,，實現(xiàn)資源（例如文件、目錄,、表,、數(shù)據(jù)庫、列族等訪問權(quán)限）的細粒度管理,。加密和密鑰管理方面,，提供靈活的加密策略，保障數(shù)據(jù)傳輸過程及靜態(tài)存儲都是以加密形式存在,，也可以實現(xiàn)對 Hive,、HBase 的表或字段加密，同時提供更好的秘鑰存儲方案,，并能提供和企業(yè)現(xiàn)有的HSM（HardwareSecurity Module）集成的解決方案,。商業(yè)化大數(shù)據(jù)安全方案從 2008 年開始起步，經(jīng)過了大量的測試驗證,，有眾多部署實例,，大量的運行在各種生產(chǎn)環(huán)境，技術(shù)成熟度高,。由于這類安全方案的安全機制是只針對特定平臺開發(fā),，安全保障組件僅適用于該平臺，對于其他大數(shù)據(jù)平臺,，很難采取此類方案實現(xiàn)平臺安全加固,。

3,、商業(yè)化通用安全組件可以為已建大數(shù)據(jù)平臺提供安全加固方案

通用安全組件是指適用于原生或二次開發(fā)的 Hadoop 平臺的安全防護機制，一般實現(xiàn)方式是通過在 Hadoop 平臺內(nèi) 部部署集中管理節(jié)點,，負責整個平臺的安全管理策略設(shè)置和下發(fā),，實現(xiàn)對大數(shù)據(jù)平臺的用戶和系統(tǒng)內(nèi)組件的統(tǒng)一認證管理和集中授權(quán)管理。通過在原功能組件上部署安全插件,，對數(shù)據(jù)操作指令進行解析和攔截,，實現(xiàn)安全策略的實施，從而實現(xiàn)身份認證,、訪問控制,、權(quán)限管理、邊界安全等功能,。身份認證方面,，在兼容平臺原有 Kerberos+LDAP認證機制的基礎(chǔ)上，支持口令,、手機,、PKI 等多因素組合認證方式，實現(xiàn)外部用戶認證和平臺內(nèi)部組件之間的認證,，支持用戶單點登錄。訪問控制方面,，引入DAC,、MAC、RBAC,、DTE 等多種訪問控制模式,，實現(xiàn) HDFS 文件、計算資源,、組件等細粒度的訪問控制,，支持安全、審計,、操作三權(quán)分立,。實現(xiàn)平臺安全配置基線檢查，提高大數(shù)據(jù)平臺自身的安全性,。還實現(xiàn)敏感數(shù)據(jù)的動態(tài)模糊化管理等功能,。

通用安全組件易于部署和維護、適合對已建大數(shù)據(jù)系統(tǒng) 進行安全加固,，可以在不改變現(xiàn)有系統(tǒng)架構(gòu)的前提下,，解決企業(yè)的大數(shù)據(jù)平臺安全需求。靈活性強,，方便與現(xiàn)有的安全機制集成,。這類產(chǎn)品的提供者一般都是專業(yè)的安全服務(wù)商,，專注于安全問題的解決，防護機制的完備性強,，精度高,，為開源大數(shù)據(jù)平臺提供了較完備的安全加固方案。

（二）數(shù)據(jù)安全技術(shù)

數(shù)據(jù)是信息系統(tǒng)的核心資產(chǎn),，是大數(shù)據(jù)安全的最終保護對象,。除大數(shù)據(jù)平臺提供的數(shù)據(jù)安全保障機制之外，目前所采用的數(shù)據(jù)安全技術(shù),，一般是在整體數(shù)據(jù)視圖的基礎(chǔ)上,，設(shè)置分級分類的動態(tài)防護策略，降低已知風險的同時考慮減少對業(yè)務(wù)數(shù)據(jù)流動的干擾與傷害,。對于結(jié)構(gòu)化的數(shù)據(jù)安全,，主要采用數(shù)據(jù)庫審計、數(shù)據(jù)庫防火墻,，以及數(shù)據(jù)庫脫敏等數(shù)據(jù) 庫安全防護技術(shù),；對于非結(jié)構(gòu)化的數(shù)據(jù)安全，主要采用數(shù)據(jù) 泄露防護（Data leakage prevention, DLP）技術(shù),。同時,，細粒度的數(shù)據(jù)行為審計與追蹤溯源技術(shù)，能幫助系統(tǒng)在發(fā)生數(shù) 據(jù)安全事件時,，迅速定位問題,，查缺補漏。

1,、敏感數(shù)據(jù)識別技術(shù)作為數(shù)據(jù)安全監(jiān)控的必要技術(shù)條件逐步實現(xiàn)自動化

在敏感數(shù)據(jù)的監(jiān)控方案中,，基礎(chǔ)部分就是從海量的數(shù)據(jù)中挑選出敏感數(shù)據(jù)，完成對敏感數(shù)據(jù)的識別,，進而建立系統(tǒng)的總體數(shù)據(jù)視圖,，并采取分類分級的安全防護策略保護數(shù)據(jù)安全。傳統(tǒng)的數(shù)據(jù)識別方法是關(guān)鍵字,、字典和正則表達式匹配等方式,，通常結(jié)合模式匹配算法展開，該方法簡單實用,，但人工參與的相對較多,，自動化程度較低，隨著人工智能識別技術(shù)的引入,，通過機器學習可以實現(xiàn)大量文檔的聚類分析,，自動生成分類規(guī)則庫，內(nèi)容自動化識別程度正逐步提高,。

2,、數(shù)據(jù)防泄露技術(shù)發(fā)展相對成熟并向智能化方向演進

DLP 是指通過一定的技術(shù)手段,，防止用戶的指定數(shù)據(jù)或信息資產(chǎn)以違反安全策略規(guī)定的形式流出企業(yè)的一類數(shù)據(jù)安全防護手段。針對數(shù)據(jù)泄露的主要途徑,，DLP 采用的主要技術(shù)如下：針對使用泄露和存儲泄露,，通常采用身份認證管理、進程監(jiān)控,、日志分析和安全審計等技術(shù)手段,，觀察和記錄操作員對計算機、文件,、軟件和數(shù)據(jù)的操作情況,，發(fā)現(xiàn)、識別,、監(jiān)控計算機中的敏感數(shù)據(jù)的使用和流動,，對敏感數(shù)據(jù) 的違規(guī)使用進行警告、阻斷等,。針對傳輸泄露,，通常采取敏感數(shù)據(jù)動態(tài)識別、動態(tài)加密,、訪問阻斷,、和數(shù)據(jù)庫防火墻等技術(shù)，監(jiān)控服務(wù)器,、終端以及網(wǎng)絡(luò)中動態(tài)傳輸?shù)拿舾袛?shù)據(jù),，發(fā)現(xiàn)和阻止敏感數(shù)據(jù)通過聊天工具、網(wǎng)盤,、微博、FTP,、論壇等方式泄露出去,。目前的 DLP，普遍引入了自然語言處理,、機器學習,、聚類分類等新技術(shù)，將數(shù)據(jù)管理的顆粒度進行了細化,，對敏感數(shù)據(jù)和安全風險進行智能識別,。'智能安全'將會成為DLP技術(shù)發(fā)展的趨勢，大數(shù)據(jù)分析技術(shù),、機器學習算法的發(fā)展與演進將推動數(shù)據(jù)泄露防護的智能化發(fā)展,，DLP將實現(xiàn)用戶行為分析與數(shù)據(jù)內(nèi)容的智能識別，實現(xiàn)數(shù)據(jù)的智能化分層,、分級保護,，并提供終端,、網(wǎng)絡(luò)、云端協(xié)同一體的敏感數(shù)據(jù)動態(tài)集中管控體系,。

3,、結(jié)構(gòu)化數(shù)據(jù)庫安全防護技術(shù)基本成熟，非結(jié)構(gòu)化數(shù) 據(jù)庫安全防護亟需加強

結(jié)構(gòu)化的數(shù)據(jù)安全技術(shù)主要是指數(shù)據(jù)庫安全防護技術(shù),，可以分為事前評估加固,、事中安全管控和事后分析追責三類，其中評估主要是數(shù)據(jù)庫漏洞掃描技術(shù),，安全管控主要是數(shù)據(jù)庫防火墻,、數(shù)據(jù)加密、脫敏技術(shù),，事后分析追責主要是數(shù)據(jù)庫審計技術(shù),。目前數(shù)據(jù)庫安全防護技術(shù)發(fā)展逐步成熟。而在針對云環(huán)境和大數(shù)據(jù)環(huán)境的安全方面,，針對非結(jié)構(gòu)化數(shù)據(jù)庫的防護方案已經(jīng)由一些技術(shù)領(lǐng)先的廠商提出,，但技術(shù)成熟度較低。

4,、密文計算技術(shù)因多源數(shù)據(jù)計算機密性需求成為研究熱點

隨著多源數(shù)據(jù)計算場景的增多,，在保證數(shù)據(jù)機密性的基礎(chǔ)上實現(xiàn)數(shù)據(jù)的流通和合作應(yīng)用一直是困擾產(chǎn)業(yè)界的難題，同態(tài)加密和安全多方計算等密文計算方法為解決這個難題提供了一種有效的解決思路,。

同態(tài)加密提供了一種對加密數(shù)據(jù)進行處理的功能,，對經(jīng)過同態(tài)加密的數(shù)據(jù)處理得到一個輸出，將這一輸出進行解密,，其結(jié)果與統(tǒng)一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果一致,。也就是說，其他人可以對加密數(shù)據(jù)進行處理,，但是處理過程不會泄露任何原始內(nèi)容,。同時，擁有密鑰的用戶對處理過的數(shù)據(jù)進行解密后,，得到的正好是處理后的結(jié)果,。因為這樣一種良好的特性，同態(tài)加密特別適合在大數(shù)據(jù)環(huán)境中應(yīng)用既能滿足數(shù)據(jù)應(yīng)用的需求,，又能保護用戶隱私不被泄露,，是一種理想的解決方案。2009年,，Gentry提出了第一個全同態(tài)加密體制使得該方面的研究取得突破性進展,，隨后許多密碼學家在全同態(tài)加密方案的研究上作出了有意義的工作，促進了全同態(tài)加密向?qū)嵱没陌l(fā)展，但是目前同態(tài)加密算法的計算開銷過高,，尚未應(yīng)用到實際生產(chǎn)中,。

安全多方計算（SecureMulti-PartyComputation, SMPC）是解決一組互不信任的參與方之間保護隱私的協(xié)同計算問題，SMPC 要確保輸入的獨立性,，計算的正確性,，同時不泄露各輸入值給參與計算的其他成員。安全多方計算的這一特點,，對于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)機密性保護有獨特的優(yōu)勢,。通用的安全多方計算協(xié)議雖然可以解決一般性的安全多方計算問題，但是計算效率很低,，盡管近年來研究者努力進行實用化技術(shù)的研究,，并取得一些成果，但是離真正的產(chǎn)業(yè)化應(yīng)用還有一段距離,。

5,、數(shù)字水印和數(shù)據(jù)血緣追蹤技術(shù)發(fā)展明顯滯后于實際需求

以上的數(shù)據(jù)識別、密文計算,、安全監(jiān)控和防護是'事前' 和'事中'的安全保障技術(shù),，隨著數(shù)據(jù)泄露事件的頻繁發(fā)生， '事后'追蹤和溯源技術(shù)變得越來越重要,。安全事件發(fā)生后泄露源頭的追查和責任的判定是及時發(fā)現(xiàn)問題,、查缺補漏的關(guān)鍵，同時,，對安全管理制度的執(zhí)行也會形成一定的威懾作用,。目前常用的追蹤溯源技術(shù)包括數(shù)字水印和數(shù)據(jù)血緣追蹤技術(shù)。

數(shù)字水印技術(shù)是為了保持對分發(fā)后的數(shù)據(jù)流向追蹤,，在數(shù)據(jù)泄露行為發(fā)生后,，對造成數(shù)據(jù)泄露的源頭可進行回溯。對于結(jié)構(gòu)化數(shù)據(jù),，在分發(fā)數(shù)據(jù)中摻雜不影響運算結(jié)果的數(shù)據(jù),，采用增加偽行、增加偽列等方法,，拿到泄密數(shù)據(jù)的樣本，可追溯數(shù)據(jù)泄露源,。對于非結(jié)構(gòu)化數(shù)據(jù),，數(shù)字水印可以應(yīng)用于數(shù)字圖像、音頻,、視頻,、打印、文本、條碼等數(shù)據(jù)信息中,，在數(shù)據(jù)外發(fā)的環(huán)節(jié)加上隱蔽標識水印,，可以追蹤數(shù)據(jù)擴散路徑。但目前的數(shù)字水印方案大多還是針對靜態(tài)的數(shù)據(jù)集,，滿足數(shù)據(jù)量巨大,、更新速度極快的水印方案尚不成熟。

數(shù)據(jù)血緣(Lineage,，Provenance,，Pedigree)亦可譯為血統(tǒng)、起源,、世系,、譜系，是指數(shù)據(jù)產(chǎn)生的鏈路,，數(shù)據(jù)血緣記載了對數(shù)據(jù)處理的整個歷史,，包括數(shù)據(jù)的起源和處理這些數(shù)據(jù)的所有后繼過程(數(shù)據(jù)產(chǎn)生、并隨著時間推移而演變的整個過程),。通過數(shù)據(jù)血緣追蹤,，可以獲得數(shù)據(jù)在數(shù)據(jù)流中的演化過程。當數(shù)據(jù)發(fā)生異常時,，通過數(shù)據(jù)血緣分析能追蹤到異常發(fā)生的原因,，把風險控制在適當?shù)乃健Ｄ壳皵?shù)據(jù)血緣分析技術(shù)應(yīng)用尚不廣泛,，技術(shù)成熟度還未達到大規(guī)模實際的應(yīng) 用需求,。

（三）個人隱私保護技術(shù)

大數(shù)據(jù)環(huán)境下，數(shù)據(jù)安全技術(shù)提供了機密性,、完整性和可用性的防護基礎(chǔ),，隱私保護是在此基礎(chǔ)上，保證個人隱私信息不發(fā)生泄露或不被外界知悉,。目前應(yīng)用最廣泛的是數(shù)據(jù) 脫敏技術(shù),，學術(shù)界也提出了同態(tài)加密、安全多方計算等可用于隱私保護的密碼算法,，但應(yīng)用尚不廣泛,。

1、數(shù)據(jù)脫敏技術(shù)發(fā)展成熟,，是目前應(yīng)用最廣泛的隱私保護技術(shù)

數(shù)據(jù)脫敏是指對某些敏感信息通過脫敏規(guī)則進行數(shù)據(jù) 的變形,，實現(xiàn)對個人數(shù)據(jù)的隱私保護，是應(yīng)用最廣泛的隱私保護技術(shù),。目前的脫敏技術(shù)主要分為如下三種：第一種加密方法,，是指標準的加密算法,，加密后完全失去業(yè)務(wù)屬性，屬于低層次脫敏,。算法開銷大,，適用于機密性要求高、不需要保持業(yè)務(wù)屬性的場景,。第二種基于數(shù)據(jù)失真的技術(shù),，最常用的是隨機干擾、亂序等,，是不可逆算法,，通過這種算法可以生成'看起來很真實的假數(shù)據(jù)'。適用于群體信息統(tǒng)計或（和）需要保持業(yè)務(wù)屬性的場景,。第三種可逆的置換算法,，兼具可逆和保證業(yè)務(wù)屬性的特征，可以通過位置變換,、表映射,、算法映射等方式實現(xiàn)。表映射方法應(yīng)用起來相對簡單,，也能解決業(yè)務(wù)屬性保留的問題,，但是隨著數(shù)據(jù)量的增大，相應(yīng)的映射表同量增大,，應(yīng)用局限性高,。算法映射方法不需要做映射表，通過自行設(shè)計的算法來實現(xiàn)數(shù)據(jù)的變換,，這類算法都是基于密碼學的基本概念自行設(shè)計的,，通常的做法是在公開算法的基礎(chǔ)上做一定的變換，適用于需要保持業(yè)務(wù)屬性或（和）需要可逆的場景,。數(shù)據(jù)應(yīng)用系統(tǒng)在選擇脫敏算法時,，可用性和隱私保護的平衡是關(guān)鍵，既要考慮系統(tǒng)開銷,，滿足業(yè)務(wù)系統(tǒng)的需求,，又要兼顧最小可用原則，最大限度的保護用戶隱私,。

2,、匿名化算法將成為未來解決隱私保護問題的有效途徑

數(shù)據(jù)匿名化算法可以實現(xiàn)根據(jù)具體情況有條件地發(fā)布部分數(shù)據(jù)，或者數(shù)據(jù)的部分屬性內(nèi)容,，包括差分隱私,、K 匿名、L 多樣性,、T 接近等。匿名化算法要解決的問題包括：隱私性和可用性間的平衡問題，執(zhí)行效率問題,，度量和評價標準問題,，動態(tài)重發(fā)布數(shù)據(jù)的匿名化問題，多維約束匿名問題等,。匿名化算法由于能夠在數(shù)據(jù)發(fā)布環(huán)境下防止用戶敏感數(shù)據(jù)被泄露,，同時又能保證發(fā)布數(shù)據(jù)的真實性，這一特性在大數(shù)據(jù)安全領(lǐng)域受到廣泛關(guān)注,。目前,，匿名化算法還有很多挑戰(zhàn)性問題亟待解決，算法的成熟度和使用普及程度還不是很高,。匿名化相關(guān)算法是目前數(shù)據(jù)安全領(lǐng)域的研究熱點之一,，目前取得了豐富的研究成果，也得到了一些實際應(yīng)用,，后續(xù)匿名化算法會在隱私保護方面得到越來越多的應(yīng)用,。

（四）大數(shù)據(jù)安全技術(shù)發(fā)展現(xiàn)狀總結(jié)

國內(nèi)外大數(shù)據(jù)平臺安全、數(shù)據(jù)安全,、隱私保護相關(guān)的技術(shù)已經(jīng)取得了一定的進展,，但在應(yīng)對一些新的網(wǎng)絡(luò)攻擊形式、數(shù)據(jù) 應(yīng)用場景,、隱私保護需求方面,，大數(shù)據(jù)安全技術(shù)的現(xiàn)有能力和水平還存在一定差距。

平臺安全方面,，集中的安全配置管理和安全機制部署能夠基本滿足目前平臺的安全需求,，大數(shù)據(jù)平臺的漏洞掃描與攻擊監(jiān)測技術(shù)相對薄弱。目前的商業(yè)化大數(shù)據(jù)平臺和商業(yè)化通用安全組件,，為Hadoop生態(tài)系統(tǒng)增加了集中安全管理,、準入控制、多因素認證,、細粒度訪問控制,、密鑰管理、數(shù)據(jù) 脫敏,、集中審計等安全機制,，在一定程度上填補了大數(shù)據(jù)平臺安全機制的空缺，基本滿足目前平臺的安全需求,，但 Hadoop仍處在快速發(fā)展的階段,，認證機制依賴Kerberos，其認證中心可能會成為系統(tǒng)瓶頸,。平臺防攻擊技術(shù)方面,，目前大數(shù)據(jù)平臺仍然使用傳統(tǒng)網(wǎng)絡(luò)安全的防護手段,，對大數(shù)據(jù)環(huán)境下擴大的防護邊界和更加隱蔽的攻擊方式無法做到全面覆蓋，而且行業(yè)對大數(shù)據(jù)平臺本身可能的攻擊手段關(guān)注較少,，預防手段不足,，一旦有新的漏洞出現(xiàn)，波及范圍將十分巨大,。

數(shù)據(jù)安全方面,，數(shù)據(jù)安全監(jiān)控和防泄露技術(shù)相對成熟，數(shù)據(jù)的共享安全,、非結(jié)構(gòu)化數(shù)據(jù)庫的安全防護以及數(shù)據(jù)泄露溯源技術(shù)亟待改進,。目前，數(shù)據(jù)泄露問題在技術(shù)上可以得到較完備的解決,，敏感數(shù)據(jù)自動化識別為防泄露提供了基礎(chǔ)技術(shù),；人工智能、機器學習等技術(shù)的引入,，使得數(shù)據(jù)防泄露向智能化方向演進,；數(shù)據(jù)庫防護技術(shù)的發(fā)展也為數(shù)據(jù)泄露提供了有力的技術(shù)保障。密文計算技術(shù),、數(shù)據(jù)泄露追蹤技術(shù)的發(fā) 展仍無法滿足實際的應(yīng)用需求,，難以解決數(shù)據(jù)處理過程的機密性保障問題和數(shù)據(jù)流動路徑追蹤溯源問題。具體而言,，密文計算技術(shù)的研究仍處在理論階段,，運算效率遠未達到實際應(yīng)用的需求；數(shù)字水印技術(shù)無法滿足大數(shù)據(jù)環(huán)境下大量,、快速更新的應(yīng)用需求,；數(shù)據(jù)血緣追蹤技術(shù)未獲得足夠的應(yīng)用驗證，其成熟度尚未達到產(chǎn)業(yè)化應(yīng)用水平,。

隱私保護方面,，技術(shù)的發(fā)展明顯無法滿足當前迫切的隱私保護需求，大數(shù)據(jù)應(yīng)用場景下的個人信息保護問題需要構(gòu)建法律,、技術(shù),、經(jīng)濟等多重手段相結(jié)合的保障體系。目前,，應(yīng)用廣泛的數(shù)據(jù)脫敏技術(shù)受到多源數(shù)據(jù)匯聚的嚴重挑戰(zhàn)而可能面臨失效,，匿名化算法等前沿技術(shù)目前鮮有實際應(yīng)用案例，普遍存在運算效率過低,、開銷過大等問題,，還需要在算法的優(yōu)化方面進行持續(xù)改進，以滿足大數(shù)據(jù)環(huán)境下的隱私保護需求,。如前所述,，大數(shù)據(jù)應(yīng)用與個人信息保護之間的突出矛盾不單是技術(shù)問題,，尤其是在缺乏技術(shù)保障的當下，更需要通過加快立法,、加強執(zhí)法規(guī)范大數(shù)據(jù)應(yīng)用場景下的個人信息收集,、使用行為，盡快構(gòu)建政府管理,、企業(yè)履責、社會監(jiān)督,、網(wǎng)民自律等多主體共同參與的個人信息保護制度體系,。

二、大數(shù)據(jù)安全技術(shù)未來發(fā)展建議

大數(shù)據(jù)正在成為經(jīng)濟社會發(fā)展新的驅(qū)動力,，日益對經(jīng)濟運行機制,、社會生活方式和國家治理能力產(chǎn)生重要影響，大數(shù)據(jù)安全已上升到國家安全的高度,?；谒崂淼拇髷?shù)據(jù)安全問題挑戰(zhàn)與大數(shù)據(jù)安全技術(shù)發(fā)展現(xiàn)狀，我們對大數(shù)據(jù)安全技術(shù)的發(fā)展提出如下幾點建議：

（一）需要站在總體安全觀的高度,，構(gòu)建大數(shù)據(jù)安全綜合防御體系

安全是發(fā)展的前提,，必須全面提高大數(shù)據(jù)安全技術(shù)保障能力，進而構(gòu)建貫穿大數(shù)據(jù)應(yīng)用云管端的綜合立體防御體系,，以滿足國家大數(shù)據(jù)戰(zhàn)略和市場應(yīng)用的需求,。一是建立覆蓋數(shù)據(jù)收集、傳輸,、存儲,、處理、共享,、銷毀全生命周期的安全防護體系,，綜合利用數(shù)據(jù)源驗證、大規(guī)模傳輸加密,、非關(guān)系型數(shù)據(jù)庫加密存儲,、隱私保護、數(shù)據(jù)交易安全,、數(shù)據(jù)防泄露,、追蹤溯源、數(shù)據(jù)銷毀等技術(shù),，與系統(tǒng)現(xiàn)有網(wǎng)絡(luò)信息安全技術(shù) 設(shè)施相結(jié)合,，建立縱深的防御體系；二是提升大數(shù)據(jù)平臺本身的安全防御能力,，引入用戶和組件的身份認證,、細粒度的訪問控制,、數(shù)據(jù)操作安全審計、數(shù)據(jù)脫敏等隱私保護機制,，從機制上防止數(shù)據(jù)的未授權(quán)訪問和泄露,，同時增加大數(shù)據(jù)平臺組件配置和運行過程中隱含的安全問題的關(guān)注，加強對平臺緊急安全事件的響應(yīng)能力,；三是實現(xiàn)從被動防御到主動檢測的轉(zhuǎn)變,，借助大數(shù)據(jù)分析、人工智能等技術(shù),，實現(xiàn)自動化威脅識別,、風險阻斷和攻擊溯源，從源頭上提升大數(shù)據(jù)安全防御水平,，提升對未知威脅的防御能力和防御效率,。

（二）從攻防兩方面入手，強化大數(shù)據(jù)平臺安全保護

平臺安全是大數(shù)據(jù)系統(tǒng)安全的基石,，基于前面的分析可以看出,，針對大數(shù)據(jù)平臺的網(wǎng)絡(luò)攻擊手段正在發(fā)生變化，企業(yè)面臨愈加嚴峻的安全威脅和挑戰(zhàn),，傳統(tǒng)的安全監(jiān)測手段難以應(yīng)對上述攻擊變化,，未來大數(shù)據(jù)平臺安全技術(shù)的研究不僅要解決運行安全問題，還要進行理念創(chuàng)新,，針對不斷演進的網(wǎng)絡(luò)攻擊形態(tài),，設(shè)計大數(shù)據(jù)平臺安全保護體系。在安全防護技術(shù)方面,，目前無論是開源還是商業(yè)化大數(shù)據(jù)平臺,，都處在高速發(fā)展階段，在平臺安全機制方面的不足之處依然存在,，同時,，新技術(shù)新應(yīng)用的發(fā)展也為平臺安全帶來未知的安全隱患，需要產(chǎn)業(yè)各方在大數(shù)據(jù)平臺安全方面加大投入,，從攻防兩方面入手,，密切關(guān)注大數(shù)據(jù)攻擊和防御兩方面的技術(shù)發(fā)展趨勢，建立適應(yīng)大數(shù)據(jù)平臺環(huán)境的安全防護和系統(tǒng)安全管理機制,，構(gòu)筑更加安全可靠的大數(shù)據(jù)平臺,。

（三）以關(guān)鍵環(huán)節(jié)和關(guān)鍵技術(shù)為突破點，完善數(shù)據(jù)安全技術(shù)體系

大數(shù)據(jù)環(huán)境下,，數(shù)據(jù)在流動中發(fā)揮價值,，其應(yīng)用生態(tài)環(huán) 境日益復雜，數(shù)據(jù)生命周期各環(huán)節(jié)都面臨新的安全保障需求，數(shù)據(jù)的采集和溯源成為突出的安全風險點,，跨組織數(shù)據(jù)合作的廣泛開展觸發(fā)了多源匯聚計算的機密性保障需求,。目前，敏感數(shù)據(jù)識別,、數(shù)據(jù)防泄露,、數(shù)據(jù)庫安全防護等技術(shù)發(fā)展相對成熟，多源計算中的機密性保護,、非結(jié)構(gòu)化數(shù)據(jù)庫安全防護,、數(shù)據(jù)安全預警以及數(shù)據(jù)發(fā)生泄露事件的應(yīng)急響應(yīng)和追蹤溯源等方面還比較薄弱。應(yīng)積極推動產(chǎn)學研用結(jié)合,，加快密文計算等關(guān)鍵技術(shù)在運算效率提升方面的研究和應(yīng)用推廣,。企業(yè)應(yīng)加強數(shù)據(jù)采集、運算,、溯源等關(guān)鍵環(huán)節(jié)的保障能力建設(shè)，強化數(shù)據(jù)安全監(jiān)測,、預警,、控制和應(yīng)急處置能力，以數(shù)據(jù)安全關(guān)鍵環(huán)節(jié)和關(guān)鍵技術(shù)的研究為突破點,，完善大數(shù)據(jù)安全技術(shù)體系,，促進整個大數(shù)據(jù)產(chǎn)業(yè)的健康發(fā)展。

（四）加強隱私保護核心技術(shù)產(chǎn)業(yè)化投入,，兼顧數(shù)據(jù)利用和隱私保護雙重需求

在大數(shù)據(jù)應(yīng)用場景下,，數(shù)據(jù)利用和隱私保護是天然矛盾的兩端，同態(tài)加密,、多方安全計算,、匿名化等技術(shù)可以實現(xiàn)這兩者良好的平衡，是解決大數(shù)據(jù)應(yīng)用過程中隱私保護問題的理想技術(shù),，隱私保護核心技術(shù)方面的進展必然會極大推動大數(shù)據(jù)應(yīng)用的發(fā)展,。目前隱私保護技術(shù)的核心問題是效率，存在計算開銷大,、存儲開銷大,、缺乏評價標準等問題，均處于理論研究階段,，尚未在工程實踐中廣泛應(yīng)用,，難以應(yīng)對多數(shù)據(jù)源攻擊、基于統(tǒng)計的攻擊等隱私安全威脅,。大數(shù)據(jù)場景下,，個人隱私保護已成為一個備受關(guān)注的議題，未來日益膨脹的隱私保護需求將帶動專業(yè)化隱私保護技術(shù)的研發(fā)和產(chǎn) 業(yè)應(yīng)用,。需要鼓勵企業(yè),、科研機構(gòu)研究同態(tài)加密,、多方安全計算等前沿隱私保護算法，同時推動數(shù)據(jù)脫敏,、數(shù)據(jù)審計等技術(shù)手段在大數(shù)據(jù)環(huán)境下的增強應(yīng)用,，提升大數(shù)據(jù)環(huán)境下隱私保護技術(shù)水平。

（五）重視大數(shù)據(jù)安全評測技術(shù)的研發(fā),，構(gòu)建第三方安全檢測評估體系

今天的“2018年中國互聯(lián)網(wǎng)行業(yè)發(fā)展態(tài)勢”分享就到這里,，恭喜你利用碎片時間完成行業(yè)知識的學習；

待續(xù),。,。。,。,。。