“小沃”為客戶開發(fā)項目中經(jīng)常遇到開發(fā)后的平臺軟件系統(tǒng)產(chǎn)品實際運營中效果不是太好,,“小沃”也是一個刨根問底的工作狂,所以收集了對應(yīng)各行業(yè)的市場調(diào)研報告進行分析,,一方面可以精準的了解客戶開發(fā)需求,;另一方便也是能為客戶提供相關(guān)建議,避免不必要的投資,。所以萌生了每天為大家分享各行業(yè)市場調(diào)研報告的想法,,希望能給大家?guī)矸奖恪?/strong> 今天“小沃”就跟各位朋友分享下'2018年中國互聯(lián)網(wǎng)行業(yè)發(fā)展態(tài)勢'! 記不住的可以收藏或者拉倒頁尾有下載原版文件方式哦?。ù宋闹唤厝≡闹胁糠謹?shù)據(jù),,如需要原文件,請按文章尾部進行操作) 麻煩大家多多關(guān)注幫忙轉(zhuǎn)發(fā),,謝謝大家支持,! 一、大數(shù)據(jù)安全技術(shù)發(fā)展情況面對上述大數(shù)據(jù)安全挑戰(zhàn)與威脅,,產(chǎn)業(yè)各界在安全防護 技術(shù)方面進行了針對性的實踐與探索,。 (一)大數(shù)據(jù)平臺安全技術(shù) 隨著市場對大數(shù)據(jù)安全需求的增加,Hadoop開源社區(qū)增加了身份認證,、訪問控制,、數(shù)據(jù)加密等安全機制。商業(yè)化Hadoop平臺也逐步開發(fā)了集中化安全管理,、細粒度訪問控 制等安全組件,,對平臺進行了安全升級。部分安全服務(wù)提供 商也致力于通用的大數(shù)據(jù)平臺安全加固技術(shù)和產(chǎn)品的研發(fā), 已有多款大數(shù)據(jù)平臺安全產(chǎn)品上市,。這些安全機制的應(yīng)用為大數(shù)據(jù)平臺安全提供了基礎(chǔ)機制保障,。 1、Hadoop開源社區(qū)增加了基本安全機制,,但安全能力 不能滿足現(xiàn)實需求 Hadoop開源系統(tǒng)中提供了身份認證,、訪問控制、安全審計,、數(shù)據(jù)加密等基本安全功能,。身份認證方面,Hadoop 支持兩種身份驗證機制:簡單機制和 Kerberos 機制,。簡單機制是默認設(shè)置,,根據(jù)客戶進程的有效 UID 確定用戶名,只能避免內(nèi)部人員的誤操作,。Kerberos 機制支持集群中服務(wù)器 間的認證和 Client 到服務(wù)器的認證,。因為Kerberos 可以實現(xiàn)較強的安全性,同時保證較高的運行性能,,目前還沒有哪 種認證方式可以取代 Kerberos認證,。基于Kerberos 的認證 方式對于系統(tǒng)外部可以實現(xiàn)強安全認證,,但Kerberos 的認 證顆粒度基于操作系統(tǒng)用戶,,無法支持系統(tǒng)內(nèi)組件之間的身份認證。訪問控制方面,,目前大數(shù)據(jù)安全開源技術(shù)在訪問控 制方面主要有基于權(quán)限的訪問控制,、訪問控制列表、基于角色的訪問控制,、基于標簽的訪問控制和基于操作系統(tǒng)的訪問 控制等幾種方式,。POSIX權(quán)限和訪問控制列表方式可用于HDFS、MapReduce,、HBase中,,Hive支持基于角色的訪問控制,HBase和Accumulo提供了基于標簽的訪問控制,。 在以上幾種訪問控制方式中,,企業(yè)主流使用的是基于權(quán)限的訪問控制和基于角色的訪問控制。大數(shù)據(jù)場景下用戶角色眾多,,用戶需求更加多樣化,,難以精細化和細粒度地控制每個角色的實際權(quán)限,導致無法準確為用戶指定其可以訪問的數(shù) 據(jù)范圍,,實現(xiàn)細粒度訪問控制較為困難,。大數(shù)據(jù)環(huán)境訪問控制的復雜性不僅在于訪問控制的形式多樣,,另一方面在于大數(shù)據(jù)系統(tǒng)允許在不同系統(tǒng)層面廣泛共享數(shù)據(jù),需要實現(xiàn)一種集中統(tǒng)一的訪問控制從而簡化控制策略和部署,。安全審計方面,,Hadoop開源系統(tǒng)各組件均提供日志和審計文件,可以記錄數(shù)據(jù)訪問過程,,為追蹤數(shù)據(jù)流向和發(fā)現(xiàn)違規(guī)數(shù)據(jù)操作提供原始依據(jù),。但 Hadoop 各組件分別進行基本的日志和審計 記錄,并存儲在其內(nèi)部,,實現(xiàn)全系統(tǒng)的安全審計較為困難,, 需要使用外部的日志聚合系統(tǒng)從集群中所有節(jié)點拉取審計日志,放入集中化的位置進行存儲和分析,。數(shù)據(jù)加密方面,大數(shù)據(jù)環(huán)境下需要實現(xiàn)數(shù)據(jù)在靜態(tài)存儲及傳輸過程的加密保護,,其難點在于密鑰管理,。從 Hadoop2.6 開始,HDFS 支持原生靜態(tài)加密——應(yīng)用層加密,,是一種基于加密區(qū)的透明加密方法,,需要加密的目錄被分解為若干加密區(qū),當數(shù)據(jù)寫入加密區(qū)時被透明地加密,,客戶端讀取數(shù)據(jù)時被透明地解密。 對于動態(tài)傳輸數(shù)據(jù),對應(yīng) RPC,、TCP/IP 和 HTTP,,Hadoop 提供了不同的動態(tài)加密方法,保證客戶端與服務(wù)器傳輸?shù)陌踩?。目?Hadoop 開源技術(shù)能夠支持通過基于硬件的加密方案,,大幅提高數(shù)據(jù)加解密的性能,實現(xiàn)最低性能損耗的端 到端和存儲層加密,。加密的有效使用需要安全靈活的密鑰管 理和分發(fā)機制,,目前在開源環(huán)境下沒有很好的解決方式,需要借助商業(yè)化的密鑰管理產(chǎn)品,。 2,、商業(yè)化大數(shù)據(jù)平臺解決方案已經(jīng)具備相對完善的安 全機制 商 業(yè) 化 的 大 數(shù) 據(jù) 平 臺 , 如Cloudera公 司 的CDH(Cloudera Distribution Hadoop),、Hortenworks 公司的 HDP(Hortonworks Data Platform )華為公司的FusionInsight,、星環(huán)信息科技的 TDH(Transwarp Data Hub)等,在平臺安全機制上,,做了如下幾個方面的優(yōu)化,。集中安 全管理和審計方面,,通過專門的集中化的組件(如 Manager、 Ranger,、Guardian)形成了大數(shù)據(jù)平臺總體安全管理視圖,,實現(xiàn)集中的系統(tǒng)運維、安全策略管理和審計,,通過統(tǒng)一的配 置管理界面,,解決了安全策略配置和管理繁雜的難題。身份 認證方面,,通過邊界防護,,保證Hadoop集群入口的安全, 通過集中身份管理和單點登錄等方式,,簡化了認證機制,,通 過界面化的配置管理方式,可以方便的管理和啟用基于Kerberos 的認證,。訪問控制方面,,通過集中角色管理和批量 授權(quán)等機制,降低集群管理的難度,,通過基于角色或標簽的訪問控制策略,,實現(xiàn)資源(例如文件、目錄,、表,、數(shù)據(jù)庫、列族等訪問權(quán)限)的細粒度管理,。加密和密鑰管理方面,,提供靈活的加密策略,保障數(shù)據(jù)傳輸過程及靜態(tài)存儲都是以加 密形式存在,,也可以實現(xiàn)對 Hive,、HBase 的表或字段加密,同時提供更好的秘鑰存儲方案,,并能提供和企業(yè)現(xiàn)有的HSM(HardwareSecurity Module)集成的解決方案,。商業(yè)化大數(shù)據(jù)安全方案從 2008 年開始起步,經(jīng)過了大量的測試驗證,,有眾多部署實例,,大量的運行在各種生產(chǎn)環(huán)境,技術(shù)成熟度高,。由于這類安全方案的安全機制是只針對 特定平臺開發(fā),,安全保障組件僅適用于該平臺,對于其他大 數(shù)據(jù)平臺,,很難采取此類方案實現(xiàn)平臺安全加固,。 3,、商業(yè)化通用安全組件可以為已建大數(shù)據(jù)平臺提供安 全加固方案 通用安全組件是指適用于原生或二次開發(fā)的 Hadoop 平臺的安全防護機制,一般實現(xiàn)方式是通過在 Hadoop 平臺內(nèi) 部部署集中管理節(jié)點,,負責整個平臺的安全管理策略設(shè)置和 下發(fā),,實現(xiàn)對大數(shù)據(jù)平臺的用戶和系統(tǒng)內(nèi)組件的統(tǒng)一認證管 理和集中授權(quán)管理。通過在原功能組件上部署安全插件,,對數(shù)據(jù)操作指令進行解析和攔截,,實現(xiàn)安全策略的實施,從而實現(xiàn)身份認證,、訪問控制,、權(quán)限管理、邊界安全等功能,。身份認證方面,,在兼容平臺原有 Kerberos+LDAP認證機制的基礎(chǔ)上,支持口令,、手機,、PKI 等多因素組合認證方式,實現(xiàn)外部用戶認證和平臺內(nèi)部組件之間的認證,,支持用戶單點登錄。訪問控制方面,,引入DAC,、MAC、RBAC,、DTE 等 多種訪問控制模式,,實現(xiàn) HDFS 文件、計算資源,、組件等細 粒度的訪問控制,,支持安全、審計,、操作三權(quán)分立,。實現(xiàn)平 臺安全配置基線檢查,提高大數(shù)據(jù)平臺自身的安全性,。還實 現(xiàn)敏感數(shù)據(jù)的動態(tài)模糊化管理等功能,。 通用安全組件易于部署和維護、適合對已建大數(shù)據(jù)系統(tǒng) 進行安全加固,,可以在不改變現(xiàn)有系統(tǒng)架構(gòu)的前提下,,解決 企業(yè)的大數(shù)據(jù)平臺安全需求。靈活性強,,方便與現(xiàn)有的安全 機制集成,。這類產(chǎn)品的提供者一般都是專業(yè)的安全服務(wù)商,, 專注于安全問題的解決,防護機制的完備性強,,精度高,,為開源大數(shù)據(jù)平臺提供了較完備的安全加固方案。 (二)數(shù)據(jù)安全技術(shù)數(shù)據(jù)是信息系統(tǒng)的核心資產(chǎn),,是大數(shù)據(jù)安全的最終保護 對象,。除大數(shù)據(jù)平臺提供的數(shù)據(jù)安全保障機制之外,目前所采用的數(shù)據(jù)安全技術(shù),,一般是在整體數(shù)據(jù)視圖的基礎(chǔ)上,,設(shè)置分級分類的動態(tài)防護策略,降低已知風險的同時考慮減少對業(yè)務(wù)數(shù)據(jù)流動的干擾與傷害,。對于結(jié)構(gòu)化的數(shù)據(jù)安全,,主要采用數(shù)據(jù)庫審計、數(shù)據(jù)庫防火墻,,以及數(shù)據(jù)庫脫敏等數(shù)據(jù) 庫安全防護技術(shù),;對于非結(jié)構(gòu)化的數(shù)據(jù)安全,主要采用數(shù)據(jù) 泄露防護(Data leakage prevention, DLP)技術(shù),。同時,,細 粒度的數(shù)據(jù)行為審計與追蹤溯源技術(shù),能幫助系統(tǒng)在發(fā)生數(shù) 據(jù)安全事件時,,迅速定位問題,,查缺補漏。 1,、敏感數(shù)據(jù)識別技術(shù)作為數(shù)據(jù)安全監(jiān)控的必要技術(shù)條 件逐步實現(xiàn)自動化 在敏感數(shù)據(jù)的監(jiān)控方案中,,基礎(chǔ)部分就是從海量的數(shù)據(jù)中挑選出敏感數(shù)據(jù),完成對敏感數(shù)據(jù)的識別,,進而建立系統(tǒng)的總體數(shù)據(jù)視圖,,并采取分類分級的安全防護策略保護數(shù)據(jù)安全。傳統(tǒng)的數(shù)據(jù)識別方法是關(guān)鍵字,、字典和正則表達式匹配等方式,,通常結(jié)合模式匹配算法展開,該方法簡單實用,, 但人工參與的相對較多,,自動化程度較低,隨著人工智能識別技術(shù)的引入,,通過機器學習可以實現(xiàn)大量文檔的聚類分析,,自動生成分類規(guī)則庫,內(nèi)容自動化識別程度正逐步提高,。 2,、數(shù)據(jù)防泄露技術(shù)發(fā)展相對成熟并向智能化方向演進 DLP 是指通過一定的技術(shù)手段,,防止用戶的指定數(shù)據(jù)或信息資產(chǎn)以違反安全策略規(guī)定的形式流出企業(yè)的一類數(shù)據(jù)安全防護手段。針對數(shù)據(jù)泄露的主要途徑,,DLP 采用的主要技術(shù)如下:針對使用泄露和存儲泄露,,通常采用身份認證管理、進程監(jiān)控,、日志分析和安全審計等技術(shù)手段,,觀察和記錄操作員對計算機、文件,、軟件和數(shù)據(jù)的操作情況,,發(fā)現(xiàn)、識別,、監(jiān)控計算機中的敏感數(shù)據(jù)的使用和流動,,對敏感數(shù)據(jù) 的違規(guī)使用進行警告、阻斷等,。針對傳輸泄露,,通常采取敏感數(shù)據(jù)動態(tài)識別、動態(tài)加密,、訪問阻斷,、和數(shù)據(jù)庫防火墻等技術(shù),監(jiān)控服務(wù)器,、終端以及網(wǎng)絡(luò)中動態(tài)傳輸?shù)拿舾袛?shù)據(jù),,發(fā)現(xiàn)和阻止敏感數(shù)據(jù)通過聊天工具、網(wǎng)盤,、微博、FTP,、論壇等方式泄露出去,。目前的 DLP,普遍引入了自然語言處理,、機器學習,、聚類分類等新技術(shù),將數(shù)據(jù)管理的顆粒度進行了細化,,對敏感數(shù)據(jù)和安全風險進行智能識別,。'智能安全'將會 成為DLP技術(shù)發(fā)展的趨勢,大數(shù)據(jù)分析技術(shù),、機器學習算法的發(fā)展與演進將推動數(shù)據(jù)泄露防護的智能化發(fā)展,,DLP將實現(xiàn)用戶行為分析與數(shù)據(jù)內(nèi)容的智能識別,實現(xiàn)數(shù)據(jù)的智能化 分層,、分級保護,,并提供終端,、網(wǎng)絡(luò)、云端協(xié)同一體的敏感 數(shù)據(jù)動態(tài)集中管控體系,。 3,、結(jié)構(gòu)化數(shù)據(jù)庫安全防護技術(shù)基本成熟,非結(jié)構(gòu)化數(shù) 據(jù)庫安全防護亟需加強 結(jié)構(gòu)化的數(shù)據(jù)安全技術(shù)主要是指數(shù)據(jù)庫安全防護技術(shù),,可以分為事前評估加固,、事中安全管控和事后分析追責三類,其中評估主要是數(shù)據(jù)庫漏洞掃描技術(shù),,安全管控主要是數(shù)據(jù)庫防火墻,、數(shù)據(jù)加密、脫敏技術(shù),,事后分析追責主要是數(shù)據(jù)庫審計技術(shù),。目前數(shù)據(jù)庫安全防護技術(shù)發(fā)展逐步成熟。而在針對云環(huán)境和大數(shù)據(jù)環(huán)境的安全方面,,針對非結(jié)構(gòu)化數(shù)據(jù)庫的防護方案已經(jīng)由一些技術(shù)領(lǐng)先的廠商提出,,但技術(shù)成熟度 較低。 4,、密文計算技術(shù)因多源數(shù)據(jù)計算機密性需求成為研究熱點 隨著多源數(shù)據(jù)計算場景的增多,,在保證數(shù)據(jù)機密性的基礎(chǔ)上實現(xiàn)數(shù)據(jù)的流通和合作應(yīng)用一直是困擾產(chǎn)業(yè)界的難題,同態(tài)加密和安全多方計算等密文計算方法為解決這個難題 提供了一種有效的解決思路,。 同態(tài)加密提供了一種對加密數(shù)據(jù)進行處理的功能,,對經(jīng)過同態(tài)加密的數(shù)據(jù)處理得到一個輸出,將這一輸出進行解密,,其結(jié)果與統(tǒng)一方法處理未加密的原始數(shù)據(jù)得到的輸出結(jié)果一致,。也就是說,其他人可以對加密數(shù)據(jù)進行處理,,但是處 理過程不會泄露任何原始內(nèi)容,。同時,擁有密鑰的用戶對處理過的數(shù)據(jù)進行解密后,,得到的正好是處理后的結(jié)果,。因為這樣一種良好的特性,同態(tài)加密特別適合在大數(shù)據(jù)環(huán)境中應(yīng)用既能滿足數(shù)據(jù)應(yīng)用的需求,,又能保護用戶隱私不被泄露,,是一種理想的解決方案。2009年,,Gentry提出了第一個全同態(tài)加密體制使得該方面的研究取得突破性進展,,隨后許多密碼學家在全同態(tài)加密方案的研究上作出了有意義的工作, 促進了全同態(tài)加密向?qū)嵱没陌l(fā)展,但是目前同態(tài)加密算法 的計算開銷過高,,尚未應(yīng)用到實際生產(chǎn)中,。 安全多方計算(SecureMulti-PartyComputation, SMPC) 是解決一組互不信任的參與方之間保護隱私的協(xié)同計算問 題,SMPC 要確保輸入的獨立性,,計算的正確性,,同時不泄露各輸入值給參與計算的其他成員。安全多方計算的這一特點,,對于大數(shù)據(jù)環(huán)境下的數(shù)據(jù)機密性保護有獨特的優(yōu)勢,。通用的安全多方計算協(xié)議雖然可以解決一般性的安全多方計算問題,但是計算效率很低,,盡管近年來研究者努力進行實用化技術(shù)的研究,,并取得一些成果,但是離真正的產(chǎn)業(yè)化應(yīng)用還有一段距離,。 5,、數(shù)字水印和數(shù)據(jù)血緣追蹤技術(shù)發(fā)展明顯滯后于實際需求 以上的數(shù)據(jù)識別、密文計算,、安全監(jiān)控和防護是'事前' 和'事中'的安全保障技術(shù),,隨著數(shù)據(jù)泄露事件的頻繁發(fā)生, '事后'追蹤和溯源技術(shù)變得越來越重要,。安全事件發(fā)生后泄 露源頭的追查和責任的判定是及時發(fā)現(xiàn)問題,、查缺補漏的關(guān)鍵,同時,,對安全管理制度的執(zhí)行也會形成一定的威懾作用,。目前常用的追蹤溯源技術(shù)包括數(shù)字水印和數(shù)據(jù)血緣追蹤技術(shù)。 數(shù)字水印技術(shù)是為了保持對分發(fā)后的數(shù)據(jù)流向追蹤,,在數(shù)據(jù)泄露行為發(fā)生后,,對造成數(shù)據(jù)泄露的源頭可進行回溯。對于結(jié)構(gòu)化數(shù)據(jù),,在分發(fā)數(shù)據(jù)中摻雜不影響運算結(jié)果的數(shù)據(jù),, 采用增加偽行、增加偽列等方法,,拿到泄密數(shù)據(jù)的樣本,可追溯數(shù)據(jù)泄露源,。對于非結(jié)構(gòu)化數(shù)據(jù),,數(shù)字水印可以應(yīng)用于 數(shù)字圖像、音頻,、視頻,、打印、文本、條碼等數(shù)據(jù)信息中,, 在數(shù)據(jù)外發(fā)的環(huán)節(jié)加上隱蔽標識水印,,可以追蹤數(shù)據(jù)擴散路徑。但目前的數(shù)字水印方案大多還是針對靜態(tài)的數(shù)據(jù)集,,滿足數(shù)據(jù)量巨大,、更新速度極快的水印方案尚不成熟。 數(shù)據(jù)血緣(Lineage,,Provenance,,Pedigree)亦可譯為血統(tǒng)、起源,、世系,、譜系,是指數(shù)據(jù)產(chǎn)生的鏈路,,數(shù)據(jù)血緣記載了對數(shù)據(jù)處理的整個歷史,,包括數(shù)據(jù)的起源和處理這些 數(shù)據(jù)的所有后繼過程(數(shù)據(jù)產(chǎn)生、并隨著時間推移而演變的整個過程),。通過數(shù)據(jù)血緣追蹤,,可以獲得數(shù)據(jù)在數(shù)據(jù)流中的演化過程。當數(shù)據(jù)發(fā)生異常時,,通過數(shù)據(jù)血緣分析能追蹤到異常發(fā)生的原因,,把風險控制在適當?shù)乃健D壳皵?shù)據(jù)血緣分 析技術(shù)應(yīng)用尚不廣泛,,技術(shù)成熟度還未達到大規(guī)模實際的應(yīng) 用需求,。 (三)個人隱私保護技術(shù)大數(shù)據(jù)環(huán)境下,數(shù)據(jù)安全技術(shù)提供了機密性,、完整性和 可用性的防護基礎(chǔ),,隱私保護是在此基礎(chǔ)上,保證個人隱私 信息不發(fā)生泄露或不被外界知悉,。目前應(yīng)用最廣泛的是數(shù)據(jù) 脫敏技術(shù),,學術(shù)界也提出了同態(tài)加密、安全多方計算等可用 于隱私保護的密碼算法,,但應(yīng)用尚不廣泛,。 1、數(shù)據(jù)脫敏技術(shù)發(fā)展成熟,,是目前應(yīng)用最廣泛的隱私 保護技術(shù) 數(shù)據(jù)脫敏是指對某些敏感信息通過脫敏規(guī)則進行數(shù)據(jù) 的變形,,實現(xiàn)對個人數(shù)據(jù)的隱私保護,是應(yīng)用最廣泛的隱私保護技術(shù),。目前的脫敏技術(shù)主要分為如下三種:第一種加密方法,,是指標準的加密算法,,加密后完全失去業(yè)務(wù)屬性,屬于低層次脫敏,。算法開銷大,,適用于機密性要求高、不需要保持業(yè)務(wù)屬性的場景,。第二種基于數(shù)據(jù)失真的技術(shù),,最常用的是隨機干擾、亂序等,,是不可逆算法,,通過這種算法可以生成'看起來很真實的假數(shù)據(jù)'。適用于群體信息統(tǒng)計或(和)需要保持業(yè)務(wù)屬性的場景,。第三種可逆的置換算法,,兼具可逆和保證業(yè)務(wù)屬性的特征,可以通過位置變換,、表映射,、算法映射等方式實現(xiàn)。表映射方法應(yīng)用起來相對簡單,,也能解決業(yè)務(wù)屬性保留的問題,,但是隨著數(shù)據(jù)量的增大,相應(yīng)的映射表同量增大,,應(yīng)用局限性高,。算法映射方法不需要做映射表,通過自行設(shè)計的算法來實現(xiàn)數(shù)據(jù)的變換,,這類算法都是基于密碼學的基本概念自行設(shè)計的,,通常的做法是在公開算法的基礎(chǔ)上做一定的變換,適用于需要保持業(yè)務(wù)屬性或(和)需要可逆的場景,。數(shù)據(jù)應(yīng)用系統(tǒng)在選擇脫敏算法時,,可用性和隱私保護的平衡是關(guān)鍵,既要考慮系統(tǒng)開銷,,滿足業(yè)務(wù)系 統(tǒng)的需求,,又要兼顧最小可用原則,最大限度的保護用戶隱 私,。 2,、匿名化算法將成為未來解決隱私保護問題的有效途徑 數(shù)據(jù)匿名化算法可以實現(xiàn)根據(jù)具體情況有條件地發(fā)布部分數(shù)據(jù),或者數(shù)據(jù)的部分屬性內(nèi)容,,包括差分隱私,、K 匿 名、L 多樣性,、T 接近等。匿名化算法要解決的問題包括: 隱私性和可用性間的平衡問題,執(zhí)行效率問題,,度量和評價 標準問題,,動態(tài)重發(fā)布數(shù)據(jù)的匿名化問題,多維約束匿名問 題等,。匿名化算法由于能夠在數(shù)據(jù)發(fā)布環(huán)境下防止用戶敏感 數(shù)據(jù)被泄露,,同時又能保證發(fā)布數(shù)據(jù)的真實性,這一特性在大數(shù)據(jù)安全領(lǐng)域受到廣泛關(guān)注,。目前,,匿名化算法還有很多挑戰(zhàn)性問題亟待解決,算法的成熟度和使用普及程度還不是很高,。匿名化相關(guān)算法是目前數(shù)據(jù)安全領(lǐng)域的研究熱點之一,,目前取得了豐富的研究成果,也得到了一些實際應(yīng)用,,后續(xù)匿名化算法會在隱私保護方面得到越來越多的應(yīng)用,。 (四)大數(shù)據(jù)安全技術(shù)發(fā)展現(xiàn)狀總結(jié)國內(nèi)外大數(shù)據(jù)平臺安全、數(shù)據(jù)安全,、隱私保護相關(guān)的技術(shù)已經(jīng)取得了一定的進展,,但在應(yīng)對一些新的網(wǎng)絡(luò)攻擊形式、數(shù)據(jù) 應(yīng)用場景,、隱私保護需求方面,,大數(shù)據(jù)安全技術(shù)的現(xiàn)有能力 和水平還存在一定差距。 平臺安全方面,,集中的安全配置管理和安全機制部署能 夠基本滿足目前平臺的安全需求,,大數(shù)據(jù)平臺的漏洞掃描與攻擊監(jiān)測技術(shù)相對薄弱。目前的商業(yè)化大數(shù)據(jù)平臺和商業(yè)化通用安全組件,,為Hadoop生態(tài)系統(tǒng)增加了集中安全管理,、準入控制、多因素認證,、細粒度訪問控制,、密鑰管理、數(shù)據(jù) 脫敏,、集中審計等安全機制,,在一定程度上填補了大數(shù)據(jù)平 臺安全機制的空缺,基本滿足目前平臺的安全需求,,但 Hadoop仍處在快速發(fā)展的階段,,認證機制依賴Kerberos,其認證中心可能會成為系統(tǒng)瓶頸,。平臺防攻擊技術(shù)方面,,目前大數(shù)據(jù)平臺仍然使用傳統(tǒng)網(wǎng)絡(luò)安全的防護手段,,對大數(shù)據(jù)環(huán)境下擴大的防護邊界和更加隱蔽的攻擊方式無法做到全面覆蓋,而且行業(yè)對大數(shù)據(jù)平臺本身可能的攻擊手段關(guān)注較少,,預防手段不足,,一旦有新的漏洞出現(xiàn),波及范圍將十分巨大,。 數(shù)據(jù)安全方面,,數(shù)據(jù)安全監(jiān)控和防泄露技術(shù)相對成熟, 數(shù)據(jù)的共享安全,、非結(jié)構(gòu)化數(shù)據(jù)庫的安全防護以及數(shù)據(jù)泄露溯源技術(shù)亟待改進,。目前,數(shù)據(jù)泄露問題在技術(shù)上可以得到較完備的解決,,敏感數(shù)據(jù)自動化識別為防泄露提供了基礎(chǔ)技術(shù),;人工智能、機器學習等技術(shù)的引入,,使得數(shù)據(jù)防泄露向 智能化方向演進,;數(shù)據(jù)庫防護技術(shù)的發(fā)展也為數(shù)據(jù)泄露提供 了有力的技術(shù)保障。密文計算技術(shù),、數(shù)據(jù)泄露追蹤技術(shù)的發(fā) 展仍無法滿足實際的應(yīng)用需求,,難以解決數(shù)據(jù)處理過程的機 密性保障問題和數(shù)據(jù)流動路徑追蹤溯源問題。具體而言,,密文計算技術(shù)的研究仍處在理論階段,,運算效率遠未達到實際 應(yīng)用的需求;數(shù)字水印技術(shù)無法滿足大數(shù)據(jù)環(huán)境下大量,、快速更新的應(yīng)用需求,;數(shù)據(jù)血緣追蹤技術(shù)未獲得足夠的應(yīng)用驗證,其成熟度尚未達到產(chǎn)業(yè)化應(yīng)用水平,。 隱私保護方面,,技術(shù)的發(fā)展明顯無法滿足當前迫切的隱 私保護需求,大數(shù)據(jù)應(yīng)用場景下的個人信息保護問題需要構(gòu)建法律,、技術(shù),、經(jīng)濟等多重手段相結(jié)合的保障體系。目前,,應(yīng)用廣泛的數(shù)據(jù)脫敏技術(shù)受到多源數(shù)據(jù)匯聚的嚴重挑戰(zhàn)而 可能面臨失效,,匿名化算法等前沿技術(shù)目前鮮有實際應(yīng)用案 例,普遍存在運算效率過低,、開銷過大等問題,,還需要在算 法的優(yōu)化方面進行持續(xù)改進,以滿足大數(shù)據(jù)環(huán)境下的隱私保 護需求,。如前所述,,大數(shù)據(jù)應(yīng)用與個人信息保護之間的突出 矛盾不單是技術(shù)問題,,尤其是在缺乏技術(shù)保障的當下,更需 要通過加快立法,、加強執(zhí)法規(guī)范大數(shù)據(jù)應(yīng)用場景下的個人信息收集,、使用行為,盡快構(gòu)建政府管理,、企業(yè)履責、社會監(jiān)督,、網(wǎng)民自律等多主體共同參與的個人信息保護制度體系,。 二、大數(shù)據(jù)安全技術(shù)未來發(fā)展建議大數(shù)據(jù)正在成為經(jīng)濟社會發(fā)展新的驅(qū)動力,,日益對經(jīng)濟 運行機制,、社會生活方式和國家治理能力產(chǎn)生重要影響,大數(shù)據(jù)安全已上升到國家安全的高度,?;谒崂淼拇髷?shù)據(jù)安 全問題挑戰(zhàn)與大數(shù)據(jù)安全技術(shù)發(fā)展現(xiàn)狀,我們對大數(shù)據(jù)安全 技術(shù)的發(fā)展提出如下幾點建議: (一)需要站在總體安全觀的高度,,構(gòu)建大數(shù)據(jù)安全綜 合防御體系 安全是發(fā)展的前提,,必須全面提高大數(shù)據(jù)安全技術(shù)保障能力,進而構(gòu)建貫穿大數(shù)據(jù)應(yīng)用云管端的綜合立體防御體系,,以滿足國家大數(shù)據(jù)戰(zhàn)略和市場應(yīng)用的需求,。一是建立覆蓋數(shù)據(jù)收集、傳輸,、存儲,、處理、共享,、銷毀全生命周期的安全 防護體系,,綜合利用數(shù)據(jù)源驗證、大規(guī)模傳輸加密,、非關(guān)系 型數(shù)據(jù)庫加密存儲,、隱私保護、數(shù)據(jù)交易安全,、數(shù)據(jù)防泄露,、 追蹤溯源、數(shù)據(jù)銷毀等技術(shù),,與系統(tǒng)現(xiàn)有網(wǎng)絡(luò)信息安全技術(shù) 設(shè)施相結(jié)合,,建立縱深的防御體系;二是提升大數(shù)據(jù)平臺本 身的安全防御能力,,引入用戶和組件的身份認證,、細粒度的 訪問控制,、數(shù)據(jù)操作安全審計、數(shù)據(jù)脫敏等隱私保護機制,, 從機制上防止數(shù)據(jù)的未授權(quán)訪問和泄露,,同時增加大數(shù)據(jù)平臺組件配置和運行過程中隱含的安全問題的關(guān)注,加強對平臺緊急安全事件的響應(yīng)能力,;三是實現(xiàn)從被動防御到主動檢 測的轉(zhuǎn)變,,借助大數(shù)據(jù)分析、人工智能等技術(shù),,實現(xiàn)自動化 威脅識別,、風險阻斷和攻擊溯源,從源頭上提升大數(shù)據(jù)安全 防御水平,,提升對未知威脅的防御能力和防御效率,。 (二)從攻防兩方面入手,強化大數(shù)據(jù)平臺安全保護 平臺安全是大數(shù)據(jù)系統(tǒng)安全的基石,,基于前面的分析可以看出,,針對大數(shù)據(jù)平臺的網(wǎng)絡(luò)攻擊手段正在發(fā)生變化,企業(yè)面臨愈加嚴峻的安全威脅和挑戰(zhàn),,傳統(tǒng)的安全監(jiān)測手段難 以應(yīng)對上述攻擊變化,,未來大數(shù)據(jù)平臺安全技術(shù)的研究不僅要解決運行安全問題,還要進行理念創(chuàng)新,,針對不斷演進的網(wǎng)絡(luò)攻擊形態(tài),,設(shè)計大數(shù)據(jù)平臺安全保護體系。在安全防護技術(shù)方面,,目前無論是開源還是商業(yè)化大數(shù)據(jù)平臺,,都處在高速發(fā)展階段,在平臺安全機制方面的不足之處依然存在,,同時,,新技術(shù)新應(yīng)用的發(fā)展也為平臺安全帶來未知的安全隱 患,需要產(chǎn)業(yè)各方在大數(shù)據(jù)平臺安全方面加大投入,,從攻防兩方面入手,,密切關(guān)注大數(shù)據(jù)攻擊和防御兩方面的技術(shù)發(fā)展 趨勢,建立適應(yīng)大數(shù)據(jù)平臺環(huán)境的安全防護和系統(tǒng)安全管理 機制,,構(gòu)筑更加安全可靠的大數(shù)據(jù)平臺,。 (三)以關(guān)鍵環(huán)節(jié)和關(guān)鍵技術(shù)為突破點,完善數(shù)據(jù)安全 技術(shù)體系 大數(shù)據(jù)環(huán)境下,,數(shù)據(jù)在流動中發(fā)揮價值,,其應(yīng)用生態(tài)環(huán) 境日益復雜,數(shù)據(jù)生命周期各環(huán)節(jié)都面臨新的安全保障需求,數(shù)據(jù)的采集和溯源成為突出的安全風險點,,跨組織數(shù)據(jù)合作的廣泛開展觸發(fā)了多源匯聚計算的機密性保障需求,。目前,敏感數(shù)據(jù)識別,、數(shù)據(jù)防泄露,、數(shù)據(jù)庫安全防護等技術(shù)發(fā)展相對成熟,多源計算中的機密性保護,、非結(jié)構(gòu)化數(shù)據(jù)庫安全防護,、數(shù)據(jù)安全預警以及數(shù)據(jù)發(fā)生泄露事件的應(yīng)急響應(yīng)和追蹤溯源等方面還比較薄弱。應(yīng)積極推動產(chǎn)學研用結(jié)合,,加快密文計算等關(guān)鍵技術(shù)在運算效率提升方面的研究和應(yīng)用推廣,。企業(yè)應(yīng)加強數(shù)據(jù)采集、運算,、溯源等關(guān)鍵環(huán)節(jié)的保障能力建設(shè),強化數(shù)據(jù)安全監(jiān)測,、預警,、控制和應(yīng)急處置能力,以數(shù)據(jù)安全關(guān)鍵環(huán)節(jié)和關(guān)鍵技術(shù)的研究為突破點,,完善大數(shù)據(jù)安全技術(shù)體系,,促進整個大數(shù)據(jù)產(chǎn)業(yè)的健康發(fā)展。 (四)加強隱私保護核心技術(shù)產(chǎn)業(yè)化投入,,兼顧數(shù)據(jù)利 用和隱私保護雙重需求 在大數(shù)據(jù)應(yīng)用場景下,,數(shù)據(jù)利用和隱私保護是天然矛盾的兩端,同態(tài)加密,、多方安全計算,、匿名化等技術(shù)可以實現(xiàn)這兩者良好的平衡,是解決大數(shù)據(jù)應(yīng)用過程中隱私保護問題的理想技術(shù),,隱私保護核心技術(shù)方面的進展必然會極大推動 大數(shù)據(jù)應(yīng)用的發(fā)展,。目前隱私保護技術(shù)的核心問題是效率,存在計算開銷大,、存儲開銷大,、缺乏評價標準等問題,均處于理論研究階段,,尚未在工程實踐中廣泛應(yīng)用,,難以應(yīng)對多數(shù)據(jù)源攻擊、基于統(tǒng)計的攻擊等隱私安全威脅,。大數(shù)據(jù)場景下,,個人隱私保護已成為一個備受關(guān)注的議題,未來日益膨 脹的隱私保護需求將帶動專業(yè)化隱私保護技術(shù)的研發(fā)和產(chǎn) 業(yè)應(yīng)用,。需要鼓勵企業(yè),、科研機構(gòu)研究同態(tài)加密,、多方安全計算等前沿隱私保護算法,同時推動數(shù)據(jù)脫敏,、數(shù)據(jù)審計等技術(shù)手段在大數(shù)據(jù)環(huán)境下的增強應(yīng)用,,提升大數(shù)據(jù)環(huán)境下隱 私保護技術(shù)水平。 (五)重視大數(shù)據(jù)安全評測技術(shù)的研發(fā),,構(gòu)建第三方安 全檢測評估體系 今天的“2018年中國互聯(lián)網(wǎng)行業(yè)發(fā)展態(tài)勢”分享就到這里,,恭喜你利用碎片時間完成行業(yè)知識的學習; 待續(xù),。,。。,。,。。 |
|