久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

208個(gè)最新最全大數(shù)據(jù)/人工智能專有名詞術(shù)語 中英對(duì)照(下)

 新華書店好書榜 2017-08-03

接上篇

208個(gè)最新最全大數(shù)據(jù)/人工智能專有名詞術(shù)語 中英對(duì)照(上)


K


鍵值數(shù)據(jù)庫(KeyValue Databases) :數(shù)據(jù)的存儲(chǔ)方式是使用一個(gè)特定的鍵,,指向一個(gè)特定的數(shù)據(jù)記錄,這種方式使得數(shù)據(jù)的查找更加方便快捷,。鍵值數(shù)據(jù)庫中所存的數(shù)據(jù)通常為編程語言中基本數(shù)據(jù)類型的數(shù)據(jù),。

L


負(fù)載均衡(Load balancing):為了實(shí)現(xiàn)最佳的結(jié)果和對(duì)系統(tǒng)的利用,將負(fù)載分發(fā)給多個(gè)計(jì)算機(jī)或者服務(wù)器。


延遲(Latency) :表示系統(tǒng)時(shí)間的延遲


日志分析( Log Analytics ):的詳細(xì)信息,它是一種面向 IT 管理員的強(qiáng)大可視化和分析工具,可幫助他們輕松管理數(shù)據(jù)中心環(huán)境,。


遺留系統(tǒng)(Legacy system) :是一種舊的應(yīng)用程序,,或是舊的技術(shù),或是舊的計(jì)算系統(tǒng),,現(xiàn)在已經(jīng)不再支持了,。


位置信息(Location data) :GPS信息,即地理位置信息,。


日志文件(Log file) :由計(jì)算機(jī)系統(tǒng)自動(dòng)生成的文件,記錄系統(tǒng)的運(yùn)行過程,。

M


元數(shù)據(jù)(Metadata):元數(shù)據(jù)就是能夠描述其他數(shù)據(jù)的數(shù)據(jù),。元數(shù)據(jù)總結(jié)了數(shù)據(jù)的基本信息,這使得查找和使用特定的數(shù)據(jù)實(shí)例變得更加容易,。例如,,作者、數(shù)據(jù)的創(chuàng)建日期,、修改日期以及大小,,這幾項(xiàng)是基本的文檔元數(shù)據(jù)。除了文檔文件之外,,元數(shù)據(jù)還被用于圖像,、視頻、電子表格和網(wǎng)頁,。


MongoDB: 是一個(gè)面向文本數(shù)據(jù)模型的跨平臺(tái)開源數(shù)據(jù)庫,,而不是傳統(tǒng)的基于表格的關(guān)系數(shù)據(jù)庫。這種數(shù)據(jù)庫結(jié)構(gòu)的主要設(shè)計(jì)目的是讓結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)在特定類型應(yīng)用的整合更快,、更容易,。


Mashup:這個(gè)術(shù)語和我們?cè)谌粘I钪惺褂玫摹竚ashup」一詞有著相近的含義,就是混搭的意思,。實(shí)質(zhì)上,,mashup 是一個(gè)將不同的數(shù)據(jù)集合并到一個(gè)單獨(dú)應(yīng)用中的方法(例如:將房地產(chǎn)數(shù)據(jù)與地理位置數(shù)據(jù)、人口數(shù)據(jù)結(jié)合起來),。這確實(shí)能夠讓可視化變得很酷,。


多維數(shù)據(jù)庫(Multi-Dimensional Databases):這是一個(gè)為了數(shù)據(jù)在線分析處理(OLAP)和數(shù)據(jù)倉庫優(yōu)化而來的數(shù)據(jù)庫。如果你不知道數(shù)據(jù)倉庫是什么,,我可以解釋一下,,數(shù)據(jù)倉庫不是別的什么東西,它只是對(duì)多個(gè)數(shù)據(jù)源的數(shù)據(jù)做了集中存儲(chǔ),。


機(jī)器學(xué)習(xí)(Machine Learning):機(jī)器學(xué)習(xí)是基于喂入的數(shù)據(jù)去設(shè)計(jì)能夠?qū)W習(xí),、調(diào)整和提升的系統(tǒng)的一種方法。使用設(shè)定的預(yù)測(cè)和統(tǒng)計(jì)算法,它們持續(xù)地逼近「正確的」行為和想法,,隨著更多的數(shù)據(jù)被輸入到系統(tǒng),,它們能夠進(jìn)一步提升。


MapReduce: MapReduce 中,,程序模型首先將大數(shù)據(jù)集分割成一些小塊(這些小塊拿技術(shù)術(shù)語來講叫做「元組」,,但是我描述的時(shí)候會(huì)盡量避免晦澀的技術(shù)術(shù)語),然后這些小塊會(huì)被分發(fā)給不同位置上的不同計(jì)算機(jī)(也就是說之前描述過的集群),,這在 Map 過程是必須的,。然后模型會(huì)收集每個(gè)計(jì)算結(jié)果,并且將它們「reduce」成一個(gè)部分,。MapReduce 的數(shù)據(jù)處理模型和 Hadoop 分布式文件系統(tǒng)是分不開的,。


M2M數(shù)據(jù)(Machine2Machine data) :兩臺(tái)或多臺(tái)機(jī)器間交流與傳輸?shù)膬?nèi)容


機(jī)器數(shù)據(jù)(Machine data) :由傳感器或算法在機(jī)器上產(chǎn)生的數(shù)據(jù)


企業(yè)級(jí)市場(chǎng)(Marketing-B2B):即面對(duì)企業(yè)用戶進(jìn)行銷售,營(yíng)銷和推廣.


MapReduce :是處理大規(guī)模數(shù)據(jù)的一種軟件框架(Map: 映射,Reduce: 歸納),。


大規(guī)模并行處理(MPP: Massively Parallel Processing) :同時(shí)使用多個(gè)處理器(或多臺(tái)計(jì)算機(jī))處理同一個(gè)計(jì)算任務(wù),。


電子商務(wù)市場(chǎng)(Marketing-B2C)是以信息網(wǎng)絡(luò)技術(shù)為手段,以商品交換為中心的商務(wù)活動(dòng),;也可理解為在互聯(lián)網(wǎng)(Internet),、企業(yè)內(nèi)部網(wǎng)(Intranet)和增值網(wǎng)(VAN,Value Added Network)上以電子交易方式進(jìn)行交易活動(dòng)和相關(guān)服務(wù)的活動(dòng),,是傳統(tǒng)商業(yè)活動(dòng)各環(huán)節(jié)的電子化,、網(wǎng)絡(luò)化、信息化


MongoDB :一種開源的非關(guān)系型數(shù)據(jù)庫(NoSQL database)


多值數(shù)據(jù)庫(MultiValue Databases) :是一種非關(guān)系型數(shù)據(jù)庫(NoSQL), 一種特殊的多維數(shù)據(jù)庫:能處理3個(gè)維度的數(shù)據(jù),。主要針對(duì)非常長(zhǎng)的字符串,,能夠完美地處理HTML和XML中的字串。


移動(dòng)互聯(lián)網(wǎng)(Mobile Internet):就是將移動(dòng)通信和互聯(lián)網(wǎng)二者結(jié)合起來,,成為一體,。是指互聯(lián)網(wǎng)的技術(shù)、平臺(tái),、商業(yè)模式和應(yīng)用與移動(dòng)通信技術(shù)結(jié)合并實(shí)踐的活動(dòng)的總稱,。


大規(guī)模并行處理(Massively Parallel Processor ):在數(shù)據(jù)庫非共享集群中,每個(gè)節(jié)點(diǎn)都有獨(dú)立的磁盤存儲(chǔ)系統(tǒng)和內(nèi)存系統(tǒng),,業(yè)務(wù)數(shù)據(jù)根據(jù)數(shù)據(jù)庫模型和應(yīng)用特點(diǎn)劃分到各個(gè)節(jié)點(diǎn)上,,每臺(tái)數(shù)據(jù)節(jié)點(diǎn)通過專用網(wǎng)絡(luò)或者商業(yè)通用網(wǎng)絡(luò)互相連接,彼此協(xié)同計(jì)算,,作為整體提供數(shù)據(jù) 庫服務(wù),。非共享數(shù)據(jù)庫集群有完全的可伸縮性、高可用,、高性能,、優(yōu)秀的性價(jià)比、資源共享等優(yōu)勢(shì)。

N


非關(guān)系型數(shù)據(jù)庫( Not Only SQL):這個(gè)詞聽起來幾乎就是「SQL,,結(jié)構(gòu)化查詢語言」的反義詞,,SQL 是傳統(tǒng)的關(guān)系型數(shù)據(jù)管理系統(tǒng)(RDBMS)必需的,但是 NOSQL 實(shí)際上指的是「不止 SQL」,。NoSQL 實(shí)際上指的是那些被設(shè)計(jì)來處理沒有結(jié)構(gòu)(或者沒有「schema」,,綱要)的大量數(shù)據(jù)的數(shù)據(jù)庫管理系統(tǒng)。NoSQL 適合大數(shù)據(jù)系統(tǒng),,因?yàn)榇笠?guī)模的非結(jié)構(gòu)化數(shù)據(jù)庫需要 NoSQL 的這種靈活性和分布式優(yōu)先的特點(diǎn),。


自然語言處理(Natural Language Processing):自然語言處理是被設(shè)計(jì)來讓計(jì)算機(jī)更加準(zhǔn)確地理解人類日常語言的軟件算法,能夠讓人類更加自然,、更加有效地和計(jì)算機(jī)交互,。


神經(jīng)網(wǎng)絡(luò)(Neural Network):神經(jīng)網(wǎng)絡(luò)是一個(gè)受生物學(xué)啟發(fā)的非常漂亮的編程范式,它能夠讓計(jì)算機(jī)從觀察到的數(shù)據(jù)中學(xué)習(xí),。已經(jīng)好久沒有一個(gè)人會(huì)說一個(gè)編程范式很漂亮了。實(shí)際上,,神經(jīng)網(wǎng)絡(luò)就是受現(xiàn)實(shí)生活中腦生物學(xué)啟發(fā)的模型....... 與神經(jīng)網(wǎng)絡(luò)緊密關(guān)聯(lián)的一個(gè)術(shù)語就是深度學(xué)習(xí),。


深度學(xué)習(xí)(Deep learning):是神經(jīng)網(wǎng)絡(luò)中一系列學(xué)習(xí)技術(shù)的集合。


網(wǎng)絡(luò)分析(Network analysis) :分析網(wǎng)絡(luò)或圖論中節(jié)點(diǎn)間的關(guān)系,,即分析網(wǎng)絡(luò)中節(jié)點(diǎn)間的連接和強(qiáng)度關(guān)系,。


NewSQL: 一個(gè)優(yōu)雅的、定義良好的數(shù)據(jù)庫系統(tǒng),,比SQL更易學(xué)習(xí)和使用,,比NoSQL更晚提出的新型數(shù)據(jù)庫


NoSQL :顧名思義,就是“不使用SQL”的數(shù)據(jù)庫,。這類數(shù)據(jù)庫泛指?jìng)鹘y(tǒng)關(guān)系型數(shù)據(jù)庫以外的其他類型的數(shù)據(jù)庫,。這類數(shù)據(jù)庫有更強(qiáng)的一致性,能處理超大規(guī)模和高并發(fā)的數(shù)據(jù),。


O


對(duì)象數(shù)據(jù)庫(Object Databases) :(也稱為面象對(duì)象數(shù)據(jù)庫)以對(duì)象的形式存儲(chǔ)數(shù)據(jù),,用于面向?qū)ο缶幊獭K煌陉P(guān)系型數(shù)據(jù)庫和圖形數(shù)據(jù)庫,,大部分對(duì)象數(shù)據(jù)庫都提供一種查詢語言,,允許使用聲明式編程(declarative programming)訪問對(duì)象.


開放源代碼(Open source code):也稱為源代碼公開,指的是一種軟件發(fā)布模式,。一般的軟件僅可取得已經(jīng)過編譯的二進(jìn)制可執(zhí)行檔,,通常只有軟件的作者或著作權(quán)所有者等擁有程序的原始碼,。有些軟件的作者會(huì)將原始碼公開,此稱之為“源代碼公開”,但這并不一定符合“開放原代碼”的定義及條件,,因?yàn)樽髡呖赡軙?huì)設(shè)定公開原始碼的條件限制,,例如限制可閱讀原始碼的對(duì)象、限制衍生品等,。


辦公自動(dòng)化(Office Automation,,簡(jiǎn)稱OA):是將現(xiàn)代化辦公和計(jì)算機(jī)技術(shù)結(jié)合起來的一種新型的辦公方式。辦公自動(dòng)化沒有統(tǒng)一的定義,,凡是在傳統(tǒng)的辦公室中采用各種新技術(shù),、新機(jī)器、新設(shè)備從事辦公業(yè)務(wù),,都屬于辦公自動(dòng)化的領(lǐng)域,。通過實(shí)現(xiàn)辦公自動(dòng)化,或者說實(shí)現(xiàn)數(shù)字化辦公,,可以優(yōu)化現(xiàn)有的管理組織結(jié)構(gòu),,調(diào)整管理體制,在提高效率的基礎(chǔ)上,,增加協(xié)同辦公能力,,強(qiáng)化決策的一致性 。


基于對(duì)象圖像分析(Object-based Image Analysis) :數(shù)字圖像分析方法是對(duì)每一個(gè)像素的數(shù)據(jù)進(jìn)行分析,,而基于對(duì)象的圖像分析方法則只分析相關(guān)像素的數(shù)據(jù),,這些相關(guān)像素被稱為對(duì)象或圖像對(duì)象。


操作型數(shù)據(jù)庫(Operational Databases) :這類數(shù)據(jù)庫可以完成一個(gè)組織機(jī)構(gòu)的常規(guī)操作,,對(duì)商業(yè)運(yùn)營(yíng)非常重要,,一般使用在線事務(wù)處理,允許用戶訪問 ,、收集,、檢索公司內(nèi)部的具體信息。


優(yōu)化分析(Optimization analysis) :在產(chǎn)品設(shè)計(jì)周期依靠算法來實(shí)現(xiàn)的優(yōu)化過程,,在這一過程中,,公司可以設(shè)計(jì)各種各樣的產(chǎn)品并測(cè)試這些產(chǎn)品是否滿足預(yù)設(shè)值。


本體論(Ontology) :表示知識(shí)本體,,用于定義一個(gè)領(lǐng)域中的概念集及概念之間的關(guān)系的一種哲學(xué)思想,。(譯者注: 數(shù)據(jù)被提高到哲學(xué)的高度,被賦予了世界本體的意義,,成為一個(gè)獨(dú)立的客觀數(shù)據(jù)世界)


異常值檢測(cè)(Outlier detection) :異常值是指嚴(yán)重偏離一個(gè)數(shù)據(jù)集或一個(gè)數(shù)據(jù)組合總平均值的對(duì)象,,該對(duì)象與數(shù)據(jù)集中的其他它相去甚遠(yuǎn),因此,,異常值的出現(xiàn)意味著系統(tǒng)發(fā)生問題,,需要對(duì)此另加分析,。

P


模式識(shí)別(Pattern Recognition):當(dāng)算法需要在大規(guī)模數(shù)據(jù)集或者在不同的數(shù)據(jù)集上確定回歸或者規(guī)律的時(shí)候,就出現(xiàn)了模式識(shí)別,。它與機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘緊密相連,,甚至被認(rèn)為是后兩者的代名詞。這種可見性可以幫助研究者發(fā)現(xiàn)一些深刻的規(guī)律或者得到一些可能被認(rèn)為很荒謬的結(jié)論,。


規(guī)范性分析(Prescriptive Analytics):這里我們還是用信用卡轉(zhuǎn)賬的例子來理解,。假如你想找出自己的哪類消費(fèi)(如食品、娛樂,、衣物等等)可以對(duì)整體消費(fèi)產(chǎn)生巨大影響,,那么基于預(yù)測(cè)性分析(Predictive Analytics)的規(guī)范性分析法通過引入「動(dòng)態(tài)指標(biāo)(action)」(如減少食品或衣物或娛樂)以及對(duì)由此產(chǎn)生的結(jié)果進(jìn)行分析來規(guī)定一個(gè)可以降低你整體開銷的最佳消費(fèi)項(xiàng)。你可以將它延伸到大數(shù)據(jù)領(lǐng)域,,并想象一個(gè)負(fù)責(zé)人是如何通過觀察他面前多種動(dòng)態(tài)指標(biāo)的影響,,進(jìn)而作出所謂由「數(shù)據(jù)驅(qū)動(dòng)」的決策的,。


P字節(jié)(PB: Petabytes) :約等于1000 TB(terabytes), 約等于1百萬 GB (gigabytes)。歐洲核子研究中心(CERN)大型強(qiáng)子對(duì)撞機(jī)每秒產(chǎn)生的粒子個(gè)數(shù)就約為1 PB


平臺(tái)即服務(wù)(PaaS: Platform-as-a-Service) :為云計(jì)算解決方案提供所有必需的基礎(chǔ)平臺(tái)的一種服務(wù)


預(yù)測(cè)性分析法(Predictive Analytics):如果你對(duì)過去 5 年信用卡消費(fèi)的歷史進(jìn)行了分析,,發(fā)現(xiàn)每年的消費(fèi)情況基本上呈現(xiàn)一個(gè)連續(xù)變化的趨勢(shì),,那么在這種情況下你就可以高概率預(yù)測(cè)出:來年的消費(fèi)狀態(tài)應(yīng)該和以往是類似的。這不是說我們?cè)陬A(yù)測(cè)未來,,而是應(yīng)該理解為,,我們?cè)凇赣酶怕暑A(yù)測(cè)」可能發(fā)生什么事情,。在大數(shù)據(jù)的預(yù)測(cè)分析中,數(shù)據(jù)科學(xué)家可能會(huì)使用先進(jìn)的技術(shù),,如機(jī)器學(xué)習(xí),,和先進(jìn)的統(tǒng)計(jì)學(xué)處理方法(這部分后面我們會(huì)談到)來預(yù)測(cè)天氣情況、經(jīng)濟(jì)變化等等,。


隱私(Privacy):把具有可識(shí)別出個(gè)人信息的數(shù)據(jù)與其他數(shù)據(jù)分離開,,以確保用戶隱私。


公共數(shù)據(jù)(Public data) :由公共基金創(chuàng)建的公共信息或公共數(shù)據(jù)集,。

Q


數(shù)字化自我(Quantified Self) :使用應(yīng)用程序跟蹤用戶一天的一舉一動(dòng),,從而更好地理解其相關(guān)的行為


查詢(Query) :查找某個(gè)問題答案的相關(guān)信息

R


R 語言:這還有人能給一個(gè)編程語言起一個(gè)更加糟糕的名字嗎?R 語言就是這樣的語言。不過,,R 語言是一個(gè)在統(tǒng)計(jì)工作中工作得很好的語言,。如果你不知道 R 語言,別說你是數(shù)據(jù)科學(xué)家,。因?yàn)?R 語言是數(shù)據(jù)科學(xué)中最流行的編程語言之一,。


射頻識(shí)別(Radio Frequency Identification/RFID):射頻識(shí)別是一類使用非接觸性無線射頻電磁場(chǎng)來傳輸數(shù)據(jù)的傳感器,。隨著物聯(lián)網(wǎng)的發(fā)展,RFID 標(biāo)簽?zāi)軌虮磺度氲饺魏慰赡艿摹笘|西里面」,,這能夠生成很多需要被分析的數(shù)據(jù),。歡迎來到數(shù)據(jù)世界。


再識(shí)別(Re-identification) :將多個(gè)數(shù)據(jù)集合并在一起,,從匿名化的數(shù)據(jù)中識(shí)別出個(gè)人信息


回歸分析(Regression analysis) :確定兩個(gè)變量間的依賴關(guān)系,。這種方法假設(shè)兩個(gè)變量之間存在單向的因果關(guān)系(譯者注:自變量,因變量,,二者不可互換)


射頻識(shí)別(RFID) :這種識(shí)別技術(shù)使用一種無線非接觸式射頻電磁場(chǎng)傳感器來傳輸數(shù)據(jù)


實(shí)時(shí)數(shù)據(jù)(Real-time data) :指在幾毫秒內(nèi)被創(chuàng)建,、處理,、存儲(chǔ),、分析并顯示的數(shù)據(jù)


推薦引擎(Recommendation engine) :推薦引擎算法根據(jù)用戶之前的購買行為或其他購買行為向用戶推薦某種產(chǎn)品


路徑分析(Routing analysis) :針對(duì)某種運(yùn)輸方法通過使用多種不同的變量分析從而找到一條最優(yōu)路徑,,以達(dá)到降低燃料費(fèi)用,,提高效率的目的

S


流處理(Stream processing):流處理被設(shè)計(jì)來用于持續(xù)地進(jìn)行流數(shù)據(jù)的處理。與流分析技術(shù)(指的是能夠持續(xù)地計(jì)算數(shù)值和統(tǒng)計(jì)分析的能力)結(jié)合起來,,流處理方法特別能夠針對(duì)大規(guī)模數(shù)據(jù)的實(shí)時(shí)處理。


社交分析(Social analytics):指基于信息學(xué),、數(shù)學(xué)、社會(huì)學(xué),、管理學(xué),、心理學(xué)等多學(xué)科的融合理論和方法,為理解人類各種社交關(guān)系的形成,、行為特點(diǎn)分析以及信息傳播的規(guī)律提供的一種可計(jì)算的分析方法,。


結(jié)構(gòu)化 vs 非結(jié)構(gòu)化數(shù)據(jù)(Structured v Unstructured Data):這是大數(shù)據(jù)中的對(duì)比之一。結(jié)構(gòu)化數(shù)據(jù)基本上是那些能夠被放在關(guān)系型數(shù)據(jù)庫中的任何數(shù)據(jù),,以這種方式組織的數(shù)據(jù)可以與其他數(shù)據(jù)通過表格來關(guān)聯(lián),。非結(jié)構(gòu)化數(shù)據(jù)是指任何不能夠被放在關(guān)系型數(shù)據(jù)庫中的數(shù)據(jù),例如郵件信息,、社交媒體上的狀態(tài),,以及人類語音等等。


軟件即服務(wù)(SaaS):軟件即服務(wù)讓服務(wù)提供商把應(yīng)用托管在互聯(lián)網(wǎng)上,。SaaS 提供商在云端提供服務(wù),。


半結(jié)構(gòu)化數(shù)據(jù)(Semi-structured data):半結(jié)構(gòu)化數(shù)據(jù)指的是那些沒有以傳統(tǒng)的方法進(jìn)行格式化的數(shù)據(jù),例如那些與傳統(tǒng)數(shù)據(jù)庫相關(guān)的數(shù)據(jù)域或者常用的數(shù)據(jù)模型,。半結(jié)構(gòu)化數(shù)據(jù)也不是完全原始的數(shù)據(jù)或者完全非結(jié)構(gòu)化的數(shù)據(jù),,它可能會(huì)包含一些數(shù)據(jù)表,、標(biāo)簽或者其他的結(jié)構(gòu)元素。半結(jié)構(gòu)化數(shù)據(jù)的例子有圖,、表,、XML 文檔以及電子郵件。半結(jié)構(gòu)化數(shù)據(jù)在萬維網(wǎng)上十分流行,,在面向?qū)ο髷?shù)據(jù)庫中經(jīng)常能夠被找到,。


存儲(chǔ)(Storage):一方面它是數(shù)據(jù)臨時(shí)或長(zhǎng)期駐留的物理媒介;另一方面,,它是保證數(shù)據(jù)完整安全存放的方式或行為,。存儲(chǔ)就是把這兩個(gè)方面結(jié)合起來,向客戶提供一套數(shù)據(jù)存放解決方案,。


內(nèi)存數(shù)據(jù)流(Streaming/in memory):是一種數(shù)據(jù)傳送技術(shù),,它把客戶機(jī)收到的數(shù)據(jù)變成一個(gè)穩(wěn)定連續(xù)的流,源源不斷地送出,,使用戶聽到的聲音或看到的圖象十分平穩(wěn),,而且用戶在整個(gè)文件送完之前就可以開始在屏幕上瀏覽文件。這在目前大多數(shù)用戶因接入瓶頸而不具備快速下載大型多媒體文件的情況下尤為重要,。


情感分析(Sentiment Analysis):情感分析涉及到了對(duì)消費(fèi)者在社交媒體,、顧客代表電話訪談和調(diào)查中存在的多種類型的交互和文檔中所表達(dá)的情感、情緒和意見的捕捉,、追蹤和分析,。文本分析和自然語言處理是情感分析過程中的典型技術(shù)。情感分析的目標(biāo)就是要辨別或評(píng)價(jià)針對(duì)一個(gè)公司,、產(chǎn)品,、服務(wù)、人或者時(shí)間所持有的態(tài)度或者情感,。


網(wǎng)絡(luò)安全(Security):是指網(wǎng)絡(luò)系統(tǒng)的硬件、軟件及其系統(tǒng)中的數(shù)據(jù)受到保護(hù),,不因偶然的或者惡意的原因而遭受到破壞,、更改、泄露,,系統(tǒng)連續(xù)可靠正常地運(yùn)行,,網(wǎng)絡(luò)服務(wù)不中斷。


銷售量(Sales):是指企業(yè)在一定時(shí)期內(nèi)實(shí)際促銷出去的產(chǎn)品數(shù)量,。


空間分析(Spatial analysis):空間分析指的是對(duì)空間數(shù)據(jù)作出分析,,以識(shí)別或者理解分布在幾何空間中的數(shù)據(jù)的模式和規(guī)律,這類數(shù)據(jù)有幾何數(shù)據(jù)和拓?fù)鋽?shù)據(jù),。


智能數(shù)據(jù)(Smart Data):是經(jīng)過一些算法處理之后有用并且可操作的數(shù)據(jù),。


Terabyte:這是一個(gè)相對(duì)大的數(shù)字?jǐn)?shù)據(jù)單位,,1TB 等于 1000GB。據(jù)估計(jì),,10TB 能夠容納美國(guó)國(guó)會(huì)圖書館的所有印刷品,,而 1TB 則能夠容納整個(gè)百科全書 Encyclopedia Brittanica。


Spark(Apache Spark):Apache Spark 是一個(gè)快速的內(nèi)存數(shù)據(jù)處理引擎,,它能夠有效地執(zhí)行那些需要迭代訪問數(shù)據(jù)庫的流處理,、機(jī)器學(xué)習(xí)以及 SQL 負(fù)載。Spark 通常會(huì)比我們前面討論過的 MapReduce 快好多,。


半結(jié)構(gòu)化數(shù)據(jù)(Semi-structured data):半結(jié)構(gòu)化數(shù)據(jù)并不具有結(jié)構(gòu)化數(shù)據(jù)嚴(yán)格的存儲(chǔ)結(jié)構(gòu),,但它可以使用標(biāo)簽或其他形式的標(biāo)記方式以保證數(shù)據(jù)的層次結(jié)構(gòu)


信號(hào)分析(Signal analysis):指通過度量隨時(shí)間或空間變化的物理量來分析產(chǎn)品的性能。特別是使用傳感器數(shù)據(jù),。


相似性搜索(Similarity searches):在數(shù)據(jù)庫中查詢最相似的對(duì)象,,這里所說的數(shù)據(jù)對(duì)象可以是任意類型的數(shù)據(jù)


仿真分析(Simulation analysis):仿真是指模擬真實(shí)環(huán)境中進(jìn)程或系統(tǒng)的操作。仿真分析可以在仿真時(shí)考慮多種不同的變量,,確保產(chǎn)品性能達(dá)到最優(yōu)


智能網(wǎng)格(Smart grid):是指在能源網(wǎng)中使用傳感器實(shí)時(shí)監(jiān)控其運(yùn)行狀態(tài),,有助于提高效率


SQL :在關(guān)系型數(shù)據(jù)庫中,用于檢索數(shù)據(jù)的一種編程語言


結(jié)構(gòu)化數(shù)據(jù)(Structured data):可以組織成行列結(jié)構(gòu),,可識(shí)別的數(shù)據(jù),。這類數(shù)據(jù)通常是一條記錄,或者一個(gè)文件,,或者是被正確標(biāo)記過的數(shù)據(jù)中的某一個(gè)字段,,并且可以被精確地定位到。


搜索(Search Engines):它包括信息搜集,、信息整理和用戶查詢?nèi)糠?。搜索引擎是一個(gè)為你提供信息“檢索”服務(wù)的網(wǎng)站,它使用某些程序把因特網(wǎng)上的所有信息歸類以幫助人們?cè)诿C>W(wǎng)海中搜尋到所需要的信息,,它包括信息搜集,、信息整理和用戶查詢?nèi)糠帧D壳俺S玫木W(wǎng)絡(luò)搜索引擎有百度,,Google,,我愛讀,搜狐,,雅虎,,必應(yīng),好書搜索,,有道,,中搜,搜搜,,搜客等,。

T


T字節(jié)(TB: Terabytes):約等于1000 GB(gigabytes),。1 TB容量可以存儲(chǔ)約300小時(shí)的高清視頻。


時(shí)序分析(Time series analysis):分析在重復(fù)測(cè)量時(shí)間里獲得的定義良好的數(shù)據(jù),。分析的數(shù)據(jù)必須是良好定義的,,并且要取自相同時(shí)間間隔的連續(xù)時(shí)間點(diǎn)。

拓?fù)鋽?shù)據(jù)分析(Topological Data Analysis) :拓?fù)鋽?shù)據(jù)分析主要關(guān)注三點(diǎn):復(fù)合數(shù)據(jù)模型,、集群的識(shí)別,、以及數(shù)據(jù)的統(tǒng)計(jì)學(xué)意義。


交易數(shù)據(jù)(Transactional data):隨時(shí)間變化的動(dòng)態(tài)數(shù)據(jù)


透明性(Transparency):消費(fèi)者想要知道他們的數(shù)據(jù)有什么作用,、被作何處理,,而組織機(jī)構(gòu)則把這些信息都透明化了。

U


非結(jié)構(gòu)化數(shù)據(jù)(Un-structured data):非結(jié)構(gòu)化數(shù)據(jù)一般被認(rèn)為是大量純文本數(shù)據(jù),,其中還可能包含日期,,數(shù)字和實(shí)例。

V


數(shù)據(jù)可視化(Visualization):有了合理的可視化之后,,原始數(shù)據(jù)就能夠使用了,。當(dāng)然這里的可視化并不止簡(jiǎn)單的圖表。而是能夠包含數(shù)據(jù)的很多變量的同時(shí)還具有可讀性和可理解性的復(fù)雜圖表,。


價(jià)值(Value) :(譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 所有可用的數(shù)據(jù),,能為組織機(jī)構(gòu)、社會(huì),、消費(fèi)者創(chuàng)造出巨大的價(jià)值,。這意味著各大企業(yè)及整個(gè)產(chǎn)業(yè)都將從大數(shù)據(jù)中獲益。


可變性(Variability):也就是說,,數(shù)據(jù)的含義總是在(快速)變化的,。例如,一個(gè)詞在相同的推文中可以有完全不同的意思,。


多樣(Variety):(譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 數(shù)據(jù)總是以各種不同的形式呈現(xiàn),,如結(jié)構(gòu)化數(shù)據(jù),半結(jié)構(gòu)化數(shù)據(jù),,非結(jié)構(gòu)化數(shù)據(jù),,甚至還有復(fù)雜結(jié)構(gòu)化數(shù)據(jù)


高速(Velocity):(譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的創(chuàng)建,、存儲(chǔ)、分析,、虛擬化都要求被高速處理,。


真實(shí)性(Veracity):組織機(jī)構(gòu)需要確保數(shù)據(jù)的真實(shí)性,才能保證數(shù)據(jù)分析的正確性,。因此,,真實(shí)性(Veracity)是指數(shù)據(jù)的正確性,。


可視化(Visualization):只有正確的可視化,原始數(shù)據(jù)才可被投入使用,。這里的“可視化”并非普通的圖型或餅圖,,可視化指是的復(fù)雜的圖表,圖表中包含大量的數(shù)據(jù)信息,,但可以被很容易地理解和閱讀,。


大量(Volume):(譯者注:大數(shù)據(jù)4V特點(diǎn)之一) 指數(shù)據(jù)量,范圍從Megabytes至Brontobytes

W


天氣數(shù)據(jù)(Weather data):是一種重要的開放公共數(shù)據(jù)來源,,如果與其他數(shù)據(jù)來源合成在一起,,可以為相關(guān)組織機(jī)構(gòu)提供深入分析的依據(jù)


網(wǎng)頁(web):構(gòu)成網(wǎng)站的基本元素,是承載各種網(wǎng)站應(yīng)用的平臺(tái),。通俗地說,,您的網(wǎng)站就是由網(wǎng)頁組成的,如果您只有域名和虛擬主機(jī)而沒有制作任何網(wǎng)頁的話,,您的客戶仍舊無法訪問您的網(wǎng)站,。


X


XML數(shù)據(jù)庫(XML Databases) : XML數(shù)據(jù)庫是一種以XML格式存儲(chǔ)數(shù)據(jù)的數(shù)據(jù)庫。XML數(shù)據(jù)庫通常與面向文檔型數(shù)據(jù)庫相關(guān)聯(lián),,開發(fā)人員可以對(duì)XML數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行查詢,,導(dǎo)出以及按指定的格式序列化


Y


Yottabytes:接近 1000 Zettabytes,或者 2500 萬億張 DVD?,F(xiàn)在所有的數(shù)字存儲(chǔ)大概是 1 Yottabyte,,而且這個(gè)數(shù)字每 18 個(gè)月會(huì)翻一番。


Y字節(jié) (Yottabytes):約等于1000 ZB (Zettabytes), 約等于250萬億張DVD的數(shù)據(jù)容量?,F(xiàn)今,,整個(gè)數(shù)字化宇宙的數(shù)據(jù)量為1 YB, 并且將每18年翻一番。

Z


Z字節(jié) (ZB: Zettabytes):約等于1000 EB (Exabytes), 約等于1百萬 TB,。據(jù)預(yù)測(cè),,到2016年全球范圍內(nèi)每天網(wǎng)絡(luò)上通過的信息大約能達(dá)到1 ZB。

 

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購買等信息,,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多