暢談數(shù)據(jù)中心建設(shè)與數(shù)據(jù)處理2009-11-20 15:50 來源:Watchstor.com 佚名 我要評論(0)
數(shù)據(jù)中心還是比較常用的,于是我研究了一下數(shù)據(jù)中心建設(shè),,現(xiàn)在可能各大IT新聞都會(huì)提到"數(shù)據(jù)中心",,看起來是很龐大的家伙,IT巨頭google,,MS等耗資巨頭投入到數(shù)據(jù)中心建設(shè)中,。 那么什么是數(shù)據(jù)中心?從字面意思,非IT人可能人認(rèn)為是放數(shù)據(jù)的計(jì)算機(jī)中心,。其實(shí)這只是表面,,數(shù)據(jù)中心建設(shè)在不同情況,它的作用是不完全一樣的,。 在數(shù)據(jù)處理中,,分為兩大類。一是事務(wù)處理,,二是數(shù)據(jù)查詢和分析。數(shù)據(jù)處理或者分析,,一般是在數(shù)據(jù)庫中處理,,而數(shù)據(jù)查詢現(xiàn)在分為兩大類,一是數(shù)據(jù)庫查詢,,二是搜索技術(shù),。而目前隨著各種技術(shù)的互相作用,搜索技術(shù)和數(shù)據(jù)分析也越來越有“合作”的意思,。 搜索技術(shù)目前還處于“模糊查詢”階段,,也就是從數(shù)億計(jì)互聯(lián)網(wǎng)信息中模糊搜索出你想要的信息,但由于是模糊查詢,,所以絕大多數(shù)信息都不是你想要的,,于是目前幾大巨頭都在把數(shù)據(jù)挖掘技術(shù)容入搜索技術(shù)中,縮小客戶搜索到準(zhǔn)確信息的時(shí)間,。 但由于搜索技術(shù)其“模糊特點(diǎn)”,,在企業(yè)內(nèi)部的信息化中,暫時(shí)還不適合,,因?yàn)槠髽I(yè)查詢的需要是準(zhǔn)確的信息,,老板可沒那么多時(shí)間一個(gè)個(gè)排除。于是企業(yè)內(nèi)部建設(shè)的數(shù)據(jù)中心基本是數(shù)據(jù)倉庫,,為準(zhǔn)確查詢和分析服務(wù),。 那么何為數(shù)據(jù)倉庫?前面提到的企業(yè)/單位投資信息化,他們不停上信息化系統(tǒng),,比如ERP,、CRM、CallCenter,、OA或者計(jì)費(fèi)等,。但上了這些系統(tǒng)后,會(huì)產(chǎn)生大量數(shù)據(jù),,客戶首先的需求是查詢和報(bào)表,。但很多報(bào)表和查詢是需要跨系統(tǒng),而且復(fù)雜查詢和報(bào)表很耗資源,,可能影響各個(gè)系統(tǒng)的正常運(yùn)行,。于是80年代人們專門建設(shè)一個(gè)數(shù)據(jù)庫系統(tǒng),把各個(gè)系統(tǒng)的數(shù)據(jù)拿到那里進(jìn)行準(zhǔn)確的查詢和報(bào)表制作,,這樣既方便又準(zhǔn)備,,而且不會(huì)影響業(yè)務(wù)系統(tǒng)。那么從這點(diǎn)說,,數(shù)據(jù)倉庫是全數(shù)據(jù)的集合,。 而后來查詢和報(bào)表已不能滿足人們的需求了,他們想知道這些數(shù)據(jù)里到底有什么有用的信息,,會(huì)給決策者什么有用的幫助,。于是90年代人們把OLAP和數(shù)據(jù)挖掘加入數(shù)據(jù)倉庫應(yīng)用之中。為了更好地分析,,人們從數(shù)據(jù)倉庫里還會(huì)按照業(yè)務(wù)需要提出N多數(shù)據(jù)集市為查詢,、分析服務(wù),這樣會(huì)更方便,,因?yàn)椴煌块T的需求不同,,業(yè)務(wù)定義也可能不同,所以再把數(shù)據(jù)倉庫的信息分到各個(gè)數(shù)據(jù)集市是很有必要的了,,這樣才好個(gè)性化服務(wù)嘛,。 但有一定要申明,數(shù)據(jù)倉庫和OLAP,、數(shù)據(jù)挖掘以及查詢,、報(bào)表沒有必然關(guān)系,他們是不同的邏輯事物,,但相互作用很密切,。正如前面提到,數(shù)據(jù)挖掘現(xiàn)在已經(jīng)結(jié)合搜索技術(shù),,更方便地給人們提供互聯(lián)網(wǎng)搜索服務(wù),。而數(shù)據(jù)挖掘在數(shù)據(jù)倉庫的作用,,就是更好地分析,比如著名的沃爾瑪尿布和啤酒的案例就是數(shù)據(jù)挖掘的結(jié)果,,它把數(shù)據(jù)中很多潛罪責(zé)找出一定聯(lián)系的幾率,,這樣幫助企業(yè)決策。 那么數(shù)據(jù)中心是何物,?如果是針對具體的企業(yè)或者單位,,其實(shí)就是業(yè)務(wù)系統(tǒng)數(shù)據(jù)存儲(chǔ)技術(shù)+數(shù)據(jù)倉庫,當(dāng)然有的單位干脆只有數(shù)據(jù)倉庫,,比如科研單位,,他們又不作業(yè)務(wù)處理,只有分析需求,。但如果是互聯(lián)網(wǎng)公司,,就和普通企業(yè)和單位的數(shù)據(jù)中心不同,因?yàn)榛ヂ?lián)網(wǎng)的信息實(shí)在龐大,,不可能包羅所有信息到數(shù)據(jù)庫,,也處理不了那么多信息,所以他們的數(shù)據(jù)中心的其中作用就是加強(qiáng)互聯(lián)網(wǎng)數(shù)據(jù)的處理速度和效果,;另一個(gè)作用也是數(shù)據(jù)倉庫,,但他們的數(shù)據(jù)倉庫就不會(huì)包含所有互聯(lián)網(wǎng)信息,而是企業(yè)本身關(guān)心的信息,,當(dāng)然數(shù)據(jù)量也非常大,,一般十TB以上。 目前我國信息化其實(shí)還在初級階段,,可能很多人認(rèn)為有了PC,可以上網(wǎng),,有很多軟件用,,信息化就好了?其實(shí)不然,。信息化的高級階段應(yīng)該是準(zhǔn)確快速處理,、查詢、分析數(shù)據(jù),!就我所知,,美國幾乎所有國家級政府部門、科研機(jī)構(gòu)都上了數(shù)據(jù)倉庫系統(tǒng),,不信可以搜索下他們各個(gè)部門的信息化新聞,。而我們國家很多部門的普通業(yè)務(wù)系統(tǒng)還不夠完善,更不要說建設(shè)數(shù)據(jù)倉庫了,。 其實(shí)最有意義的一個(gè)項(xiàng)目,,應(yīng)該是農(nóng)業(yè)部數(shù)據(jù)倉庫建設(shè),。數(shù)據(jù)中心建設(shè)后,全國各鄉(xiāng)鎮(zhèn)級以上都可以作為其用戶,,查詢具體信息和分析信息,。好處就不說了,還會(huì)出現(xiàn)農(nóng)民種的東西買不出去,,買不起價(jià)格么,?不會(huì)!因?yàn)楦鱾€(gè)地方適合種什么,,當(dāng)年什么物種賣錢,,市場需求等都在眼里。當(dāng)然信息化并不是萬能的,,還要有配套措施,,比如農(nóng)業(yè)技術(shù)指導(dǎo)、專門的采購,、物流,、銷售公司等配套等。 【編輯推薦】 |
|