久久国产成人av_抖音国产毛片_a片网站免费观看_A片无码播放手机在线观看,色五月在线观看,亚洲精品m在线观看,女人自慰的免费网址,悠悠在线观看精品视频,一级日本片免费的,亚洲精品久,国产精品成人久久久久久久

分享

[科學(xué)]云計(jì)算中的存儲(chǔ)

 墨香公子 2009-03-01

引言, "The one that is without any tradeoff is to have the logical storage master up in the cloud" by Bill Gates.

2008 年的 IT 界,,云計(jì)算是個(gè)熱詞,。很多企業(yè)都在宣稱自己提供云計(jì)算服務(wù),很多人也都在討論云計(jì)算(一些明顯是湊熱鬧的,,比如所謂的"云安全"),,從業(yè)界公認(rèn)的幾種云計(jì)算的服務(wù)能力看,都繞不開(kāi)存儲(chǔ)這個(gè)基礎(chǔ)支撐組件,,dSaaS(data-Storage-as-a-Service) 更是把存儲(chǔ)提到了首要的位置,。而從我們目前能得到的信息來(lái)看,在存儲(chǔ)層已經(jīng)解決很好的,,恐怕也只有 Google 和 Amazon 兩家,,至于其他公司可能都還在路上,即使是微軟,,盡管也有自己的 Dryad ,,但是實(shí)際上,仍然處于理論階段,,產(chǎn)品化的路還有點(diǎn)距離,。

Cloud_Computing_level.png

上面表格中的舉例僅僅是為了舉例,如果某家已經(jīng) "云計(jì)算了" 的公司大名不在上面,,并非該公司"云"的不夠徹底,,應(yīng)該只是筆者眼光差的原因而已。

越來(lái)越迫切的信息存儲(chǔ)需求

根據(jù) EMC 公司贊助 IDC 進(jìn)行的研究計(jì)劃 "Digital Universe" 的分析報(bào)告,,在整個(gè) 2007 年,,我們這個(gè)世界生成、占用的數(shù)字信息及復(fù)制總量大約是 281 Exabytes (1 Exabytes=1024 Petabytes ,,1 Petabytes = 1024 TB 這里換算都按照二進(jìn)制的換算),,這個(gè)數(shù)據(jù)平攤到地球上的所有人,大約是每個(gè)人 45 GB的數(shù)據(jù),;截至到筆者寫稿的時(shí)候,,2008年到現(xiàn)在整個(gè)世界已經(jīng)生成了大約 374 EB 的數(shù)據(jù)(可以到 "Digital Universe" 頁(yè)面查看最新的數(shù)據(jù),也可以下載一個(gè)評(píng)估工具,,看看自己產(chǎn)生的數(shù)據(jù)是大約如何),;到 2011 年,每年產(chǎn)生的數(shù)字信息大約是 1800 EB,,10倍于2006 年產(chǎn)生的信息量,。做為對(duì)比,,Google 每天處理的數(shù)據(jù)大約是 20 PB 的樣子,Google 的目標(biāo)是要組織所有的信息,,看來(lái)并非易事,。

其他可參考數(shù)據(jù):據(jù)美國(guó)國(guó)家檔案館工作人員估計(jì),布什政府電子檔案存儲(chǔ)量大約為1億GB,,這一數(shù)字約為前總統(tǒng)克林頓兩屆政府檔案總量的50倍,,是國(guó)會(huì)圖書館2000萬(wàn)冊(cè)編目圖書內(nèi)容總量的5倍。

每年激增如此龐大的信息量,,加上已有的歷史數(shù)據(jù)信息,,對(duì)整個(gè)業(yè)界的數(shù)據(jù)存儲(chǔ)、處理帶來(lái)了很大的機(jī)遇與挑戰(zhàn),。通過(guò)該研究能看出,,在可用存儲(chǔ)之間與信息生成總量之間不是嚴(yán)格匹配的,一方面多媒體領(lǐng)域信息增長(zhǎng)過(guò)快,,一方面因?yàn)椴缓侠淼拇鎯?chǔ)分配,、占用情形比比皆是。例如研究表明一封大約 1M 的郵件發(fā)出后,,經(jīng)過(guò)不同服務(wù)器的存儲(chǔ),、備份、歸檔等最后總體占用空間竟然達(dá)到驚人的 50M 之多,。正如云計(jì)算的初衷是為了充分發(fā)揮計(jì)算機(jī)閑置資源,,提高總體使用率以便達(dá)到經(jīng)濟(jì)效益,云計(jì)算中的存儲(chǔ)方面也應(yīng)該能有效提高存儲(chǔ)利用率而進(jìn)一步創(chuàng)造價(jià)值,,盲目的復(fù)制,、堆積數(shù)據(jù)是沒(méi)有出路的。工業(yè)界提倡節(jié)能減排,,其實(shí) IT 界應(yīng)該提倡一下節(jié)約存儲(chǔ)了,。

什么是云存儲(chǔ) ?

其實(shí),什么是云計(jì)算都很難有一個(gè)權(quán)威的定義,,筆者在這里更愿意把"云計(jì)算中涉及的存儲(chǔ)"簡(jiǎn)稱為云存儲(chǔ)(Cloud Storage),。云存儲(chǔ)本身離不開(kāi)云計(jì)算,更多的時(shí)候云存儲(chǔ)是做為云計(jì)算的一個(gè)支撐組件,。

云存儲(chǔ)不是簡(jiǎn)單的在線存儲(chǔ)或是網(wǎng)絡(luò)硬盤,,在線存儲(chǔ)服務(wù)只是云存儲(chǔ)能夠提供的眾多服務(wù)中的一種而已。

云存儲(chǔ)的特點(diǎn)

云存儲(chǔ)至少應(yīng)該能夠具備如下特點(diǎn):

  • 高可靠性
  • 談到存儲(chǔ),,可靠性還是要排到第一位的,。沒(méi)有人喜歡買三天兩頭壞掉的硬盤,代表高科技形象的云存儲(chǔ)可靠性也要加強(qiáng)。
  • 高可用性
  • 如果云存儲(chǔ)服務(wù)不是針對(duì)在線用戶的,,那么沒(méi)有什么實(shí)際意義,,如果針對(duì)在線用戶,不具備足夠高的可用性也是沒(méi)有意義的,。Amazon 的 S3 服務(wù)給足夠多的 Web 2.0 企業(yè)解放了在硬件存儲(chǔ)上的壓力,,但是偶然的一次宕機(jī)會(huì)影響所有的 Web 2.0 用戶;
  • 低成本
  • 云存儲(chǔ)本質(zhì)上還是規(guī)?;?jīng)濟(jì),。如果成本不能有效的控制,那么云存儲(chǔ)對(duì)廠家,、對(duì)用戶來(lái)說(shuō)是沒(méi)有意義的;
  • 高擴(kuò)展性
  • 云存儲(chǔ)組件應(yīng)該具有足夠高的擴(kuò)展性,,應(yīng)該能夠通過(guò)在線擴(kuò)充存儲(chǔ)單元進(jìn)行有效的平滑線性擴(kuò)展,;
  • 自動(dòng)容錯(cuò)能力
  • 因?yàn)榈统杀镜模鎯?chǔ)組件的損耗率應(yīng)該很高,,云存儲(chǔ)廠商應(yīng)該能在軟件層做到自動(dòng)容錯(cuò)而不是依賴硬件本身的容錯(cuò),;
  • 易管理性
  • 構(gòu)建云存儲(chǔ)系統(tǒng),可管理性應(yīng)該在設(shè)計(jì)之初就要考慮到,,如果管理太復(fù)雜,,很難做到低成本,穩(wěn)定性,、可靠性也會(huì)受到挑戰(zhàn),。
  • 去中心化
  • 對(duì)元數(shù)據(jù)的管理不應(yīng)該通過(guò)少數(shù)或者單一的管理節(jié)點(diǎn)來(lái)操作或者存儲(chǔ)。

云存儲(chǔ)的關(guān)鍵技術(shù)與服務(wù)形式

要建設(shè)成功的云存儲(chǔ)系統(tǒng),,高擴(kuò)展性,、高可靠性的分布式文件系統(tǒng)是一個(gè)關(guān)鍵因素。而硬件問(wèn)題反而是次要的,。

cloud_storage.png

云存儲(chǔ)的服務(wù)形式見(jiàn)上表,。

是否該建設(shè)云存儲(chǔ)服務(wù)?

可能有些企業(yè)已經(jīng)在戰(zhàn)略中加上了云計(jì)算這個(gè)關(guān)鍵字,問(wèn)題是,,真的需要那么多云計(jì)算么? 如果在技術(shù)上,、規(guī)模化不能有效的節(jié)約成本,,那么跟風(fēng)建設(shè)云存儲(chǔ)服務(wù)是緣木求魚,。更多的企業(yè)是自身的存儲(chǔ)建設(shè)都遠(yuǎn)遠(yuǎn)不到位,大談云存儲(chǔ)無(wú)疑是癡人說(shuō)夢(mèng),。至少在國(guó)內(nèi),,我們的基礎(chǔ)建設(shè)還和國(guó)外有一段距離,而內(nèi)容審查與一些政策上的限制又會(huì)增加建設(shè)、運(yùn)營(yíng)成本,。

是否該使用云存儲(chǔ)服務(wù)?

回答這個(gè)問(wèn)題之前,,我建議先看看服務(wù)提供方是否真的是云存儲(chǔ)服務(wù),如果只是炒炒概念,,用老的架構(gòu)支撐,,換湯不換藥,那還是謹(jǐn)慎為妙,。企業(yè)如果不能從技術(shù)上做些本質(zhì)突破而節(jié)約成本,,那么成本肯定要轉(zhuǎn)嫁到消費(fèi)者身上,如果消費(fèi)者不買單,,那該服務(wù)如何能長(zhǎng)久? 和我們現(xiàn)實(shí)生活中很多山寨 IDC 類比一下就知道了,,動(dòng)輒聽(tīng)到某主機(jī)托管商一夜之間蒸發(fā),用戶欲哭無(wú)淚的事情,。

如果使用云存儲(chǔ)服務(wù),,不妨和競(jìng)爭(zhēng)對(duì)手使用同一家服務(wù)商。出問(wèn)題的時(shí)候大家都出問(wèn)題,,保證始終處于同一起跑線,。

在國(guó)內(nèi),短期內(nèi)還看不到有規(guī)模的云存儲(chǔ)服務(wù)商,。由于網(wǎng)絡(luò)的問(wèn)題,,企業(yè)用戶也不太可能去使用國(guó)外的服務(wù)(不排除將來(lái) Amazon S3 這樣的服務(wù)能在國(guó)內(nèi)提供服務(wù))。期待在未來(lái)的一段時(shí)間能看到一些變化,,但這恐怕只是樂(lè)觀的想法,。

云存儲(chǔ)的潛在問(wèn)題

  • 數(shù)據(jù)安全
  • 同樣是數(shù)據(jù)存儲(chǔ)到云存儲(chǔ)服務(wù)商那里,如果我的隱私數(shù)據(jù)被泄露了怎么辦? 業(yè)務(wù)數(shù)據(jù)被競(jìng)爭(zhēng)對(duì)手盜用了怎么辦? 消除用戶的顧慮仍然需要時(shí)間,。
  • 網(wǎng)絡(luò)帶寬問(wèn)題
  • 只有數(shù)據(jù)沒(méi)有網(wǎng)絡(luò),,好比魚兒沒(méi)有水。如何保證大規(guī)模數(shù)據(jù)的有效分發(fā)與負(fù)載均衡,,這也是云計(jì)算提供方與使用方都需要考慮的問(wèn)題,。
  • SLA 的問(wèn)題
  • 對(duì)于提供云計(jì)算存儲(chǔ)服務(wù)的公司,用戶很難看到他們嚴(yán)格執(zhí)行SLA (Service level agreement) ,。遇到大規(guī)模故障的時(shí)候,,還做不到有效的為所有用戶提供服務(wù)支持的能力。

云存儲(chǔ)的錢途與前途

時(shí)值全球經(jīng)濟(jì)的寒冬,,能夠?yàn)橛脩羰″X的服務(wù)相信也應(yīng)該能夠賺到錢,。從用戶的角度上看,云存儲(chǔ)解放了自身的生產(chǎn)力,,能夠允許中小創(chuàng)業(yè)團(tuán)隊(duì)集中精力做發(fā)展業(yè)務(wù),,只要不形成惡性競(jìng)爭(zhēng),,應(yīng)該不用擔(dān)心盈利的問(wèn)題。

就以 Amazon的 S3 來(lái)說(shuō),,基本上也很好的展示并實(shí)踐了 Web 2.0 長(zhǎng)尾理論:利用企業(yè)建設(shè)剩余的存儲(chǔ)以及網(wǎng)絡(luò)帶寬能力而為廣大中小網(wǎng)站提供服務(wù),,前途大好。相信 Google 推出類似服務(wù)也是指日可待的事情,。但這個(gè)市場(chǎng)內(nèi)應(yīng)該不會(huì)出現(xiàn)過(guò)多的有力競(jìng)爭(zhēng)者,,有些存儲(chǔ)廠商(比如EMC) 也在進(jìn)入這個(gè)領(lǐng)域,數(shù)據(jù)存儲(chǔ)不是問(wèn)題,,但網(wǎng)絡(luò)能力可不是那么好解決的事情,。

云存儲(chǔ)與傳統(tǒng)存儲(chǔ):SAN 能否還能發(fā)揮余熱?

從我們前面提到的云計(jì)算中的存儲(chǔ)特點(diǎn)來(lái)看,SAN(存儲(chǔ)區(qū)域網(wǎng)絡(luò))產(chǎn)品就暴露出一些不適合的應(yīng)用場(chǎng)景,,畢竟 SAN 是面向集中式計(jì)算的架構(gòu),。另外,大家也都知道 SAN 產(chǎn)品一般不便宜(現(xiàn)在也有廠商在力推低端海量存儲(chǔ)產(chǎn)品,,后面會(huì)介紹),,而且,主機(jī)端如果用 HBA 卡,,也會(huì)進(jìn)一步提高成本;SAN 面向傳統(tǒng)企業(yè)應(yīng)用而設(shè)計(jì)的擴(kuò)展能力難以滿足云計(jì)算的需求,。

目前盡管已經(jīng)有一些企業(yè)在做集群存儲(chǔ)然后打包出售,,但相對(duì)還是在起步階段。至少現(xiàn)在還看不到真正集群 SAN 產(chǎn)品的出現(xiàn),。當(dāng)然,,如果對(duì)云計(jì)算的存儲(chǔ)部分不計(jì)成本的話,SAN 仍然可以在云計(jì)算中發(fā)揮一些作用,,這倒是中了存儲(chǔ)廠商的下懷,。

不管怎么說(shuō),RAID 這個(gè) SAN 中的概念在云存儲(chǔ)中已經(jīng)絕對(duì)不適合了,。

集群 NAS 是否真的有機(jī)會(huì) ?

有業(yè)界評(píng)論說(shuō)集群 NAS 可能會(huì)演變成云存儲(chǔ)的通用架構(gòu),,我懷疑這是不是 Sun 公司的宣傳手段,因?yàn)檫@事實(shí)上宣布了 ZFS 將是云存儲(chǔ)中的一個(gè)關(guān)鍵點(diǎn),。

從現(xiàn)有的情形看,,或許會(huì)有越來(lái)越多的在線存儲(chǔ)服務(wù)擁抱集群 NAS 。但這不代表集群 NAS 前途光明能夠在云存儲(chǔ)大展拳腳,。集群 NAS 最大的問(wèn)題是海量數(shù)據(jù)的尋址是個(gè)麻煩事兒,,然后是擴(kuò)展性與容錯(cuò)性的問(wèn)題,底層的容錯(cuò)性如果通過(guò)硬件來(lái)做,,那么成本無(wú)疑會(huì)上升,,這恐怕是企業(yè)不愿意接受的,。

分布式文件系統(tǒng)

在開(kāi)源領(lǐng)域,以 MogileFS 為代表的分布式文件系統(tǒng)能夠用于一些相對(duì)規(guī)模較小的分布式存儲(chǔ)場(chǎng)景,,很多 Web 2.0 自己的分布式存儲(chǔ)就是借鑒 MogileFS 搭建的,,不過(guò)畢竟 MofileFS 的Meta 信息仍是集中存儲(chǔ)、管理的,,在更大規(guī)??峙掠行┏粤Α?/p>

此外,,Kosmosfs(http://kosmosfs./),、Lustre(http://www.) 等也都在不斷發(fā)展中,相信能夠給有興趣研究云存儲(chǔ)的技術(shù)人員一些借鑒,。也有一些軟件廠商將其專有的分布式文件系統(tǒng)和存儲(chǔ)打包在一起銷售,,而存儲(chǔ)廠商也有的在結(jié)合自己的存儲(chǔ)產(chǎn)品做一些嘗試。目前還很少有相對(duì)成熟度的東西進(jìn)入用戶視野,。

更多分布式文件系統(tǒng)列表參見(jiàn)維基百科的文件系統(tǒng)列表介紹,。

分布式文件系統(tǒng)舉例:擁抱開(kāi)源 Hadoop 的 HDFS

盡管我們接觸不到 Google 大名鼎鼎的 GFS (Google File System),但我們能免費(fèi)獲取Hadoop 的 HDFS (Hadoop Distributed File System),。HDFS 相對(duì)上述的 ZFS 來(lái)說(shuō),,屬于專門針對(duì)廉價(jià)硬件設(shè)計(jì)的分布式文件系統(tǒng),在軟件層內(nèi)置數(shù)據(jù)容錯(cuò)能力,。Hadoop 目前的案例多數(shù)用在數(shù)據(jù)分析與并行計(jì)算上,,倒是很少看到有支撐給互聯(lián)網(wǎng)應(yīng)用的數(shù)據(jù)服務(wù),但相信隨著其在開(kāi)放環(huán)境中的快速成長(zhǎng),, Hadoop 將不斷壯大,。

(HDFS 架構(gòu)示意圖. from: http://hadoop./core/docs/current/hdfs_design.html 關(guān)于 Hadoop 也請(qǐng)參閱《程序員》雜志 2008年10月刊的文章。)

速成版存儲(chǔ)方案成本評(píng)估

云計(jì)算中存儲(chǔ)的起步容量,,我們不妨按照 1PB 可用空間來(lái)準(zhǔn)備,。近年來(lái),隨著磁介質(zhì)存儲(chǔ)能力的提升,,企業(yè)存儲(chǔ)的價(jià)格也是一降再降,,$2.00/GB 的底線早已突破,現(xiàn)在Sun 的Thumper 聲稱可以達(dá)到 $1.20/GB 的成本,。(注:企業(yè)存儲(chǔ)[不是個(gè)人消費(fèi)品]的磁盤價(jià)格一降再降,,而且有很重要的商業(yè)因素,具體的成本應(yīng)該還要更低一些,,只是不知道哪位朋友有更為準(zhǔn)確的數(shù)字)

粗略估算一下,,2PB 的原始容量成本大約是 250 萬(wàn)美元左右(List Price)。單位機(jī)柜空間密度最高的已經(jīng)能夠做到4U的機(jī)存儲(chǔ)48TB的原始容量(目前能看到密度最高的了),,這樣最小只需要大約 45 個(gè) 4U 的機(jī)柜空間,。其他方面,,加上本地的工業(yè)電力價(jià)格,大致的硬件總體開(kāi)銷還是可估量的,。軟件方面,,這個(gè)存儲(chǔ)本身是基于 Sun 的 ZFS,內(nèi)置的操作系統(tǒng),,成本也是可以控制的,。

山寨云存儲(chǔ)方案設(shè)想

在山寨精神盛行的今天,沒(méi)準(zhǔn)兒已經(jīng)有人在搭建一套山寨版的云存儲(chǔ)方案呢,。比如目標(biāo)定在 1PB 可用容量,,預(yù)計(jì)至少需要如下的東西:

選擇廉價(jià)的刀片服務(wù)器(自己"生產(chǎn)"就不必了),內(nèi)置足夠多的大硬盤,,硬盤速度無(wú)所謂,,預(yù)計(jì)每臺(tái)機(jī)器預(yù)裝4T容量(1T*4,壞了就整臺(tái)機(jī)器替換),,大約需要 500臺(tái)服務(wù)器,,總?cè)萘?PB,確保每一份數(shù)據(jù)都至少冗余在另外的物理機(jī)器上,,冗余后,,起碼能得到1PB容量(如果備份的數(shù)據(jù)啟用壓縮,沒(méi)準(zhǔn)兒能提供更多空間呢),。機(jī)架物理空間怕是需要 1000 U多一些,,每個(gè)標(biāo)準(zhǔn)機(jī)柜是42U,怎么也要準(zhǔn)備 25 個(gè)機(jī)架吧,,再加上網(wǎng)絡(luò)交換機(jī)什么的... 然后是電力與空調(diào)散熱問(wèn)題,。

再弄一套 Hadoop ,,定制一下跑起來(lái) ...當(dāng)然,,山寨與否,關(guān)鍵是拼技術(shù)團(tuán)隊(duì),,一味的拿來(lái)主義注定只能跟風(fēng),。

其實(shí),這篇文章也是一篇山寨文,。

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn),。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式,、誘導(dǎo)購(gòu)買等信息,謹(jǐn)防詐騙,。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,,請(qǐng)點(diǎn)擊一鍵舉報(bào),。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多