在IDF05(Intel Developer Forum 2005)上,Intel首席執(zhí)行官Craig Barrett就取消4GHz芯片計劃一事,,半開玩笑當眾單膝下跪致歉,,給廣大軟件開發(fā)者一個明顯的信號,單純依靠垂直提升硬件性能來提高系統(tǒng)性能的時代已結束,,分布式開發(fā)的時代實際上早已悄悄地成為了時代的主流,,吵得很熱的云計算實際上只是包裝在分布式之外的商業(yè)概念,很多開發(fā)者(包括我)都想加入研究云計算這個潮流,,在google上通過“云計算”這個關鍵詞來查詢資料,,查到的都是些概念性或商業(yè)性的宣傳資料,其實真正需要深入的還是那個早以被人熟知的概念------分布式,。 分布式可繁也可以簡,,最簡單的分布式就是大家最常用的,在負載均衡服務器后加一堆web服務器,,然后在上面搞一個緩存服務器來保存臨時狀態(tài),,后面共享一個數據庫,其實很多號稱分布式專家的人也就停留于此,,大致結構如下圖所示: 這種環(huán)境下真正進行分布式的只是web server而已,,并且web server之間沒有任何聯(lián)系,所以結構和實現都非常簡單,。 有些情況下,,對分布式的需求就沒這么簡單,在每個環(huán)節(jié)上都有分布式的需求,,比如Load Balance,、DB、Cache和文件等等,,并且當分布式節(jié)點之間有關聯(lián)時,,還得考慮之間的通訊,另外,,節(jié)點非常多的時候,,得有監(jiān)控和管理來支撐。這樣看起來,,分布式是一個非常龐大的體系,,只不過你可以根據具體需求進行適當地裁剪。按照最完備的分布式體系來看,,可以由以下模塊組成: 分布式任務處理服務:負責具體的業(yè)務邏輯處理 分布式節(jié)點注冊和查詢:負責管理所有分布式節(jié)點的命名和物理信息的注冊與查詢,,是節(jié)點之間聯(lián)系的橋梁 分布式DB:分布式結構化數據存取 分布式Cache:分布式緩存數據(非持久化)存取 分布式文件:分布式文件存取 網絡通信:節(jié)點之間的網絡數據通信 監(jiān)控管理:搜集、監(jiān)控和診斷所有節(jié)點運行狀態(tài) 分布式編程語言:用于分布式環(huán)境下的專有編程語言,,比如Elang,、Scala 分布式算法:為解決分布式環(huán)境下一些特有問題的算法,,比如解決一致性問題的Paxos算法 因此,若要深入研究云計算和分布式,,就得深入研究以上領域,,而這些領域每一塊的水都很深,都需要很底層的知識和技術來支撐,,所以說,,對于想提升技術的開發(fā)者來說,以分布式來作為切入點是非常好的,,可以以此為線索,,探索計算機世界的各個角落。 集群集群是個物理形態(tài),,分布式是個工作方式,。 只要是一堆機器,就可以叫集群,,他們是不是一起協(xié)作著干活,,這個誰也不知道;一個程序或系統(tǒng),,只要運行在不同的機器上,,就可以叫分布式,嗯,,C/S架構也可以叫分布式,。 集群一般是物理集中、統(tǒng)一管理的,,而分布式系統(tǒng)則不強調這一點,。 所以,集群可能運行著一個或多個分布式系統(tǒng),,也可能根本沒有運行分布式系統(tǒng),;分布式系統(tǒng)可能運行在一個集群上,也可能運行在不屬于一個集群的多臺(2臺也算多臺)機器上,。 布式是相對中心化而來,強調的是任務在多個物理隔離的節(jié)點上進行,。中心化帶來的主要問題是可靠性,,若中心節(jié)點宕機則整個系統(tǒng)不可用,分布式除了解決部分中心化問題,,也傾向于分散負載,,但分布式會帶來很多的其他問題,最主要的就是一致性,。 分布式是指將不同的業(yè)務分布在不同的地方,。 而集群指的是將幾臺服務器集中在一起,,實現同一業(yè)務。 分布式中的每一個節(jié)點,,都可以做集群,。 而集群并不一定就是分布式的。 舉例:就比如新浪網,,訪問的人多了,,他可以做一個群集,前面放一個響應服務器,,后面幾臺服務器完成同一業(yè)務,,如果有業(yè)務訪問的時候,響應服務器看哪臺服務器的負載不是很重,,就將給哪一臺去完成,。 而分布式,從窄意上理解,,也跟集群差不多,, 但是它的組織比較松散,不像集群,,有一個組織性,,一臺服務器垮了,其它的服務器可以頂上來,。 分布式的每一個節(jié)點,,都完成不同的業(yè)務,一個節(jié)點垮了,,哪這個業(yè)務就不可訪問了,。 簡單說,分布式是以縮短單個任務的執(zhí)行時間來提升效率的,,而集群則是通過提高單位時間內執(zhí)行的任務數來提升效率,。 例如: 如果一個任務由10個子任務組成,每個子任務單獨執(zhí)行需1小時,,則在一臺服務器上執(zhí)行該任務需10小時,。 采用分布式方案,提供10臺服務器,,每臺服務器只負責處理一個子任務,,不考慮子任務間的依賴關系,,執(zhí)行完這個任務只需一個小時。(這種工作模式的一個典型代表就是Hadoop的Map/Reduce分布式計算模型) 而采用集群方案,,同樣提供10臺服務器,,每臺服務器都能獨立處理這個任務。假設有10個任務同時到達,,10個服務器將同時工作,,1小時后,10個任務同時完成,,這樣,,整身來看,還是1小時內完成一個任務,! 集群一般被分為三種類型,,高可用集群如RHCS、LifeKeeper等,,負載均衡集群如LVS等,、高性能運算集群;分布式應該是高性能運算集群范疇內。 分布式:不同的業(yè)務模塊部署在不同的服務器上或者同一個業(yè)務模塊分拆多個子業(yè)務,,部署在不同的服務器上,,解決高并發(fā)的問題 集群:同一個業(yè)務部署在多臺機器上,提高系統(tǒng)可用性 小飯店原來只有一個廚師,,切菜洗菜備料炒菜全干,。后來客人多了,廚房一個廚師忙不過來,,又請了個廚師,,兩個廚師都能炒一樣的菜,這兩個廚師的關系是集群,。為了讓廚師專心炒菜,,把菜做到極致,又請了個配菜師負責切菜,,備菜,,備料,廚師和配菜師的關系是分布式,,一個配菜師也忙不過來了,,又請了個配菜師,兩個配菜師關系是集群 |
|