HA完整過程LeeSun
VMware HA為所有在虛擬機中運行的應(yīng)用程序提供易于使用、經(jīng)濟高效的高可用性,。當服務(wù)器發(fā)生故障時,,受影響的虛擬機將在群集中留有備用容量的其他主機上自動重啟。 HA 將停機時間和服務(wù)中斷減至最低,,同時不需要專門的備用硬件和安裝附加軟件,。VMware HA 跨整個虛擬化環(huán)境提供始終如一的高可用性,而且沒有局限于操作系統(tǒng)和特定應(yīng)用程序的故障切換解決方案的成本和復雜性
今天在做HA的時候遇到了挺多問題的,,所以就寫下來讓大家做個參考,。
剛開始做 HA 的時候還以為要像 WINDOWS Cluster 那樣要兩張網(wǎng)卡,一張連接網(wǎng)絡(luò)另一張做心跳,。后來在高人的指導下確定一張網(wǎng)卡和一個 Service Console 就可以做 VMware HA 了,。并丌須要建VMkernel。但是后來収現(xiàn)用一張網(wǎng)卡和一個 Service Console 的話,,做完后 Cluster 會有一個黃色的警告圖標,。看了一下 Summay提示是沒有做冗余的網(wǎng)絡(luò),,最后增加了一個Service Console和把網(wǎng)卡做了一個Teaming后黃色警告就沒有了
做HA必須滿足以下幾個條件:
群集中HOST 中啟動的VM,,可以訪問共同的存儲和網(wǎng)絡(luò)
DNS(群集中的HOST可以通過主機名、完整的正式域名和IP都可以PING通對方)
DNS我下邊就按照我做的步驟來寫吧,。我先是建一個DNS服務(wù)器,,為兩臺HOST提供主機名到IP地址的解析。
下邊這個是我們網(wǎng)絡(luò)拓撲圖↓
我在WS下裝了一個Windows 2003 Enterprise添加DNS服務(wù)做為License Server和DNS服務(wù)器,。安裝DNS服務(wù)就不寫了
打開控制面板à管理工具àDNS 按照下邊的截圖一直按下一步就行了
右鍵正向查找區(qū)域à新建區(qū)域向?qū)?/span>
選擇主要區(qū)域
輸入服務(wù)器的域名
這里選擇不允許動態(tài)更新
來到這里正向解析區(qū)域就建完了,,不過要添加一些主機,。在剛建好的vmware.com右鍵à新建主機
輸入完按添加主機完成操作把要做HA的主機都添加進來,雙擊“名稱服務(wù)器”的那一項,,
選擇名稱服務(wù)器選中下邊已有的名稱服務(wù)器,,點擊編輯à在編輯記錄那里點擊瀏覽找到DNS的那個服務(wù)器
添加完后的截圖↑
完成了正向的,現(xiàn)在到反向的,。右鍵反向查找區(qū)域à新建區(qū)域向?qū)?。一直按下一步就行?/span>
到了反向查找區(qū)域?qū)?/span>IP地址轉(zhuǎn)換為DNS名稱的地方,因為我做的測試是兩個不同網(wǎng)段的,,所以我要添加兩個反向區(qū)域,。輸入正確的IP網(wǎng)段,。
右鍵剛剛新建的反向查找區(qū)域地址右鍵à選擇新建指針,。輸入相關(guān)主機的指針,并且在瀏覽那里找到相應(yīng)的主機
我這里把192.168.103和10.3.131的網(wǎng)段都添加進來了,,還要創(chuàng)建相關(guān)指針,。
↑上面這個比較重要,我就是因為忘記修改這個“此計算機的主DNS后綴”導致ESX不能進行短名的解析,。這個是在右鍵我的電腦屬性à計算機名à更改à其他à輸入所建的區(qū)域,。
還有就是要把網(wǎng)卡里的主DNS設(shè)置成本地IP地址
配置完后,重新計算機,。用“NSLOOKUP”工具測試一下DNS,。開始à運行輸入CMDà運行NSLOOKUP命令
WINDOWS的就到此結(jié)束。
VC下面就打開VC建一個Cluster并且把VMware HA前面的勾給打上
按照向?qū)У搅诉@里,,要設(shè)置一下允許發(fā)生故障的虛擬機數(shù)量的發(fā)生故障后的系統(tǒng)默認操作的行為吧,。解釋一下:
1. 主機故障 指定您要確保虛擬機故障轉(zhuǎn)移的主機故障的數(shù)目 (即故障容量) 。
2. 發(fā)生故障后重啟的優(yōu)先級
3. 隔離響應(yīng)
4.接入控制 提供兩個關(guān)于如何做出允許啟動新虛擬機決定的選項:
如果虛擬機違反可用性限制,,則不啟動虛擬機,,并且強制執(zhí)行指定的故障轉(zhuǎn)移容量限制。
即使虛擬機違反了可用性限制,,也允許啟動虛擬機,。此選項允許即使再也無法確保指定主機數(shù)目的故障切換時也可啟動虛擬機。(系統(tǒng)將發(fā)出警告,。)
這里根據(jù)自己的環(huán)境設(shè)置吧,。NEXT
設(shè)置SWAP文件的策略
1. 將Swap文件放與虛擬機放到同一個目錄中
2. 將Swap文件存儲到指定的存儲中
點擊NEXT到下一步完成
創(chuàng)建Cluster完成后不要急著把ESX101和ESX104兩臺ESX拖到123的Cluster里去。
先檢查一下兩臺ESX的DNS配置,。主要檢查一下上圖紅圈的那些內(nèi)容,。兩臺ESX除了Name內(nèi)容不一樣,其它應(yīng)該都是相同的,。沒問題后就可以把兩臺ESX放到123的Cluster里去了,。系統(tǒng)會自動啟動HA功能,。
如果 ESX 的配置沒有什么問題,應(yīng)該可以啟勱 HA 的,。但是在各大論壇上看到了丌少兄弟在做 HA 的時候都出現(xiàn)了問題和紅色的警告,。我這次在做的時候也遇到了丌少錯誤。上圖就出現(xiàn)了一個黃色的警告,,在查看了日志和Summay 后収現(xiàn)系統(tǒng)提示沒有可用的冗余網(wǎng)絡(luò)資源
打開VCàConfigurationàNetworkingàProperties……
增加一個Service Console
輸入IP
完成,,返回到剛才增加Service Console那里加一塊卡把網(wǎng)卡做成Teaming
選中一張空余的網(wǎng)卡,勾上
選擇一個VSwitch,在下邊可以選擇那塊網(wǎng)卡為主要的,,那一塊做備份的,。右邊那個 Move Up和 Move Down 調(diào)整上下。
完成后看看↑上邊紅色圈起來的地方
常見的是什么一個HA AGENT錯誤,。
是由于ESX不能對Cluster里HA的ESX進行地址解析,。它們的解析包括:↓
IP 要求可以使用Ping IP的方法對DNS和HA的機器Ping通
hostname 例如我這里的LIC和esx101、esx104使用Ping esx101(hostname可以用hostname –s命令看看)
完整的域名 ping esx101.vmware.com
我今天做的時候遇見的無法將短名解析為IP地址,,參考第12頁
如果以上都沒有問題的話開啟HA是沒有問題的
ESX一般情況下我們都要去檢查一下ESX配置↓
先到登錄到第一臺ESX的Service Console下PING一下DNS和另一臺ESX,。在這里要使用兩種方式去PING
第一種PING IP地址
第二種是PING 計算機名
第三種完整域名
第一種和第三種方法一般都是可行的,主要是第二種,,可能會遇到以下情況↓
這時候我們先來看看第一個/etc/hosts文件,。用VI編輯工具打開:vi /etc/hosts
看上圖只有一條10.3.131.70 esx101.vmware.com esx101的記錄。這里順便講講hosts文件吧,,挺重要的,。
/etc/hosts是配置ip地址和其對應(yīng)主機名的文件,這里可以記錄本機的或其他主機的ip及其對應(yīng)主機名
比如文件中有這樣的定義
10.3.131.70 esx101.vmware.com esx101 假設(shè)10.3.131.70是一臺網(wǎng)站服務(wù)器,,在網(wǎng)頁中輸入http:// esx101.vmware.com或[url]http://esx101[/url]就會打開10.3.131.70的網(wǎng)頁,。 通常情況下這個文件首先記錄了本機的ip和主機名: 127.0.0.1 localhost.localdomain localhost 我們esx101上使用ping esx101這個肯定是通的。因為這里有一個esx101的主機名,。我們要對上邊的文件進行修改,。
↑是修改后的圖
一般情況下hosts文件的每行為一個主機,每行由三部份組成,,每個部份由空格隔開,。其中#號開頭的行做說明,不被系統(tǒng)解釋,。
第一部份:網(wǎng)絡(luò)IP地址,; 第二部份:主機名或域名; 第三部份:主機名別名,; 當然每行也可以是兩部份,,即主機IP地址和主機名;比如 10.3.131.70 esx101 這里可以稍微解釋一下主機名(hostname)和域名(Domain)的區(qū)別:主機名通常在局域網(wǎng)內(nèi)使用,,通過hosts文件,,主機名就被解析到對應(yīng) ip,;域名通常在internet上使用,但如果本機不想使用internet上的域名解析,,這時就可以更改hosts文件,,加入自己的域名解析。 按照上邊的方法把另一臺ESX的hosts文件也作一下修改,,把DNS和esx101的記錄也添加上去
最后在兩臺ESX下互相PING一下對方的主機名,,看一下是否通的
如果這樣還不行的話就去檢查一下這幾個文件的內(nèi)容是否正確↓
/etc/hosts
/etc/resolv.conf
/etc/vmware/esx.conf
我在這里也是遇到一個問題就是因為我改了一臺ESX的主機名。由于 /etc/vmware/esx.conf文件里的名字沒有更新,。導致啟動HA的時候提示不能解析短名,,修改完后要重啟服務(wù)器。
完成操作,,看看VC的截圖↓
做了兩個 Service Console 和把網(wǎng)卡做成 Teaming 后 Cluster 的黃色警告圖標也去掉了,。以上就是我做HA的過程,希望能對大家有幫助,。
群集狀態(tài)信息隨著主機或虛擬機的添加或刪除,,群集可以會因為 HA 或 DRS 的違反限制而被過度提交
或無效,。 “摘要”頁上顯示的消息顯示當前選擇的群集的狀態(tài),。
Virtual Infrastructure Client 可以指示群集是否為有效(綠色)、被過度提交(黃色)或
無效(紅色
黃色(被過度提交)群集
滿足或未滿足故障切換要求時不會產(chǎn)生黃色的 HA 群集指示,。當資源池和虛擬機的數(shù)是
內(nèi)在一致的,,但用戶允許違反某些要求時,群集會變?yōu)辄S色,。當容量從群集刪除時會
發(fā)生這種情況,,例如,由于主機發(fā)生故障或主機被刪除并且沒有足夠的資源支持所有
請求,。
紅色(無效)群集
當啟動的虛擬機的數(shù)目超過嚴格的故障切換的要求,,即當前故障切換容量小于配置的故
障切換容量時,啟用了 HA 的群集會變成紅色,。例如,,如果您首先為該群集選中即使虛
擬機違反了可用性限制,也允許啟動虛擬機,,然后啟動太多虛擬機以至于沒有足夠的資
源確保指定數(shù)目的主機故障切換,,則會發(fā)生這種情況。如果您直接在主機上啟動虛擬機
或執(zhí)行其他操作,,群集也會變成紅色,。
例如,如果在一個四主機群集中為兩主機故障設(shè)置了 HA 并且一個主機發(fā)生故障,,則群
集也會變成紅色,。剩余的三個主機可能無法解決兩主機故障,。
如果啟用了 HA 的群集變成紅色,則它將不再確保指定數(shù)目主機的故障切換,,但會繼續(xù)
執(zhí)行故障切換,。主機發(fā)生故障時, HA 會先按優(yōu)先級順序?qū)σ慌_主機的虛擬機進行故障
切換,,然后再按優(yōu)先級順序?qū)Φ诙_主機的順序進行故障切換,,依此類推。 本文出自 “LeeSun” 博客,,請務(wù)必保留此出處http://leesun.blog.51cto.com/58664/70954 |
|