雙機(jī)熱備初體驗(yàn):如何建立雙機(jī)熱備系統(tǒng)
筆者是一名醫(yī)院的網(wǎng)管,而醫(yī)院的軟件系統(tǒng)要求能夠做到一周7×24小時工作,對于整個系統(tǒng)的核心服務(wù)器來說如果死機(jī)后果是災(zāi)難性的。所以采用網(wǎng)絡(luò)服務(wù)器容錯技術(shù)來保障計算機(jī)系統(tǒng)的可靠性是件大事!我們采用的是雙機(jī)熱備技術(shù)!相對于其它更高成本的容錯技術(shù)來說,這是最經(jīng)濟(jì)且卓有成效的技術(shù)。
硬件準(zhǔn)備
1.安裝前檢查
服務(wù)器01、02兩臺(面板有標(biāo)示),陣列柜1臺,雙機(jī)互聯(lián)線1根(藍(lán)色),陣列柜電源線2根,服務(wù)器電源線2根,SCSI數(shù)據(jù)連接線2根。
2.陣列柜安裝事項(xiàng)
先連接SCSI數(shù)據(jù)線,一頭接陣列柜后方數(shù)據(jù)接口,一頭接服務(wù)器上方非集成接口(服務(wù)器接口有兩個,一個是主板集成,一個是非集成,非集成的在服務(wù)器背部上方),再分別將電源線兩根接陣列柜后方風(fēng)扇口一側(cè),扣好搭扣。
3.網(wǎng)卡連接注意事項(xiàng)
藍(lán)色網(wǎng)線是雙機(jī)互聯(lián)用的,一頭插在01服務(wù)器非集成網(wǎng)卡上(位置在服務(wù)器背部上方),另一頭插在02服務(wù)器上(位置同上)。業(yè)務(wù)用的網(wǎng)線一頭插在服務(wù)器集成網(wǎng)卡上(位置在服務(wù)器中下方,兩臺都一樣),另外一頭插在交換機(jī)上,01、02都是這樣安裝,安裝后效果如圖1。
圖1
4.開機(jī)順序
先開陣列柜,直到看到上面出現(xiàn)英文提示“Startup Completed”后再開服務(wù)器01,直到出現(xiàn)登錄窗口再開服務(wù)器02,到服務(wù)器02出現(xiàn)登錄窗口后,雙機(jī)開機(jī)過程結(jié)束。
關(guān)機(jī):先關(guān)服務(wù)器02,直到電源完全關(guān)閉。再關(guān)服務(wù)器01,直到電源完全關(guān)閉,最后按陣列柜電源開關(guān),則陣列柜關(guān)閉。
切記:
1.不能雙機(jī)同時讀寫文件到陣列柜相同分區(qū),否則可能會造成文件或分區(qū)損壞。
2.先保證服務(wù)器關(guān)機(jī)后方可關(guān)閉陣列柜,不然會造成陣列柜內(nèi)數(shù)據(jù)丟失。
3.一定要配置UPS,嚴(yán)防停電事故發(fā)生。
小知識 什么是雙機(jī)容錯?
雙機(jī)容錯是通過雙機(jī)容錯軟件在兩臺服務(wù)器之間建立一種容錯機(jī)制,當(dāng)其中一臺服務(wù)器出現(xiàn)故障而不能勝任工作時,自動切換到另一臺服務(wù)器??蛻舳瞬恢酪膊挥弥滥壳笆怯赡囊粋€服務(wù)器在做相應(yīng)的工作。由于醫(yī)院的軟件是基于Windows 2000 Server+SQL實(shí)現(xiàn)的,所以雙機(jī)容錯系統(tǒng)的處理核心是通過互相監(jiān)控的NT服務(wù)程序來實(shí)現(xiàn)的,雙機(jī)容錯系統(tǒng)是完全獨(dú)立于NT的應(yīng)用軟件和硬件設(shè)備。
軟件使用
雙機(jī)容錯的核心是雙機(jī)熱備軟件通過互相監(jiān)控來實(shí)現(xiàn)熱備的效果。我們采用的軟件是美國ROSE數(shù)據(jù)公司的ROSE HA。ROSE HA可及時地進(jìn)行錯誤隔絕、恢復(fù),保證服務(wù)器在出現(xiàn)意外及有計劃的停機(jī)情況下均能為客戶提供連續(xù)有效的服務(wù)。將ROSE HA軟件同時安裝在兩臺服務(wù)器上,用于監(jiān)視系統(tǒng)的狀態(tài),協(xié)調(diào)兩臺服務(wù)器的工作,維護(hù)系統(tǒng)的可用性。
將軟件分別安裝在01和02服務(wù)器上,并輸入正確的授權(quán)號。它的安裝很簡單,一路“Next”即可,安裝完成后請注意,要將它的服務(wù)改為隨系統(tǒng)啟動。
注意:雙機(jī)熱備要求雙機(jī)須超級用戶密碼相同,因此超級用戶密碼為都為123。
服務(wù)器01為主機(jī),服務(wù)器02為從機(jī),當(dāng)01出現(xiàn)中斷或意外不能工作時,雙機(jī)熱備軟件會自動切換到另一臺服務(wù)器即02,直到服務(wù)器01恢復(fù),軟件會自動切換回01機(jī)。
1.狀態(tài)顯示說明
主界面中,兩臺PC機(jī)呈亮色,表示雙機(jī)開啟,中間綠線表示雙機(jī)心路線(即藍(lán)色網(wǎng)線)通訊正常,紅色表示線路有故障或雙機(jī)中有一臺無響應(yīng)!雙機(jī)中屏幕有ZZZ標(biāo)示的為從機(jī),屏幕中有圖標(biāo)的是主機(jī)(圖2)。主機(jī)工作時能看到陣列柜分區(qū),即G、H盤。從機(jī)不能看到這兩個分區(qū)。
圖2
2.資源界面說明
圖3所示server01(01機(jī))和server02(02機(jī))兩邊現(xiàn)在已經(jīng)建立好了相應(yīng)的同步資源,它們是IP地址、服務(wù)器名、NT服務(wù)、共享文件和磁盤卷?,F(xiàn)在分別列出相關(guān)信息:資源工作狀況說明,呈現(xiàn)亮色的為主機(jī)資源,綠色的為從機(jī)資源,黃色驚嘆號的表示該資源有異常(如主機(jī)死機(jī),從機(jī)就會顯示此信息)?;疑硎举Y源剛建立但未激活。原則上兩邊的資源名稱和數(shù)量是相同的,陣列柜資源必須全部包含在內(nèi)。 #p#page_title#e#
圖3
其中server表示虛擬服務(wù)器,它是由雙機(jī)熱備軟件自動產(chǎn)生的PC機(jī)。
server的特性基本與主機(jī)相同,如輸入\serverc$,可以訪問的是server01的C盤,但它使用自己的IP地址,共享目錄也是自己的,如\server est能夠訪問的前提是server01和server02都創(chuàng)建了test目錄共享,且兩個共享是指向同一個目錄,如 G: est,而不能建立在各自的獨(dú)有盤符中,要建立在公用盤符(一般是陣列柜)上。當(dāng)雙機(jī)的共享都建立成功后,再使用雙機(jī)軟件創(chuàng)建一個虛擬共享資源如 \server est即可。
開設(shè)用戶名為管理用賬號“toway”,密碼“toway”,如果新賬號要求在server01中進(jìn)行,它是主域控制器。數(shù)據(jù)庫用戶名system / twsa2004_comein. (注意后面有小數(shù)點(diǎn))。
出現(xiàn)意外時的處理方法
1.雙機(jī)配置時
雙機(jī)熱備程序已經(jīng)備份了注冊表文件,分別對應(yīng)在各自機(jī)器的 administrator我的文檔中文件名為01.reg和02.reg,恢復(fù)時先停止雙機(jī)服務(wù),步驟為:進(jìn)雙機(jī)軟件,點(diǎn)擊快捷菜單中的紅色圖標(biāo),依次點(diǎn)→Tools→Restore cluster configur01tion,選中相應(yīng)的備份文件即可。
2.資源丟失,如陣列柜盤符消失
先停止雙機(jī)服務(wù),再分別在雙機(jī)中使用磁盤管理器加入相應(yīng)盤符,保證雙機(jī)盤符相同再重啟雙機(jī)服務(wù),點(diǎn)擊失效的資源(一般呈灰色),右鍵選擇“bring in cluster”,稍后即會恢復(fù)正常。
3.切換服務(wù)器的主從順序
點(diǎn)擊需要停止機(jī)器名,進(jìn)入菜單選擇resource→server f01ilover。
4.意外停電事故的處理
如果遇到意外停電事故,可能會產(chǎn)生陣列柜分區(qū)丟失,雙機(jī)不能正常工作的情況。請按下面的方式處理:
1)先停止雙機(jī)服務(wù)。
2)使用磁盤管理器加入相應(yīng)盤符,看此時是哪個盤符丟失,直接點(diǎn)擊盤符在右鍵菜單中選擇“更改驅(qū)動器名和路徑”,分配原來正確的路徑即可。
3)重啟服務(wù)器01,在我的電腦中查看陣列柜盤符是否已經(jīng)出現(xiàn),里面的內(nèi)容是否還有。由于相關(guān)的備份內(nèi)容已經(jīng)全部拷貝到01機(jī)的E、F盤中,主要是mssql、server和toway等3個關(guān)鍵目錄。如果損壞嚴(yán)重,可以用備份進(jìn)行拷貝來恢復(fù)。不過最好是重啟后仔細(xì)觀察,不要輕易進(jìn)行拷貝恢復(fù),因?yàn)榭赡軙G失一些數(shù)據(jù)!
一般來說,G 盤存放mssql(SQL安裝路徑)、server(程序共享路徑)、towayhis(數(shù)據(jù)庫日志)等文件夾,H 盤放數(shù)據(jù)庫的目錄和towayhis (數(shù)據(jù)庫文件)文件夾。
重啟服務(wù)器01后,將服務(wù)器02也重啟一遍,查看陣列柜分區(qū)是否正常。
4)如果一切正常就可以啟動雙機(jī)程序,把服務(wù)恢復(fù)。檢查資源窗口中的狀態(tài)是否正常,如果呈現(xiàn)灰色,一般是陣列柜的盤符,可以手工啟動它,啟動方法是右鍵點(diǎn)擊盤符選擇“bring in”即可。
提示:雙機(jī)程序可以手工切換指定誰為主機(jī),默認(rèn)是01,如果想改為02,在資源界面中選中01機(jī),再點(diǎn)擊快捷菜單中“?”左邊的第一個按鈕即可。切換后原來的01機(jī)資源呈現(xiàn)綠色 ,02機(jī)資源呈現(xiàn)亮色,即表示切換成功!