Windows HPC Server 2008 部署初體驗(yàn)
大家好,我是HPC中國研發(fā)團(tuán)隊(duì)的新程序經(jīng)理(PM)實(shí)習(xí)生劉賢斐,聽言"PM是連接用戶和開發(fā)團(tuán)隊(duì)的重要角色",因此,在加入微軟HPC組之后,盡快熟悉微軟HPC的產(chǎn)品成為我的重要任務(wù)之一,在在得到了包括老板George,育彤兄的大力支持以及天馳兄的大力PUSH之后,我成功地把Microsoft Windows HPC Server 2008(Beta1) 部署到了一臺(tái)具備一個(gè)頭節(jié)點(diǎn)4個(gè)計(jì)算節(jié)點(diǎn)的集群(Cluster)上。原來用HPC PACK部署集群是如此方便快捷(不是廣告,看后面就知道了),其興奮不言而喻,在此和大家分享一下我的經(jīng)歷。
那么什么是集群(Cluster)呢?比較正式的解釋是:集群(Cluster)是由兩臺(tái)或多臺(tái)節(jié)點(diǎn)機(jī)(服務(wù)器)構(gòu)成的一種松散耦合的計(jì)算節(jié)點(diǎn)集合,能夠?yàn)橛脩籼峁└鞣N服務(wù)。我們部署的集群外觀是這樣的:
HPC Server 2008的作用是在這上面部署操作系統(tǒng)以及集群管理工具等。先來說說HPC Server 2008的概念吧,它是由兩個(gè)部分組成的:Windows Server 2008和Microsoft HPC Pack。
Windows Server 2008主要是提供64位的操作系統(tǒng)支持,Microsoft HPC Pack提供了集群管理,任務(wù)調(diào)度,MPI編程環(huán)境,SDK等一系列工具。了解了概念后,就動(dòng)手部署了,首先要做的是插好電源并檢查鼠標(biāo)鍵盤以及網(wǎng)線有沒有接對(不是廢話,當(dāng)時(shí)我就沒注意分清CONSOLE的接口和頭節(jié)點(diǎn)的接口,慚愧慚愧),之后就在頭節(jié)點(diǎn)上裝好Windows Server 2008和HPC Pack。接下來當(dāng)我準(zhǔn)備在四個(gè)節(jié)點(diǎn)上如法炮制時(shí),立馬被無情地鄙視了,因?yàn)檫@是最低效率的做法了,我們要做的事情只是把四個(gè)節(jié)點(diǎn)的電源接通,然后利用HPC Pack的 Node Template(節(jié)點(diǎn)模板)功能就可以很方便地在所有的節(jié)點(diǎn)上搞定這些事情。具體的過程如下:進(jìn)入Configuration后,你可以看到如下的界面:
首先,就是配置網(wǎng)絡(luò)(有5種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),具體的奧妙大家可以自己研究一把),配置系統(tǒng)帳號(hào),給節(jié)點(diǎn)批量命名,最有意思的是第4步了,創(chuàng)建新的節(jié)點(diǎn)模板,如圖所示:
在向?qū)е猩宰髋渲茫宦?quot;Next",即大功告成。然后選擇在哪些節(jié)點(diǎn)上部署這個(gè)模板。我們支持對三種節(jié)點(diǎn)的部署:裸機(jī)節(jié)點(diǎn),以前把其配置導(dǎo)出成XML文件的節(jié)點(diǎn),和已經(jīng)安裝好操作系統(tǒng)的節(jié)點(diǎn);對我來說在空節(jié)點(diǎn)上安裝當(dāng)然是第一種情形了,點(diǎn)擊"PROVISION", 部署就開始了?,F(xiàn)在可以在"Node Management"(節(jié)點(diǎn)管理)導(dǎo)航欄里面看到這些節(jié)點(diǎn)在"Provisioning"(正在部署)的列表中,單擊節(jié)點(diǎn)就可以看到它們部署的狀態(tài),在執(zhí)行哪些命令。
部署完畢后,就可以使用這些節(jié)點(diǎn)了,包括讓它們online或者offline,提交任務(wù)等。
HPC Server提供的一個(gè)很有意思的功能是查看節(jié)點(diǎn)的健康狀態(tài)(如下圖),我們可以選擇添加一些標(biāo)準(zhǔn)(Metric),添加之后,這些標(biāo)準(zhǔn)會(huì)以一個(gè)柱狀圖的形式顯示出來,顏色越深表示它的值越高。在我們的圖中可以看出來,頭結(jié)點(diǎn)(TYANHEAD)上的每秒系統(tǒng)調(diào)用數(shù)量(System Calls/ Second)和硬盤的吞吐量(Disk Throughput)都比其他節(jié)點(diǎn)高,所以它們對應(yīng)的顏色也越深,而頭結(jié)點(diǎn)可用的物理內(nèi)存(Available Physical Memory)最少,所以相對于其他節(jié)點(diǎn)來說,它的顏色也教淺。這樣可以讓管理員直觀的看到現(xiàn)在每個(gè)節(jié)點(diǎn)的狀態(tài)。
怎么樣,是不是很方便啊,沒有繁瑣的步驟,不用記大量的命令,一切都很一目了然就可以部署集群了。
以上是我的一些體驗(yàn),歡迎大家指出不當(dāng)之處,多多交流~, 同時(shí)也感謝全體HPC 中國研發(fā)團(tuán)隊(duì)對我撰寫此文的幫助。
原文鏈接:http://windowshpc.net/Blogs/China/Lists/Posts/Post.aspx?ID=6