IBM JS20刀片高性能計(jì)算解決方案
時間:2009-02-22 23:15:00
來源:UltraLAB圖形工作站方案網(wǎng)站
人氣:4062
作者:admin
方案簡介
該方案中共配置了14個IBM JS20服務(wù)器,28顆IBM PowerPC970/2.2GHz處理器;內(nèi)存容量為28GB。理論浮點(diǎn)運(yùn)算性能達(dá)到2464億/秒。 配置一臺IBM OpenPower710服務(wù)器作為I/O節(jié)點(diǎn)。該服務(wù)器配置了1個IBM最新的Power5處理器。在IBM SMT(Simultaneous Muti-Threading)功能打開的情況下,該系統(tǒng)的邏輯處理器數(shù)為2個,完全可以勝任I/O吞吐負(fù)載。 配置了完善的高性能計(jì)算管理與開發(fā)軟件,方便用戶管理與使用。
方案優(yōu)點(diǎn):
1. 成熟的硬件與軟件配置,構(gòu)成完善的高性能計(jì)算集群系統(tǒng);
2. IBM刀片服務(wù)器JS20采用處理能力極強(qiáng)的PowerPC970 RISC芯片。該芯片同時具有內(nèi)置的向量擴(kuò)展單元,可以大幅度提高適合向量化的應(yīng)用程序的性能;
3. 在刀片服務(wù)器集群中,將計(jì)算網(wǎng)絡(luò)和數(shù)據(jù)傳輸網(wǎng)絡(luò)完全分開,改善計(jì)算的通信性能和I/O處理能力;
4. 配置統(tǒng)一的共享文件系統(tǒng),方便用戶使用;
5. 采用單一的系統(tǒng)管理軟件,實(shí)現(xiàn)整個集群系統(tǒng)的統(tǒng)一管理,方便用戶進(jìn)行系統(tǒng)管理與維護(hù);
2. 方案二:34個刀片服務(wù)器
方案二配置示意圖
方案簡述: 該方案中共配置了34個IBM JS20服務(wù)器,68顆IBM PowerPC970/2.2GHz處理器;內(nèi)存容量為68GB。理論浮點(diǎn)運(yùn)算性能達(dá)到5984億/秒。 配置一臺IBM OpenPower710服務(wù)器作為I/O節(jié)點(diǎn)。該服務(wù)器配置了1個IBM最新的Power5處理器。在IBM SMT(Simultaneous Muti-Threading)功能打開的情況下,該系統(tǒng)的邏輯處理器數(shù)為2個,完全可以勝任I/O吞吐負(fù)載。 配置了完善的高性能計(jì)算管理與開發(fā)軟件,方便用戶管理與使用。
方案優(yōu)點(diǎn):
1. 成熟的硬件與軟件配置,構(gòu)成完善的高性能計(jì)算集群系統(tǒng);
2. IBM刀片服務(wù)器JS20采用處理能力極強(qiáng)的PowerPC970 RISC芯片。該芯片同時具有內(nèi)置的向量擴(kuò)展單元,可以大幅度提高適合向量化的應(yīng)用程序的性能;
3. 在刀片服務(wù)器集群中,將計(jì)算網(wǎng)絡(luò)和數(shù)據(jù)傳輸網(wǎng)絡(luò)完全分開,改善計(jì)算的通信性能和I/O處理能力;
4. 配置統(tǒng)一的共享文件系統(tǒng),方便用戶使用;
5. 采用單一的系統(tǒng)管理軟件,實(shí)現(xiàn)整個集群系統(tǒng)的統(tǒng)一管理,方便用戶進(jìn)行系統(tǒng)管理與維護(hù);
集群系統(tǒng)管理軟件 集群系統(tǒng)管理軟件和集群系統(tǒng)一樣形形色色、多種多樣。
下面簡要介紹幾種集群系統(tǒng)管理軟件并比較它們實(shí)現(xiàn)的功能。
(1)IBM CSM IBM CSM(Cluster Systems Management )是IBM eServer Cluster 1300上的系統(tǒng)管理軟件。IBM的Linux集群戰(zhàn)略的一部分就是把運(yùn)行在RS/6000 SP平臺上的PSSP軟件移植到基于xSeries的Linux集群系統(tǒng)上。CSM大部分功能來源于SP平臺,但是它也集成了WebSM 2000、xSeries、開放源碼工具和其他技術(shù)。CSM是一款功能很全面的管理工具,而且還在不斷的發(fā)展中。
(2)xCAT XCAT是用于IBM eServer Cluster 1300上的系統(tǒng)管理軟件。它由Egan Ford開發(fā)。它基本上是由shell腳本寫成,相當(dāng)簡捷。但是它實(shí)現(xiàn)了集群系統(tǒng)管理大部分的內(nèi)容,是個非常出色的管理軟件。
下表比較了以上兩種主要集群系統(tǒng)管理軟件:
作業(yè)管理軟件 有很多種選擇去管理集群系統(tǒng)中的資源。其中PBS資源管理器和Maui作業(yè)調(diào)度器最適合集群系統(tǒng)。
(1) PBS PBS(Portable Batch System)是由NASA開發(fā)的靈活的批處理系統(tǒng)。它被用于集群系統(tǒng)、超級計(jì)算機(jī)和大規(guī)模并行系統(tǒng)。
PBS主要有如下特征:
· 易用性:為所有的資源提供統(tǒng)一的接口,易于配置以滿足不同系統(tǒng)的需求,靈活的作業(yè)調(diào)度器允許不同系統(tǒng)采用自己的調(diào)度策略。
· 移植性:符合POSIX 1003.2標(biāo)準(zhǔn),可以用于shell和批處理等各種環(huán)境。
· 適配性:可以適配與各種管理策略,并提供可擴(kuò)展的認(rèn)證和安全模型。支持廣域網(wǎng)上的負(fù)載的動態(tài)分發(fā)和建立在多個物理位置不同的實(shí)體上的虛擬組織。
· 靈活性:支持交互和批處理作業(yè)。
OpenPBS(http://www.OpenPBS.org/)是PBS的Open Source的實(shí)現(xiàn)。商業(yè)版本的PBS可以參照:http://www.pbspro.com/。 (2)Maui Maui是一個高級的作業(yè)調(diào)度器。它采用積極的調(diào)度策略優(yōu)化資源的利用和減少作業(yè)的響應(yīng)時間。Maui的資源和負(fù)載管理允許高級的參數(shù)配置:作業(yè)優(yōu)先級(Job Priority)、調(diào)度和分配(Scheduling and Allocation)、公平性和公平共享(Fairness and Fairshare)和預(yù)留策略(Reservation Policy)。Maui的QoS機(jī)制允許資源和服務(wù)的直接傳遞、策略解除(Policy Exemption)和指定特征的受限訪問。Maui采用高級的資源預(yù)留架構(gòu)可以保證精確控制資源何時、何地、被誰、怎樣使用。Maui的預(yù)留架構(gòu)完全支持非入侵式的元調(diào)度。 Maui的設(shè)計(jì)得益于世界最大的高性能計(jì)算中心的經(jīng)驗(yàn)。Maui本身也提供測試工具和模擬器用于估計(jì)和調(diào)節(jié)系統(tǒng)性能。 Maui需要資源管理器與其配合使用。我們可以把Maui想象為PBS中的一個插入部件。 更多Maui的信息可以訪問:http://www.supercluster.org
BladeCenter JS20 和Sun Fire B100s/B100x/B200x刀片競爭分析
性能
l 支持主頻2.2GHz PowerPC 970處理器,而目前Sun的客戶受限于陳舊和速度更慢的UltraSPARC ІIi 650MHz處理器。
l JS20設(shè)計(jì)支持2顆處理器,而Sun Fire B100s/x只支持單顆處理器。
l 內(nèi)存支持4GB(4GB 800MHz FSB模式)大大增加服務(wù)器性能,而Sun B100s/x內(nèi)存只能擴(kuò)展到2GB。 l IBM BladeCenter JS20為每一個刀片提供直接或冗余附件連接企業(yè)SAN,以獲得到高性能磁盤陣列的非受限磁盤容量的高速帶寬連接,而Sun僅依靠更慢的NAS連接硬盤。
l 目前快速處理器和PCI總線需要更高的帶寬支持。鑒于此原因,BladeCenter JS20設(shè)計(jì)使用PC2700 DDR,PC2700 DDR可以支持2700MB/s的傳送速率,而Sun B100s PC133內(nèi)存支持僅達(dá)1100MB/s,Sun B100x PC2100 內(nèi)存支持僅達(dá)2100MB/s。#p#page_title#e#
更低的管理成本
由于提供了豐富的獨(dú)特管理特性,SUSE LINUX Enterprise Server成為企業(yè)中最容易部署、配置和維護(hù)的Linux平臺:
l YaST (Yet another Setup Tool)可實(shí)現(xiàn)操作系統(tǒng)、網(wǎng)絡(luò)服務(wù)、存儲器、集群,甚至應(yīng)用程序的輕松安裝和配置
l AutoYaST可實(shí)現(xiàn)在您的基礎(chǔ)設(shè)施中以“無人值守”的方式部署Linux
l 開放式應(yīng)用編程接口 (API)以及對通用信息模型(CIM)標(biāo)準(zhǔn)的支持可實(shí)現(xiàn)與第三方管理解決方案的集成
l 基于類的內(nèi)核資源管理 (CKRM)可對大型服務(wù)器進(jìn)行類似大型機(jī)的分區(qū)
l 目錄配置提供了集中管理功能
l 對Novell ZENworks Linux管理的內(nèi)置支持功能為保證Linux服務(wù)器和應(yīng)用的最新狀態(tài)和安全性提供了最佳的解決方案
l 通用代碼庫保證了在所有Linux平臺上使用統(tǒng)一的管理工具和進(jìn)行自動軟件更新,以最大程度提高靈活性和節(jié)約成本
安心部署LINUX平臺
SUSE LINUX Enterprise Server由Novell提供全面支持,為您的Linux環(huán)境提供完整的企業(yè)軟件系統(tǒng):包括技術(shù)支持、培訓(xùn)、咨詢、保障和全面的合作伙伴網(wǎng)絡(luò)。Novell對開放源代碼的承諾以及在Linux集成方面的專業(yè)知識將幫助各種規(guī)模的企業(yè)迅速而可靠地部署Linux環(huán)境。
SUSE LINUX Enterprise Server提供HPC價(jià)值
成功案例
某高性能流體計(jì)算用戶的應(yīng)用環(huán)境既有商業(yè)程序,也有大量自主開發(fā)的程序。經(jīng)過多種平臺的測試比較,IBM Bladeserver JS20以兩倍以上的速度和超低的功耗脫穎而出,用戶一次安裝了128個IBM Bladeserver JS20。
下面是IBM給該用戶的建議配置:
硬件部分
(1) 計(jì)算節(jié)點(diǎn)128個JS20 CPU:2xPowerPC 970 2.2GHz RAM:2G PC2700 ECC DDR HDD:40GB 5400 rpm ATA-100 (EIDE)
(2) BladeCenter Chassis 10個 標(biāo)配管理模塊 標(biāo)配一組2000W電源模塊,加一組2000W電源模塊 消音器模塊一個 4端口千兆以太網(wǎng)交換機(jī)模塊(Gigabit Ethernet Switch Module)一個
(3) 機(jī)柜3個T00/36U,19英寸標(biāo)準(zhǔn)機(jī)柜 每個機(jī)柜4個PDU 其中一個配置KVM
(4) cisco網(wǎng)絡(luò)交換機(jī) 至少48口千兆以太網(wǎng)交換機(jī)一個 至少12口百兆以太網(wǎng)交換機(jī)一個
(5) 登錄節(jié)點(diǎn)2個JS20 配置同計(jì)算節(jié)點(diǎn)
(6) 管理節(jié)點(diǎn)1個x346 兩塊硬盤 顯卡
(7) IO節(jié)點(diǎn)2個p5-510 CPU:1.5G POWER5 RAM:1G HBA2個
(8) 磁盤陣列FAStT900 (9) SAN交換機(jī)2個
軟件部分
(10) 操作系統(tǒng)SLES 9(收費(fèi))
(11) 集群管理系統(tǒng)xCAT(免費(fèi))
(12) 編譯器 GNU Compiler:gcc、g77(免費(fèi)) IBM Compiler:xl-FORTRAN 9.1 for Linux、xl-C 7.0 for Linux(收費(fèi)) (13) 支撐軟件 MPI-CH(免費(fèi)) PVM(免費(fèi)) Open-PBS,Maui(免費(fèi))
(14) 文件系統(tǒng) NFS(免費(fèi)) PVFS(免費(fèi)) 系統(tǒng)拓?fù)浣Y(jié)構(gòu)圖如下:
128節(jié)點(diǎn)JS20刀片式服務(wù)器集群示意圖
關(guān)于IBM高性能計(jì)算的簡介
IBM長期以來致力于高性能計(jì)算領(lǐng)域的技術(shù)發(fā)展和應(yīng)用完善,當(dāng)其它IT廠商由于機(jī)會或者財(cái)務(wù)限制,在這種科學(xué)計(jì)算市場中進(jìn)進(jìn)出出時,IBM就從每年50億美金的研發(fā)經(jīng)費(fèi)中按比例、持續(xù)地投入高性能計(jì)算領(lǐng)域。IBM承諾將保持在高性能計(jì)算領(lǐng)域的領(lǐng)先位置。 IBM發(fā)明了包括并行處理、對稱多處理機(jī)和集群等技術(shù),并通過它們始終保持著在業(yè)界的領(lǐng)先水平。并且IBM還承諾,通過利用和增強(qiáng)基于開放資源技術(shù)與工業(yè)標(biāo)準(zhǔn)服務(wù)器的Linux集群,來提供給客戶更多的機(jī)會。IBM將會成為這種方案的領(lǐng)先提供商,我們在世界各地成立了專門的隊(duì)伍,為Linux的發(fā)展貢獻(xiàn)力量,幫助客戶或合作伙伴將應(yīng)用移植到Linux平臺,開發(fā)更多的新技術(shù)和應(yīng)用。 IBM Linux集群系統(tǒng)是利用先進(jìn)的體系架構(gòu)將IBM的eServer x系列服務(wù)器、p系列服務(wù)器以及TotalStorage存儲解決方案連接起來,通過集群技術(shù)實(shí)現(xiàn)高性能運(yùn)算。由于Linux集群系統(tǒng)性能卓越,可用性高,擴(kuò)展能力強(qiáng)和易于掌握等優(yōu)勢,一經(jīng)推出,就被科學(xué)運(yùn)算領(lǐng)域和商用領(lǐng)域的用戶認(rèn)可。
眾所周知,IBM公司長期以來在高性能運(yùn)算方面投入了大量的精力,并取得了很好的成績。在高性能運(yùn)算TOP 500名中,IBM公司占有很大的份額。IBM的大規(guī)模并行處理機(jī)SP系統(tǒng)已廣泛地運(yùn)用在各個領(lǐng)域,該機(jī)(深藍(lán))曾在1997年中的“人機(jī)大戰(zhàn)”中因戰(zhàn)勝棋王卡斯帕羅夫而享譽(yù)全球。作為后起之秀的Linux集群系統(tǒng),吸取了SP大規(guī)模并行機(jī)的諸多優(yōu)勢,并且將SP上的優(yōu)秀的系統(tǒng)管理軟件和并行處理方面的程序移植到Linux集群系統(tǒng)上,如并行系統(tǒng)管理軟件PSSP和通用并行文件系統(tǒng)GPFS等,從而使Linux集群系統(tǒng)不僅能在并行運(yùn)算方面的性能得到保障,增強(qiáng)了集群系統(tǒng)的可管理性,最新的技術(shù)進(jìn)步使得在相同的空間內(nèi)采用刀片式服務(wù)器,從而將節(jié)點(diǎn)密度提高一倍,大大降低成本。 也正因?yàn)槿绱?,IBM的Linux集群解決方案越來越受到眾多的用戶群的關(guān)注,其中包括著名的藍(lán)色基因Blue Gene/L,在全球高性能計(jì)算集群中排名第一。
藍(lán)色基因系統(tǒng)示意圖
該方案中共配置了14個IBM JS20服務(wù)器,28顆IBM PowerPC970/2.2GHz處理器;內(nèi)存容量為28GB。理論浮點(diǎn)運(yùn)算性能達(dá)到2464億/秒。 配置一臺IBM OpenPower710服務(wù)器作為I/O節(jié)點(diǎn)。該服務(wù)器配置了1個IBM最新的Power5處理器。在IBM SMT(Simultaneous Muti-Threading)功能打開的情況下,該系統(tǒng)的邏輯處理器數(shù)為2個,完全可以勝任I/O吞吐負(fù)載。 配置了完善的高性能計(jì)算管理與開發(fā)軟件,方便用戶管理與使用。
方案優(yōu)點(diǎn):
1. 成熟的硬件與軟件配置,構(gòu)成完善的高性能計(jì)算集群系統(tǒng);
2. IBM刀片服務(wù)器JS20采用處理能力極強(qiáng)的PowerPC970 RISC芯片。該芯片同時具有內(nèi)置的向量擴(kuò)展單元,可以大幅度提高適合向量化的應(yīng)用程序的性能;
3. 在刀片服務(wù)器集群中,將計(jì)算網(wǎng)絡(luò)和數(shù)據(jù)傳輸網(wǎng)絡(luò)完全分開,改善計(jì)算的通信性能和I/O處理能力;
4. 配置統(tǒng)一的共享文件系統(tǒng),方便用戶使用;
5. 采用單一的系統(tǒng)管理軟件,實(shí)現(xiàn)整個集群系統(tǒng)的統(tǒng)一管理,方便用戶進(jìn)行系統(tǒng)管理與維護(hù);
2. 方案二:34個刀片服務(wù)器
方案二配置示意圖
方案簡述: 該方案中共配置了34個IBM JS20服務(wù)器,68顆IBM PowerPC970/2.2GHz處理器;內(nèi)存容量為68GB。理論浮點(diǎn)運(yùn)算性能達(dá)到5984億/秒。 配置一臺IBM OpenPower710服務(wù)器作為I/O節(jié)點(diǎn)。該服務(wù)器配置了1個IBM最新的Power5處理器。在IBM SMT(Simultaneous Muti-Threading)功能打開的情況下,該系統(tǒng)的邏輯處理器數(shù)為2個,完全可以勝任I/O吞吐負(fù)載。 配置了完善的高性能計(jì)算管理與開發(fā)軟件,方便用戶管理與使用。
方案優(yōu)點(diǎn):
1. 成熟的硬件與軟件配置,構(gòu)成完善的高性能計(jì)算集群系統(tǒng);
2. IBM刀片服務(wù)器JS20采用處理能力極強(qiáng)的PowerPC970 RISC芯片。該芯片同時具有內(nèi)置的向量擴(kuò)展單元,可以大幅度提高適合向量化的應(yīng)用程序的性能;
3. 在刀片服務(wù)器集群中,將計(jì)算網(wǎng)絡(luò)和數(shù)據(jù)傳輸網(wǎng)絡(luò)完全分開,改善計(jì)算的通信性能和I/O處理能力;
4. 配置統(tǒng)一的共享文件系統(tǒng),方便用戶使用;
5. 采用單一的系統(tǒng)管理軟件,實(shí)現(xiàn)整個集群系統(tǒng)的統(tǒng)一管理,方便用戶進(jìn)行系統(tǒng)管理與維護(hù);
集群系統(tǒng)管理軟件 集群系統(tǒng)管理軟件和集群系統(tǒng)一樣形形色色、多種多樣。
下面簡要介紹幾種集群系統(tǒng)管理軟件并比較它們實(shí)現(xiàn)的功能。
(1)IBM CSM IBM CSM(Cluster Systems Management )是IBM eServer Cluster 1300上的系統(tǒng)管理軟件。IBM的Linux集群戰(zhàn)略的一部分就是把運(yùn)行在RS/6000 SP平臺上的PSSP軟件移植到基于xSeries的Linux集群系統(tǒng)上。CSM大部分功能來源于SP平臺,但是它也集成了WebSM 2000、xSeries、開放源碼工具和其他技術(shù)。CSM是一款功能很全面的管理工具,而且還在不斷的發(fā)展中。
(2)xCAT XCAT是用于IBM eServer Cluster 1300上的系統(tǒng)管理軟件。它由Egan Ford開發(fā)。它基本上是由shell腳本寫成,相當(dāng)簡捷。但是它實(shí)現(xiàn)了集群系統(tǒng)管理大部分的內(nèi)容,是個非常出色的管理軟件。
下表比較了以上兩種主要集群系統(tǒng)管理軟件:
作業(yè)管理軟件 有很多種選擇去管理集群系統(tǒng)中的資源。其中PBS資源管理器和Maui作業(yè)調(diào)度器最適合集群系統(tǒng)。
(1) PBS PBS(Portable Batch System)是由NASA開發(fā)的靈活的批處理系統(tǒng)。它被用于集群系統(tǒng)、超級計(jì)算機(jī)和大規(guī)模并行系統(tǒng)。
PBS主要有如下特征:
· 易用性:為所有的資源提供統(tǒng)一的接口,易于配置以滿足不同系統(tǒng)的需求,靈活的作業(yè)調(diào)度器允許不同系統(tǒng)采用自己的調(diào)度策略。
· 移植性:符合POSIX 1003.2標(biāo)準(zhǔn),可以用于shell和批處理等各種環(huán)境。
· 適配性:可以適配與各種管理策略,并提供可擴(kuò)展的認(rèn)證和安全模型。支持廣域網(wǎng)上的負(fù)載的動態(tài)分發(fā)和建立在多個物理位置不同的實(shí)體上的虛擬組織。
· 靈活性:支持交互和批處理作業(yè)。
OpenPBS(http://www.OpenPBS.org/)是PBS的Open Source的實(shí)現(xiàn)。商業(yè)版本的PBS可以參照:http://www.pbspro.com/。 (2)Maui Maui是一個高級的作業(yè)調(diào)度器。它采用積極的調(diào)度策略優(yōu)化資源的利用和減少作業(yè)的響應(yīng)時間。Maui的資源和負(fù)載管理允許高級的參數(shù)配置:作業(yè)優(yōu)先級(Job Priority)、調(diào)度和分配(Scheduling and Allocation)、公平性和公平共享(Fairness and Fairshare)和預(yù)留策略(Reservation Policy)。Maui的QoS機(jī)制允許資源和服務(wù)的直接傳遞、策略解除(Policy Exemption)和指定特征的受限訪問。Maui采用高級的資源預(yù)留架構(gòu)可以保證精確控制資源何時、何地、被誰、怎樣使用。Maui的預(yù)留架構(gòu)完全支持非入侵式的元調(diào)度。 Maui的設(shè)計(jì)得益于世界最大的高性能計(jì)算中心的經(jīng)驗(yàn)。Maui本身也提供測試工具和模擬器用于估計(jì)和調(diào)節(jié)系統(tǒng)性能。 Maui需要資源管理器與其配合使用。我們可以把Maui想象為PBS中的一個插入部件。 更多Maui的信息可以訪問:http://www.supercluster.org
BladeCenter JS20 和Sun Fire B100s/B100x/B200x刀片競爭分析
性能
l 支持主頻2.2GHz PowerPC 970處理器,而目前Sun的客戶受限于陳舊和速度更慢的UltraSPARC ІIi 650MHz處理器。
l JS20設(shè)計(jì)支持2顆處理器,而Sun Fire B100s/x只支持單顆處理器。
l 內(nèi)存支持4GB(4GB 800MHz FSB模式)大大增加服務(wù)器性能,而Sun B100s/x內(nèi)存只能擴(kuò)展到2GB。 l IBM BladeCenter JS20為每一個刀片提供直接或冗余附件連接企業(yè)SAN,以獲得到高性能磁盤陣列的非受限磁盤容量的高速帶寬連接,而Sun僅依靠更慢的NAS連接硬盤。
l 目前快速處理器和PCI總線需要更高的帶寬支持。鑒于此原因,BladeCenter JS20設(shè)計(jì)使用PC2700 DDR,PC2700 DDR可以支持2700MB/s的傳送速率,而Sun B100s PC133內(nèi)存支持僅達(dá)1100MB/s,Sun B100x PC2100 內(nèi)存支持僅達(dá)2100MB/s。#p#page_title#e#
更低的管理成本
由于提供了豐富的獨(dú)特管理特性,SUSE LINUX Enterprise Server成為企業(yè)中最容易部署、配置和維護(hù)的Linux平臺:
l YaST (Yet another Setup Tool)可實(shí)現(xiàn)操作系統(tǒng)、網(wǎng)絡(luò)服務(wù)、存儲器、集群,甚至應(yīng)用程序的輕松安裝和配置
l AutoYaST可實(shí)現(xiàn)在您的基礎(chǔ)設(shè)施中以“無人值守”的方式部署Linux
l 開放式應(yīng)用編程接口 (API)以及對通用信息模型(CIM)標(biāo)準(zhǔn)的支持可實(shí)現(xiàn)與第三方管理解決方案的集成
l 基于類的內(nèi)核資源管理 (CKRM)可對大型服務(wù)器進(jìn)行類似大型機(jī)的分區(qū)
l 目錄配置提供了集中管理功能
l 對Novell ZENworks Linux管理的內(nèi)置支持功能為保證Linux服務(wù)器和應(yīng)用的最新狀態(tài)和安全性提供了最佳的解決方案
l 通用代碼庫保證了在所有Linux平臺上使用統(tǒng)一的管理工具和進(jìn)行自動軟件更新,以最大程度提高靈活性和節(jié)約成本
安心部署LINUX平臺
SUSE LINUX Enterprise Server由Novell提供全面支持,為您的Linux環(huán)境提供完整的企業(yè)軟件系統(tǒng):包括技術(shù)支持、培訓(xùn)、咨詢、保障和全面的合作伙伴網(wǎng)絡(luò)。Novell對開放源代碼的承諾以及在Linux集成方面的專業(yè)知識將幫助各種規(guī)模的企業(yè)迅速而可靠地部署Linux環(huán)境。
SUSE LINUX Enterprise Server提供HPC價(jià)值
成功案例
某高性能流體計(jì)算用戶的應(yīng)用環(huán)境既有商業(yè)程序,也有大量自主開發(fā)的程序。經(jīng)過多種平臺的測試比較,IBM Bladeserver JS20以兩倍以上的速度和超低的功耗脫穎而出,用戶一次安裝了128個IBM Bladeserver JS20。
下面是IBM給該用戶的建議配置:
硬件部分
(1) 計(jì)算節(jié)點(diǎn)128個JS20 CPU:2xPowerPC 970 2.2GHz RAM:2G PC2700 ECC DDR HDD:40GB 5400 rpm ATA-100 (EIDE)
(2) BladeCenter Chassis 10個 標(biāo)配管理模塊 標(biāo)配一組2000W電源模塊,加一組2000W電源模塊 消音器模塊一個 4端口千兆以太網(wǎng)交換機(jī)模塊(Gigabit Ethernet Switch Module)一個
(3) 機(jī)柜3個T00/36U,19英寸標(biāo)準(zhǔn)機(jī)柜 每個機(jī)柜4個PDU 其中一個配置KVM
(4) cisco網(wǎng)絡(luò)交換機(jī) 至少48口千兆以太網(wǎng)交換機(jī)一個 至少12口百兆以太網(wǎng)交換機(jī)一個
(5) 登錄節(jié)點(diǎn)2個JS20 配置同計(jì)算節(jié)點(diǎn)
(6) 管理節(jié)點(diǎn)1個x346 兩塊硬盤 顯卡
(7) IO節(jié)點(diǎn)2個p5-510 CPU:1.5G POWER5 RAM:1G HBA2個
(8) 磁盤陣列FAStT900 (9) SAN交換機(jī)2個
軟件部分
(10) 操作系統(tǒng)SLES 9(收費(fèi))
(11) 集群管理系統(tǒng)xCAT(免費(fèi))
(12) 編譯器 GNU Compiler:gcc、g77(免費(fèi)) IBM Compiler:xl-FORTRAN 9.1 for Linux、xl-C 7.0 for Linux(收費(fèi)) (13) 支撐軟件 MPI-CH(免費(fèi)) PVM(免費(fèi)) Open-PBS,Maui(免費(fèi))
(14) 文件系統(tǒng) NFS(免費(fèi)) PVFS(免費(fèi)) 系統(tǒng)拓?fù)浣Y(jié)構(gòu)圖如下:
128節(jié)點(diǎn)JS20刀片式服務(wù)器集群示意圖
關(guān)于IBM高性能計(jì)算的簡介
IBM長期以來致力于高性能計(jì)算領(lǐng)域的技術(shù)發(fā)展和應(yīng)用完善,當(dāng)其它IT廠商由于機(jī)會或者財(cái)務(wù)限制,在這種科學(xué)計(jì)算市場中進(jìn)進(jìn)出出時,IBM就從每年50億美金的研發(fā)經(jīng)費(fèi)中按比例、持續(xù)地投入高性能計(jì)算領(lǐng)域。IBM承諾將保持在高性能計(jì)算領(lǐng)域的領(lǐng)先位置。 IBM發(fā)明了包括并行處理、對稱多處理機(jī)和集群等技術(shù),并通過它們始終保持著在業(yè)界的領(lǐng)先水平。并且IBM還承諾,通過利用和增強(qiáng)基于開放資源技術(shù)與工業(yè)標(biāo)準(zhǔn)服務(wù)器的Linux集群,來提供給客戶更多的機(jī)會。IBM將會成為這種方案的領(lǐng)先提供商,我們在世界各地成立了專門的隊(duì)伍,為Linux的發(fā)展貢獻(xiàn)力量,幫助客戶或合作伙伴將應(yīng)用移植到Linux平臺,開發(fā)更多的新技術(shù)和應(yīng)用。 IBM Linux集群系統(tǒng)是利用先進(jìn)的體系架構(gòu)將IBM的eServer x系列服務(wù)器、p系列服務(wù)器以及TotalStorage存儲解決方案連接起來,通過集群技術(shù)實(shí)現(xiàn)高性能運(yùn)算。由于Linux集群系統(tǒng)性能卓越,可用性高,擴(kuò)展能力強(qiáng)和易于掌握等優(yōu)勢,一經(jīng)推出,就被科學(xué)運(yùn)算領(lǐng)域和商用領(lǐng)域的用戶認(rèn)可。
眾所周知,IBM公司長期以來在高性能運(yùn)算方面投入了大量的精力,并取得了很好的成績。在高性能運(yùn)算TOP 500名中,IBM公司占有很大的份額。IBM的大規(guī)模并行處理機(jī)SP系統(tǒng)已廣泛地運(yùn)用在各個領(lǐng)域,該機(jī)(深藍(lán))曾在1997年中的“人機(jī)大戰(zhàn)”中因戰(zhàn)勝棋王卡斯帕羅夫而享譽(yù)全球。作為后起之秀的Linux集群系統(tǒng),吸取了SP大規(guī)模并行機(jī)的諸多優(yōu)勢,并且將SP上的優(yōu)秀的系統(tǒng)管理軟件和并行處理方面的程序移植到Linux集群系統(tǒng)上,如并行系統(tǒng)管理軟件PSSP和通用并行文件系統(tǒng)GPFS等,從而使Linux集群系統(tǒng)不僅能在并行運(yùn)算方面的性能得到保障,增強(qiáng)了集群系統(tǒng)的可管理性,最新的技術(shù)進(jìn)步使得在相同的空間內(nèi)采用刀片式服務(wù)器,從而將節(jié)點(diǎn)密度提高一倍,大大降低成本。 也正因?yàn)槿绱?,IBM的Linux集群解決方案越來越受到眾多的用戶群的關(guān)注,其中包括著名的藍(lán)色基因Blue Gene/L,在全球高性能計(jì)算集群中排名第一。
藍(lán)色基因系統(tǒng)示意圖