集群系統(tǒng)的現(xiàn)狀與挑戰(zhàn)
時(shí)間:2009-02-22 23:04:00
來(lái)源:UltraLAB圖形工作站方案網(wǎng)站
人氣:3353
作者:admin
一。集群系統(tǒng)成為構(gòu)建高性能計(jì)算系統(tǒng)的主流方式
由于具有低成本、高性能和良好的可擴(kuò)展性,集群系統(tǒng)已經(jīng)日益成為構(gòu)建高性能計(jì)算系統(tǒng)的主要方式。從2003年11月發(fā)布的TOP 500的情況來(lái)看,以系統(tǒng)個(gè)數(shù)計(jì)算,集群系統(tǒng)占41.6%;從Linpack性能來(lái)看,集群系統(tǒng)占TOP 500的49.8%。在前10名的系統(tǒng)中,集群系統(tǒng)更是占到了7個(gè)。由此可見(jiàn),在構(gòu)建超大規(guī)模計(jì)算系統(tǒng)時(shí),集群系統(tǒng)已經(jīng)成為主流。
集群系統(tǒng)的一個(gè)重要特點(diǎn)是盡量使用商用部件以降低成本。用來(lái)構(gòu)建集群系統(tǒng)的各個(gè)部件,包括計(jì)算結(jié)點(diǎn)和通信網(wǎng)絡(luò),都可以在市場(chǎng)上很方便地得到而無(wú)需專門(mén)定制。而使用開(kāi)放源代碼的Linux操作系統(tǒng)和其他軟件工具的集群系統(tǒng)更可以進(jìn)一步降低系統(tǒng)的軟件成本。
成本的降低和軟硬件系統(tǒng)的易獲得性使集群系統(tǒng)的構(gòu)建工作不再是專業(yè)公司和研究部門(mén)的專利,很多使用單位都開(kāi)始在市場(chǎng)上購(gòu)買(mǎi)零件并使用現(xiàn)成的軟件工具,自己構(gòu)建中小規(guī)模的集群系統(tǒng)。
二、64位CPU正在高性能計(jì)算系統(tǒng)中日益普及
盡管Alpha芯片在10年前就提供了64位的計(jì)算能力,但64位運(yùn)算的真正普及還剛剛開(kāi)始。隨著Intel IA64、AMD Opteron和IBM G5芯片的出現(xiàn),具有64位處理能力服務(wù)器和桌面系統(tǒng)的價(jià)格已經(jīng)大大下降。
另一方面,內(nèi)存容量的提升和單位內(nèi)存價(jià)格的持續(xù)下降也使得大內(nèi)存系統(tǒng)的價(jià)格達(dá)到了用戶所能夠承受的范圍。在1994年,4MB內(nèi)存的價(jià)格約2000元人民幣,而現(xiàn)在2000元就可以買(mǎi)到1GB的內(nèi)存。
上述兩個(gè)因素的疊加,使得用戶可以以相對(duì)低廉的價(jià)格獲得具有大容量?jī)?nèi)存的64位計(jì)算系統(tǒng),從而為從事空氣動(dòng)力學(xué)模擬、生物計(jì)算、氣候模擬等研究重大挑戰(zhàn)問(wèn)題的科學(xué)計(jì)算應(yīng)用提供了良好的計(jì)算平臺(tái)。另一方面,數(shù)據(jù)挖掘、決策支持和視頻點(diǎn)播服務(wù)等應(yīng)用也對(duì)內(nèi)存空間有著巨大的需求。64位的系統(tǒng)也為這些商業(yè)計(jì)算應(yīng)用提供了強(qiáng)有力的幫助。
三、高性能存儲(chǔ)系統(tǒng)
如今,高性能計(jì)算的研究領(lǐng)域已經(jīng)不限于科學(xué)計(jì)算本身。大規(guī)模網(wǎng)絡(luò)服務(wù)等商業(yè)計(jì)算也是新興的高性能計(jì)算研究和應(yīng)用方向。Web服務(wù)、視頻點(diǎn)播服務(wù)、數(shù)據(jù)庫(kù)服務(wù)等目前流行的網(wǎng)絡(luò)應(yīng)用對(duì)數(shù)據(jù)存儲(chǔ)容量、訪問(wèn)能力和管理方式提出越來(lái)越高的要求,這些都是傳統(tǒng)的SCSI硬盤(pán)、RAID存儲(chǔ)系統(tǒng)無(wú)法勝任的。高容量、高性能、可靠和易管理的存儲(chǔ)技術(shù)研究成為當(dāng)前熱點(diǎn)。
存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)是一種新興的網(wǎng)絡(luò)存儲(chǔ)技術(shù),它將存儲(chǔ)子系統(tǒng)與服務(wù)器分離,利用高速網(wǎng)絡(luò)進(jìn)行塊數(shù)據(jù)的傳輸,實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的可擴(kuò)展性和高性能。
SAN使用高速網(wǎng)絡(luò)傳輸代替SCSI總線,通過(guò)私有網(wǎng)絡(luò)傳輸SCSI命令,每個(gè)設(shè)備有各自的數(shù)據(jù)訪問(wèn)路徑,設(shè)備訪問(wèn)的網(wǎng)絡(luò)擁塞處理由高速交換機(jī)完成。目前,光纖網(wǎng)絡(luò)可提供2Gb/s的帶寬,Ifiniband的實(shí)測(cè)網(wǎng)絡(luò)帶寬已達(dá)600Mb/s,而千兆Ethernet網(wǎng)可提供1Gb/s的帶寬,不久將出現(xiàn)10Gb/s的高速傳輸網(wǎng)絡(luò)。高速網(wǎng)絡(luò)技術(shù),尤其是光纖通道技術(shù)的應(yīng)用為數(shù)據(jù)存取提供了更好的可擴(kuò)展性,使網(wǎng)絡(luò)的傳輸帶寬可以成倍地增長(zhǎng),從而確保了SAN系統(tǒng)數(shù)據(jù)訪問(wèn)的高性能。
四、互連網(wǎng)絡(luò)
連接集群系統(tǒng)底層的互連網(wǎng)絡(luò),對(duì)集群系統(tǒng)的整體性能有決定性的作用,因此一直是學(xué)術(shù)界和工業(yè)界所關(guān)注的熱點(diǎn)。目前,千兆以太網(wǎng)卡已經(jīng)成為標(biāo)準(zhǔn)配置集成在服務(wù)器主板上,千兆以太網(wǎng)交換機(jī)的價(jià)格也已經(jīng)非常平民化,因此千兆以太網(wǎng)成為了小規(guī)模、低成本集群的主要網(wǎng)絡(luò)互連方式。
Myrinet、Quadrics、SCI和最近出現(xiàn)的InfiniBand 等商業(yè)化高性能集群通信網(wǎng)絡(luò),以更高的帶寬和更小的傳輸延時(shí),為高性能集群系統(tǒng)提供了多樣化的選擇
由于具有低成本、高性能和良好的可擴(kuò)展性,集群系統(tǒng)已經(jīng)日益成為構(gòu)建高性能計(jì)算系統(tǒng)的主要方式。從2003年11月發(fā)布的TOP 500的情況來(lái)看,以系統(tǒng)個(gè)數(shù)計(jì)算,集群系統(tǒng)占41.6%;從Linpack性能來(lái)看,集群系統(tǒng)占TOP 500的49.8%。在前10名的系統(tǒng)中,集群系統(tǒng)更是占到了7個(gè)。由此可見(jiàn),在構(gòu)建超大規(guī)模計(jì)算系統(tǒng)時(shí),集群系統(tǒng)已經(jīng)成為主流。
集群系統(tǒng)的一個(gè)重要特點(diǎn)是盡量使用商用部件以降低成本。用來(lái)構(gòu)建集群系統(tǒng)的各個(gè)部件,包括計(jì)算結(jié)點(diǎn)和通信網(wǎng)絡(luò),都可以在市場(chǎng)上很方便地得到而無(wú)需專門(mén)定制。而使用開(kāi)放源代碼的Linux操作系統(tǒng)和其他軟件工具的集群系統(tǒng)更可以進(jìn)一步降低系統(tǒng)的軟件成本。
成本的降低和軟硬件系統(tǒng)的易獲得性使集群系統(tǒng)的構(gòu)建工作不再是專業(yè)公司和研究部門(mén)的專利,很多使用單位都開(kāi)始在市場(chǎng)上購(gòu)買(mǎi)零件并使用現(xiàn)成的軟件工具,自己構(gòu)建中小規(guī)模的集群系統(tǒng)。
二、64位CPU正在高性能計(jì)算系統(tǒng)中日益普及
盡管Alpha芯片在10年前就提供了64位的計(jì)算能力,但64位運(yùn)算的真正普及還剛剛開(kāi)始。隨著Intel IA64、AMD Opteron和IBM G5芯片的出現(xiàn),具有64位處理能力服務(wù)器和桌面系統(tǒng)的價(jià)格已經(jīng)大大下降。
另一方面,內(nèi)存容量的提升和單位內(nèi)存價(jià)格的持續(xù)下降也使得大內(nèi)存系統(tǒng)的價(jià)格達(dá)到了用戶所能夠承受的范圍。在1994年,4MB內(nèi)存的價(jià)格約2000元人民幣,而現(xiàn)在2000元就可以買(mǎi)到1GB的內(nèi)存。
上述兩個(gè)因素的疊加,使得用戶可以以相對(duì)低廉的價(jià)格獲得具有大容量?jī)?nèi)存的64位計(jì)算系統(tǒng),從而為從事空氣動(dòng)力學(xué)模擬、生物計(jì)算、氣候模擬等研究重大挑戰(zhàn)問(wèn)題的科學(xué)計(jì)算應(yīng)用提供了良好的計(jì)算平臺(tái)。另一方面,數(shù)據(jù)挖掘、決策支持和視頻點(diǎn)播服務(wù)等應(yīng)用也對(duì)內(nèi)存空間有著巨大的需求。64位的系統(tǒng)也為這些商業(yè)計(jì)算應(yīng)用提供了強(qiáng)有力的幫助。
三、高性能存儲(chǔ)系統(tǒng)
如今,高性能計(jì)算的研究領(lǐng)域已經(jīng)不限于科學(xué)計(jì)算本身。大規(guī)模網(wǎng)絡(luò)服務(wù)等商業(yè)計(jì)算也是新興的高性能計(jì)算研究和應(yīng)用方向。Web服務(wù)、視頻點(diǎn)播服務(wù)、數(shù)據(jù)庫(kù)服務(wù)等目前流行的網(wǎng)絡(luò)應(yīng)用對(duì)數(shù)據(jù)存儲(chǔ)容量、訪問(wèn)能力和管理方式提出越來(lái)越高的要求,這些都是傳統(tǒng)的SCSI硬盤(pán)、RAID存儲(chǔ)系統(tǒng)無(wú)法勝任的。高容量、高性能、可靠和易管理的存儲(chǔ)技術(shù)研究成為當(dāng)前熱點(diǎn)。
存儲(chǔ)區(qū)域網(wǎng)絡(luò)(SAN)是一種新興的網(wǎng)絡(luò)存儲(chǔ)技術(shù),它將存儲(chǔ)子系統(tǒng)與服務(wù)器分離,利用高速網(wǎng)絡(luò)進(jìn)行塊數(shù)據(jù)的傳輸,實(shí)現(xiàn)存儲(chǔ)系統(tǒng)的可擴(kuò)展性和高性能。
SAN使用高速網(wǎng)絡(luò)傳輸代替SCSI總線,通過(guò)私有網(wǎng)絡(luò)傳輸SCSI命令,每個(gè)設(shè)備有各自的數(shù)據(jù)訪問(wèn)路徑,設(shè)備訪問(wèn)的網(wǎng)絡(luò)擁塞處理由高速交換機(jī)完成。目前,光纖網(wǎng)絡(luò)可提供2Gb/s的帶寬,Ifiniband的實(shí)測(cè)網(wǎng)絡(luò)帶寬已達(dá)600Mb/s,而千兆Ethernet網(wǎng)可提供1Gb/s的帶寬,不久將出現(xiàn)10Gb/s的高速傳輸網(wǎng)絡(luò)。高速網(wǎng)絡(luò)技術(shù),尤其是光纖通道技術(shù)的應(yīng)用為數(shù)據(jù)存取提供了更好的可擴(kuò)展性,使網(wǎng)絡(luò)的傳輸帶寬可以成倍地增長(zhǎng),從而確保了SAN系統(tǒng)數(shù)據(jù)訪問(wèn)的高性能。
四、互連網(wǎng)絡(luò)
連接集群系統(tǒng)底層的互連網(wǎng)絡(luò),對(duì)集群系統(tǒng)的整體性能有決定性的作用,因此一直是學(xué)術(shù)界和工業(yè)界所關(guān)注的熱點(diǎn)。目前,千兆以太網(wǎng)卡已經(jīng)成為標(biāo)準(zhǔn)配置集成在服務(wù)器主板上,千兆以太網(wǎng)交換機(jī)的價(jià)格也已經(jīng)非常平民化,因此千兆以太網(wǎng)成為了小規(guī)模、低成本集群的主要網(wǎng)絡(luò)互連方式。
Myrinet、Quadrics、SCI和最近出現(xiàn)的InfiniBand 等商業(yè)化高性能集群通信網(wǎng)絡(luò),以更高的帶寬和更小的傳輸延時(shí),為高性能集群系統(tǒng)提供了多樣化的選擇