Appro借助Nehalem和GPU打造超級(jí)計(jì)算機(jī)HyperPower
Tesla圖形處理器和他們相關(guān)的CUDA工具去年秋天實(shí)現(xiàn)商業(yè)化,并成為Penguin Computing和幾家銷售私人超級(jí)計(jì)算機(jī)的廠商的選擇。搭載Tesla圖形處理器的塔式X64服務(wù)器在浮點(diǎn)計(jì)算能力上表現(xiàn)出色。
Appro公司高級(jí)技術(shù)解決方案副總裁約翰.李表示,Appro公司一直保持謹(jǐn)慎,等待Tesla技術(shù)的日臻成熟。對(duì)于最新的Tesla卡,nVidia公司針對(duì)大規(guī)模工作負(fù)載將提供雙精度數(shù)學(xué)計(jì)算能力。盡管目前這些卡比起他們?cè)趩尉扔?jì)算上的表現(xiàn)來(lái)說(shuō),在雙精度性能上還有一定差距--即Tesla單元的內(nèi)存上缺乏糾錯(cuò)能力。但李表示用戶希望能開(kāi)始使用目前的CUDA環(huán)境來(lái)配置混合X64-GPU系統(tǒng),因此他們?cè)谛乱淮鷑Vidia GPU協(xié)處理器上已經(jīng)準(zhǔn)備就緒。
這些新一代Tesla協(xié)處理器的精確設(shè)計(jì)規(guī)格目前尚不清楚,不過(guò)李表示它將比目前的Tesla PCI-Express卡更加先進(jìn),雙精度性能表現(xiàn)也更加出色。這些全新的Tesla圖形處理器預(yù)計(jì)會(huì)在2010年上半年推出。
Appro HyperPower集群采用內(nèi)置兩個(gè)服務(wù)器的1U機(jī)箱。這兩個(gè)雙路半高服務(wù)器能支持英特爾公司目前最新推出的"Nehalem EP"至強(qiáng)5500處理器。每個(gè)Nehalem服務(wù)器與一個(gè)配置了Tesla S1070圖形處理器的服務(wù)器應(yīng)用工具相連接。Tesla S1070可以容納4個(gè)圖形處理器,每個(gè)處理器集成了240個(gè)核心,主頻在1.3GHZ和1.44GHz之間,單個(gè)服務(wù)器機(jī)箱的內(nèi)存為16GB。
這個(gè)應(yīng)用工具通過(guò)兩個(gè)PCI-Express 2.0 x16插槽(每個(gè)雙路半高服務(wù)器有有1個(gè)插槽)和服務(wù)器連接在一起。根據(jù)時(shí)鐘頻率的不同,
占據(jù)整個(gè)1U機(jī)箱的Tesla S1070圖形處理器單精度浮點(diǎn)計(jì)算能力從3.73萬(wàn)億次到4.14萬(wàn)億次,但是雙精度浮點(diǎn)計(jì)算能力僅在3110億到340億此之間。
Appro HyperPower在標(biāo)準(zhǔn)的42U機(jī)架內(nèi)容納了19對(duì)Nehalem EP服務(wù)器和交叉連接了19個(gè)Tesla應(yīng)用工具,核心總數(shù)達(dá)到304x64個(gè),圖形處理器核心達(dá)到18240個(gè)。機(jī)架峰值性能的單精度浮點(diǎn)計(jì)算能力超過(guò)70萬(wàn)億次,雙精度浮點(diǎn)計(jì)算能力為6.56萬(wàn)億次。這是一個(gè)令人驚嘆的位數(shù),但卻并不令人意外:當(dāng)這些應(yīng)用工具滿載運(yùn)行時(shí),Tesla應(yīng)用工具的功耗為800瓦特。
李表示Appro公司正在考慮使用現(xiàn)場(chǎng)可編程門(mén)陣列和其他協(xié)處理器技術(shù),但是在每種情況下技術(shù)會(huì)帶來(lái)顯著的性能提升,編程模式必須做出改進(jìn),而且盡管這些技術(shù)能帶來(lái)很好的效果,但執(zhí)行起來(lái)的費(fèi)用也非常昂貴。這對(duì)于采用現(xiàn)場(chǎng)可編程門(mén)陣列和其他定制超級(jí)計(jì)算機(jī)是個(gè)巨大的障礙。但是隨著CUDA C++和Fortran編程環(huán)境的成熟以及雙精度計(jì)算在Teslas上的使用,用戶希望能從中受益。即使Appro HyperPower根據(jù)配置的不同,可能的售價(jià)在25萬(wàn)美元到50萬(wàn)美元之間。
由此可得出在執(zhí)行單精度工作負(fù)載時(shí),每千兆的費(fèi)用在3.18美元到6.36美元之間。這與Penguin Computing使用同樣的Tesla S1070應(yīng)用工具服務(wù)器對(duì)16萬(wàn)億浮點(diǎn)計(jì)算能力和32萬(wàn)億浮點(diǎn)計(jì)算能力的收費(fèi)在一個(gè)市場(chǎng)區(qū)域內(nèi)。在雙精度計(jì)算上,HyperPower機(jī)型每千兆的費(fèi)用大概在38美元到76美元之間,而Penguin Computing每千兆的相關(guān)費(fèi)用會(huì)有所上升。
Appro可以在HyperPower集群上支持紅帽的Enterprise Linux 5 Update 2 and Update 3,將來(lái)面向歐洲用戶還能支持NOVELL的SUSE Linux Enterprise Server 10和11。李表示出于銷售的目的,他們可能還會(huì)支持微軟的Windows HPC Server操作系統(tǒng),不過(guò)他承認(rèn)在
Appro銷售超級(jí)計(jì)算機(jī)的市場(chǎng)上,用戶并沒(méi)有要求使用Windows系統(tǒng)(Tesla GPUs和CUDA編程環(huán)境可以在Windows服務(wù)器上運(yùn)行,但是Appro只是根據(jù)用戶的需求提供的備選)。
盡管Appro目前與日本服務(wù)器制造商N(yùn)EC公司之間存在分銷協(xié)議,NEC將負(fù)責(zé)亞洲市場(chǎng)的銷售。但HyperPowers并不在此項(xiàng)協(xié)議之列