Nehalem CPU加NVIDIA GPU打造超級(jí)計(jì)算機(jī)
這款名為Bull NovaScale的超級(jí)計(jì)算機(jī)將使用1068顆Intel Nehalem八核心處理器,外加96顆NVIDIA GPU。其實(shí),公司最初的設(shè)計(jì)僅使用CPU,1068個(gè)節(jié)點(diǎn)的Nehalem處理器共8544個(gè)核心的峰值運(yùn)算能力為192TFlops,但后來他們開始考慮增加GPU進(jìn)行通用運(yùn)算。目前的設(shè)計(jì)加入了48個(gè)節(jié)點(diǎn)的NVIDIA Tesla S900 GPGPU卡,共96個(gè)GT200 GPU能夠?qū)⒄麢C(jī)的運(yùn)算能力提高到300TFlops以上。與此相比較,目前全球最快的超級(jí)計(jì)算機(jī)IBM藍(lán)色基因/L峰值運(yùn)算能力為596TFlops,但其共使用了212992個(gè)處理器核心。
在這樣的CPU+GPU架構(gòu)下,GPU的設(shè)計(jì)運(yùn)算能力輸出達(dá)到103TFlops,每顆GPU達(dá)到1.1TFlops,即每秒運(yùn)算11000億次。這一速率已經(jīng)非常驚人,96顆GPU的運(yùn)算能力已經(jīng)達(dá)到1068顆八核處理器的54%。但目前使用GPU作為超級(jí)計(jì)算機(jī)應(yīng)用還存在一定問題。超級(jí)計(jì)算機(jī)的運(yùn)算應(yīng)用需求極大的內(nèi)存帶寬,GPU目前的設(shè)計(jì)架構(gòu)與傳統(tǒng)計(jì)算系統(tǒng)間存在不兼容的狀況,很多問題都需要科學(xué)家們來解決。
預(yù)計(jì)NovaScale系統(tǒng)將于2009年建成,到時(shí)我們可以看看它的真實(shí)運(yùn)算能力究竟怎么樣。