異構(gòu)計(jì)算兩大引擎再次加速
異構(gòu)計(jì)算今年得到了快速發(fā)展。一方面,以殺入Top 500前5的中國高性能計(jì)算機(jī)天河一號(hào)為代表,采用異構(gòu)計(jì)算建設(shè)的高性能計(jì)算集群開始快速出現(xiàn);另一方面,以微軟的DirectCompute等技術(shù)為代表的公開標(biāo)準(zhǔn)程序接口也助推了應(yīng)用的快速開發(fā)。
今年下半年,《中國計(jì)算機(jī)報(bào)》進(jìn)行了三次關(guān)于異構(gòu)計(jì)算的報(bào)道,也得到了讀者的反饋和好評(píng)。
《中國計(jì)算機(jī)報(bào)》將在未來一段時(shí)間內(nèi),以專欄的形式,對(duì)異構(gòu)計(jì)算的進(jìn)一步發(fā)展進(jìn)行追蹤報(bào)道,以饗讀者。
10月23日,微軟發(fā)布了Windows 7。同日,DirectX 11也正式亮相。DirectX 11中,DirectCompute 11是最引人注目的新特性之一。
隨后不久,11月召開的微軟TechED上,AMD不僅展示了明年一季度將要發(fā)布的12核服務(wù)器處理器工程樣機(jī),也攜旗下支持DirectX 11的最新顯示核心ATI Radeon HD 5870亮相。至此,從硬件到軟件,異構(gòu)計(jì)算的兩大引擎再次加速。
TechED上,AMD中國區(qū)技術(shù)經(jīng)理劉文卓在分論壇中做了名為《CPU與GPU的融合》為題的演講,揭示了異構(gòu)計(jì)算的未來發(fā)展。
我們之前已經(jīng)談過,CPU和GPU截然不同的設(shè)計(jì)架構(gòu)使得兩者各自的稟賦也不相同。CPU適合復(fù)雜指令調(diào)度、循環(huán)、分支、邏輯判斷以及執(zhí)行等程序任務(wù),而GPU適合可以拆分成簡單指令的重復(fù)的高度并行數(shù)值計(jì)算。“GPU不是什么都能算,它擅長的是像素處理、壓縮解壓縮等每部分運(yùn)算之間沒有過多邏輯聯(lián)系的領(lǐng)域。目前,GPU的發(fā)展速度已經(jīng)遠(yuǎn)遠(yuǎn)超過了CPU。”劉文卓介紹,在ATI Radeon HD 5870中,流處理器個(gè)數(shù)已經(jīng)達(dá)到了1600個(gè),其單精度浮點(diǎn)運(yùn)算能力達(dá)到了2.72TFlops。與之相比,目前最強(qiáng)的CPU的單精度浮點(diǎn)運(yùn)算能力也僅僅達(dá)到了60GFlops,差距非常明顯。另外,GPU的能效更高,平均每瓦運(yùn)算性能達(dá)到了14.47GFlops,也較CPU高出很多。
然而,GPU之前的應(yīng)用領(lǐng)域一直局限在顯示領(lǐng)域。“如何將GPU的運(yùn)算能力運(yùn)用到更多通用計(jì)算領(lǐng)域?這是AMD一直在思考的問題。”劉文卓說,早就看到GPU運(yùn)算的前景,是AMD并購ATI的重要原因之一。“在石油勘探等領(lǐng)域,用GPU進(jìn)行計(jì)算,性能提升可以達(dá)到幾百倍。”
OpenCL、DirectCompute等編程環(huán)境的出現(xiàn)助推了異構(gòu)計(jì)算的發(fā)展。在這些環(huán)境中編寫程序,可以應(yīng)用到更多環(huán)境中。它們的出現(xiàn)使得異構(gòu)計(jì)算程序編寫的復(fù)雜性大大降低了。
目前,采用GPU進(jìn)行高性能計(jì)算已經(jīng)成為科研機(jī)構(gòu)的共識(shí)。天河一號(hào)就是異構(gòu)計(jì)算在高性能領(lǐng)域應(yīng)用的代表。有消息稱,美國橡樹嶺國家實(shí)驗(yàn)室已經(jīng)大批采購了NVIDIA的GPU,以應(yīng)用在高性能計(jì)算機(jī)中。同時(shí),曙光6000也將采用MIPS架構(gòu)的龍芯與X86架構(gòu)的異構(gòu)組合??梢灶A(yù)見,明年的Top500中,異構(gòu)計(jì)算必將成為舞臺(tái)上的主角