異構(gòu)計算兩大引擎再次加速
異構(gòu)計算今年得到了快速發(fā)展。一方面,以殺入Top 500前5的中國高性能計算機天河一號為代表,采用異構(gòu)計算建設(shè)的高性能計算集群開始快速出現(xiàn);另一方面,以微軟的DirectCompute等技術(shù)為代表的公開標準程序接口也助推了應用的快速開發(fā)。
今年下半年,《中國計算機報》進行了三次關(guān)于異構(gòu)計算的報道,也得到了讀者的反饋和好評。
《中國計算機報》將在未來一段時間內(nèi),以專欄的形式,對異構(gòu)計算的進一步發(fā)展進行追蹤報道,以饗讀者。
10月23日,微軟發(fā)布了Windows 7。同日,DirectX 11也正式亮相。DirectX 11中,DirectCompute 11是最引人注目的新特性之一。
隨后不久,11月召開的微軟TechED上,AMD不僅展示了明年一季度將要發(fā)布的12核服務器處理器工程樣機,也攜旗下支持DirectX 11的最新顯示核心ATI Radeon HD 5870亮相。至此,從硬件到軟件,異構(gòu)計算的兩大引擎再次加速。
TechED上,AMD中國區(qū)技術(shù)經(jīng)理劉文卓在分論壇中做了名為《CPU與GPU的融合》為題的演講,揭示了異構(gòu)計算的未來發(fā)展。
我們之前已經(jīng)談過,CPU和GPU截然不同的設(shè)計架構(gòu)使得兩者各自的稟賦也不相同。CPU適合復雜指令調(diào)度、循環(huán)、分支、邏輯判斷以及執(zhí)行等程序任務,而GPU適合可以拆分成簡單指令的重復的高度并行數(shù)值計算。“GPU不是什么都能算,它擅長的是像素處理、壓縮解壓縮等每部分運算之間沒有過多邏輯聯(lián)系的領(lǐng)域。目前,GPU的發(fā)展速度已經(jīng)遠遠超過了CPU。”劉文卓介紹,在ATI Radeon HD 5870中,流處理器個數(shù)已經(jīng)達到了1600個,其單精度浮點運算能力達到了2.72TFlops。與之相比,目前最強的CPU的單精度浮點運算能力也僅僅達到了60GFlops,差距非常明顯。另外,GPU的能效更高,平均每瓦運算性能達到了14.47GFlops,也較CPU高出很多。
然而,GPU之前的應用領(lǐng)域一直局限在顯示領(lǐng)域。“如何將GPU的運算能力運用到更多通用計算領(lǐng)域?這是AMD一直在思考的問題。”劉文卓說,早就看到GPU運算的前景,是AMD并購ATI的重要原因之一。“在石油勘探等領(lǐng)域,用GPU進行計算,性能提升可以達到幾百倍。”
OpenCL、DirectCompute等編程環(huán)境的出現(xiàn)助推了異構(gòu)計算的發(fā)展。在這些環(huán)境中編寫程序,可以應用到更多環(huán)境中。它們的出現(xiàn)使得異構(gòu)計算程序編寫的復雜性大大降低了。
目前,采用GPU進行高性能計算已經(jīng)成為科研機構(gòu)的共識。天河一號就是異構(gòu)計算在高性能領(lǐng)域應用的代表。有消息稱,美國橡樹嶺國家實驗室已經(jīng)大批采購了NVIDIA的GPU,以應用在高性能計算機中。同時,曙光6000也將采用MIPS架構(gòu)的龍芯與X86架構(gòu)的異構(gòu)組合??梢灶A見,明年的Top500中,異構(gòu)計算必將成為舞臺上的主角