2560塊4870X2打造天河一號(hào)超級(jí)計(jì)算機(jī)
我國首臺(tái)千萬億次超級(jí)計(jì)算機(jī)系統(tǒng)——“天河一號(hào)”由國防科學(xué)技術(shù)大學(xué)研制成功。在中國高性能計(jì)算機(jī)TOP100組織公布的2009年度前100強(qiáng)排名中,天河一號(hào)高居榜首。它的誕生也使中國成為繼美國之后世界上第二個(gè)能夠研制千萬億次超級(jí)計(jì)算機(jī)的國家。
天河一號(hào)的理論峰值計(jì)算性能高達(dá)1206萬億次雙精度浮點(diǎn)數(shù)操作,LINPACK實(shí)測性能為560.3萬億次。該計(jì)算機(jī)系統(tǒng)的實(shí)測性能數(shù)據(jù)已經(jīng)提交國際TOP500進(jìn)行排名,按照2009年06月的性能數(shù)據(jù),天河一號(hào)實(shí)測性能排列TOP500第四位,峰值性能列第三位。
天河一號(hào)采用6144個(gè)Intel通用多核處理器和5120個(gè)AMD圖形加速處理器,內(nèi)存總?cè)萘?8TB,點(diǎn)對(duì)點(diǎn)通信帶寬40Gbps,而共享磁盤總?cè)萘縿t達(dá)到1PB。該超級(jí)計(jì)算機(jī)系統(tǒng)將部署于天津?yàn)I海新區(qū)國家超級(jí)計(jì)算天津中心作為業(yè)務(wù)主機(jī)。#p#page_title#e#
根據(jù)2009年中國高性能計(jì)算TOP100榜單公布的數(shù)據(jù)來看,排名第一的“天河一號(hào)”用了較少的處理器內(nèi)核、更高的能效、達(dá)到了遠(yuǎn)超第二名的運(yùn)算能力,當(dāng)然其最大的亮點(diǎn)是首次使用GPU加速計(jì)算,而且是AMD的GPU:
天河一號(hào)的詳細(xì)配置如下:
-
計(jì)算陣列:2560個(gè)計(jì)算結(jié)點(diǎn),每個(gè)計(jì)算結(jié)點(diǎn)集成2個(gè)Intel CPU,配32GB內(nèi)存。
-
加速陣列:2560個(gè)加速結(jié)點(diǎn),每個(gè)加速結(jié)點(diǎn)含2個(gè)AMD GPU、 2GB顯存。
-
服務(wù)陣列:512個(gè)服務(wù)結(jié)點(diǎn),每個(gè)服務(wù)結(jié)點(diǎn)含2個(gè)Intel CPU、32GB內(nèi)存。
總共使用了3072顆Intel Quad Core Xeon E5540 2.53GHz和3072顆Intel Quad Core Xeon E5450 3.0GHz,共計(jì)6144顆CPU,24576顆核心。
總共使用了2560塊AMD Radeon HD4870X2顯卡,5120顆運(yùn)行在575MHz的RV770 GPU,每顆GPU擁有1GB GDDR5內(nèi)存。
通過每個(gè)節(jié)點(diǎn)的主板來看,確實(shí)是兩顆四核CPU搭配兩塊HD4870X2顯卡的設(shè)計(jì),外觀和普通顯卡沒有區(qū)別,但運(yùn)行頻率比HD4850還要低,這應(yīng)該是為了保證穩(wěn)定性,從能效比的角度出發(fā)
#p#page_title#e#
知道了詳細(xì)的CPU和GPU配置之后,我們再來細(xì)算“天河一號(hào)”的理論計(jì)算能力與實(shí)際計(jì)算能力:
● 3072個(gè)E5540搭配3072個(gè)E5450的理論峰值計(jì)算能力為:
3072x(40.48+48)=271810.56GFlops≈272TFlops(雙精度)
● 2560塊HD4870X2的理論峰值計(jì)算能力為:
920x2x2560/5=942080GFlops≈942TFlops(雙精度)
這樣加起來的話,“天河一號(hào)”的理論雙精度浮點(diǎn)運(yùn)算能力為1214TFLPOS,比官方公布的峰值數(shù)據(jù)稍高一點(diǎn)。
“天河一號(hào)”的實(shí)測雙精度浮點(diǎn)運(yùn)算能力為564TFlops,一般CPU的運(yùn)算效率最高可達(dá)80%左右,那么由此可估算出GPU所貢獻(xiàn)的運(yùn)算量為346TFlops,也就是說GPU在該超級(jí)計(jì)算機(jī)中的性能貢獻(xiàn)已經(jīng)超過了CPU!
通過估算來看,目前的GPU運(yùn)算效率只有37%左右,官方稱經(jīng)過優(yōu)化之后,GPU的計(jì)算效率可從20%提高至70%左右,看來“天河一號(hào)”還有很大的潛力可挖!
再來看看去年另外一臺(tái)基于Tesla GPU的超級(jí)計(jì)算機(jī),它是由東京工業(yè)大學(xué)打造的首款基于CPU+GPU異構(gòu)計(jì)算架構(gòu)的超級(jí)計(jì)算機(jī),并率先擠入世界500強(qiáng)。
TSUBAME超級(jí)計(jì)算機(jī)通過加入170臺(tái)Tesla S1070 1U系統(tǒng),理論峰值性能為170TFLOP,2008年11月實(shí)測的Linpack性能達(dá)到了77.48 TFLOP,排名世界第29位,其后經(jīng)過不斷調(diào)試與優(yōu)化,Linpack成績提高至87.01TFlops,2009年6月排名第41位。
日本東京工業(yè)大學(xué)的TSUBAME總體實(shí)力和“天河一號(hào)”有很大的差距,但兩者的運(yùn)算效率差不多。由此可見中國國防科技大學(xué)的“天河一號(hào)”在異構(gòu)計(jì)算方面的研發(fā)已經(jīng)達(dá)到了世界頂尖水平,這對(duì)于我國超級(jí)計(jì)算機(jī)的發(fā)展來說是個(gè)不小的突破,也證明了異構(gòu)計(jì)算已經(jīng)成為了發(fā)展趨勢#p#page_title#e#
雖然“天河一號(hào)”的核心技術(shù)和配件依然是由國外進(jìn)口,但能夠憑借自己的技術(shù)組裝如此強(qiáng)大的超級(jí)計(jì)算機(jī),在世界范圍內(nèi)也是極其罕見的。龐大復(fù)雜系統(tǒng)無論協(xié)同運(yùn)行還是維護(hù)都需要付出很大的代價(jià)。也許有人會(huì)問:一臺(tái)千萬億次的“天河一號(hào)”,是否等于10個(gè)百萬億次巨型機(jī)之和?中國科學(xué)院院士周興銘說,系統(tǒng)的效能絕不是各單元計(jì)算效能的簡單疊加。
“如果用高性能微處理器直接堆出一個(gè)千萬億次的系統(tǒng),功率會(huì)大得驚人,用戶可能連電費(fèi)都付不起,同時(shí)機(jī)器的可靠性很低,根本無法穩(wěn)定工作。表面上看‘干活’的器件多了,結(jié)果卻是‘三個(gè)和尚沒水吃’。”周興銘說,“天河一號(hào)”采用7項(xiàng)關(guān)鍵技術(shù),使得“一加一”的結(jié)果盡量接近“二”,從而發(fā)揮出機(jī)器最大的整體效能。
這7項(xiàng)技術(shù)包括:多陣列可配置協(xié)同并行體系結(jié)構(gòu)、高速率擴(kuò)展互聯(lián)通信技術(shù)、高效異構(gòu)協(xié)同計(jì)算技術(shù)、基于隔離的安全控制技術(shù)、虛擬化的網(wǎng)絡(luò)計(jì)算支撐技術(shù)、多層次的大規(guī)模系統(tǒng)容錯(cuò)技術(shù)和系統(tǒng)能耗綜合控制技術(shù)。
周興銘介紹說,由于采用了一系列創(chuàng)新技術(shù),這臺(tái)計(jì)算機(jī)具有四大特點(diǎn):
——高性能。無論是1206萬億次的峰值性能,還是563.1萬億次的Linpack實(shí)測性能,均位于國內(nèi)榜首、世界一流。
——低能耗。能耗是每瓦電創(chuàng)造的計(jì)算效能,“天河一號(hào)”目前能效為每瓦4.3億次運(yùn)算,與2009年6月公布的Top500(全球超級(jí)計(jì)算機(jī)前500強(qiáng))排名第一的美國“走鵑”(Roadrunner)相當(dāng)。參照2009年6月公布的Green500(全球綠色超級(jí)計(jì)算機(jī)前500強(qiáng))排名,“天河一號(hào)”可以位居第5。
——高安全。“天河”實(shí)現(xiàn)了不同用戶間數(shù)據(jù)和工作信息的相互隔離。對(duì)用戶來說,相當(dāng)于到銀行租個(gè)保險(xiǎn)柜,鑰匙掌握自己手里。
——易使用。“傻瓜化”的操作界面和菜單、鼠標(biāo)等常規(guī)操作,讓機(jī)器的使用變得簡單。同時(shí),作為一臺(tái)國際通用的標(biāo)準(zhǔn)化的超級(jí)計(jì)算機(jī),“天河”上能運(yùn)行來自各行業(yè)的各種程序,不存在兼容性問題。
公共服務(wù)設(shè)施承載三大功能
按照工程計(jì)劃,“天河一號(hào)”將于2009年底至2010年在天津市濱海新區(qū)落戶,成為國家超級(jí)計(jì)算天津中心的業(yè)務(wù)主機(jī),面向國內(nèi)外提供超級(jí)計(jì)算服務(wù)。 “天河”工程辦公室主任李楠說,“天河一號(hào)”在投入使用后將實(shí)現(xiàn)三大功能。
第一,作為提供超級(jí)計(jì)算服務(wù)的全球公共科研設(shè)施,“天河”向國內(nèi)外用戶開放。無論身在何處,用戶都可以通過國際互聯(lián)網(wǎng)使用“天河”進(jìn)行科學(xué)計(jì)算。
第二,作為產(chǎn)業(yè)帶動(dòng)平臺(tái),“天河”上集中的當(dāng)今時(shí)代最先進(jìn)的信息技術(shù)將逐步轉(zhuǎn)移到其他產(chǎn)業(yè),從而解決國家與社會(huì)發(fā)展中的各種問題。
第三,作為吸引人才的平臺(tái),“天河”將進(jìn)一步匯聚來自世界各地的尖端技術(shù)人才,對(duì)國民經(jīng)濟(jì)和世界科技的可持續(xù)發(fā)展作出更多貢獻(xiàn)。
天河一號(hào):用數(shù)值模擬方法預(yù)報(bào)臺(tái)風(fēng),輔助設(shè)計(jì)飛機(jī)氣動(dòng)外形
目前中國的巨型計(jì)算機(jī)用戶主要集中在石油勘探、天氣預(yù)報(bào)、基礎(chǔ)研究等領(lǐng)域。上個(gè)世紀(jì)末期,西方發(fā)達(dá)國家的汽車、建筑、動(dòng)漫等行業(yè)已經(jīng)開始普及巨型計(jì)算機(jī)。
“我國對(duì)高性能計(jì)算機(jī)的需求已經(jīng)進(jìn)入一個(gè)高峰期。”李楠說,“天河”將用于石油勘探數(shù)據(jù)處理、生物醫(yī)藥研究、航空航天裝備研制、資源勘探和衛(wèi)星遙感數(shù)據(jù)處理、金融工程數(shù)據(jù)分析、環(huán)渤海生態(tài)動(dòng)力和污染數(shù)值模擬、基礎(chǔ)科學(xué)理論計(jì)算等方面。
與國家超級(jí)計(jì)算天津中心同時(shí)開始建設(shè)的,還有位于深圳的中心。這一南一北兩個(gè)國家級(jí)的超級(jí)計(jì)算中心,將成為中國高科技發(fā)展的重要引擎。
超級(jí)計(jì)算機(jī)是否只是科學(xué)研究者的“專利”?李楠介紹說,超級(jí)計(jì)算機(jī)的應(yīng)用與老百姓的生活息息相關(guān),最常見的天氣預(yù)報(bào)就是超級(jí)計(jì)算的結(jié)果。而隨著超級(jí)計(jì)算機(jī)的服務(wù)能力在未來進(jìn)一步拓展,很可能會(huì)誕生一個(gè)龐大的巨型機(jī)服務(wù)產(chǎn)業(yè),面向個(gè)人用戶提供服務(wù)。
“天河的平臺(tái)是開放的,我們愿意與全世界共享中國的創(chuàng)新成果。”劉光明說