2560塊4870X2打造天河一號超級計算機
我國首臺千萬億次超級計算機系統(tǒng)——“天河一號”由國防科學(xué)技術(shù)大學(xué)研制成功。在中國高性能計算機TOP100組織公布的2009年度前100強排名中,天河一號高居榜首。它的誕生也使中國成為繼美國之后世界上第二個能夠研制千萬億次超級計算機的國家。
天河一號的理論峰值計算性能高達1206萬億次雙精度浮點數(shù)操作,LINPACK實測性能為560.3萬億次。該計算機系統(tǒng)的實測性能數(shù)據(jù)已經(jīng)提交國際TOP500進行排名,按照2009年06月的性能數(shù)據(jù),天河一號實測性能排列TOP500第四位,峰值性能列第三位。
天河一號采用6144個Intel通用多核處理器和5120個AMD圖形加速處理器,內(nèi)存總?cè)萘?8TB,點對點通信帶寬40Gbps,而共享磁盤總?cè)萘縿t達到1PB。該超級計算機系統(tǒng)將部署于天津濱海新區(qū)國家超級計算天津中心作為業(yè)務(wù)主機。#p#page_title#e#
根據(jù)2009年中國高性能計算TOP100榜單公布的數(shù)據(jù)來看,排名第一的“天河一號”用了較少的處理器內(nèi)核、更高的能效、達到了遠超第二名的運算能力,當(dāng)然其最大的亮點是首次使用GPU加速計算,而且是AMD的GPU:
天河一號的詳細配置如下:
-
計算陣列:2560個計算結(jié)點,每個計算結(jié)點集成2個Intel CPU,配32GB內(nèi)存。
-
加速陣列:2560個加速結(jié)點,每個加速結(jié)點含2個AMD GPU、 2GB顯存。
-
服務(wù)陣列:512個服務(wù)結(jié)點,每個服務(wù)結(jié)點含2個Intel CPU、32GB內(nèi)存。
總共使用了3072顆Intel Quad Core Xeon E5540 2.53GHz和3072顆Intel Quad Core Xeon E5450 3.0GHz,共計6144顆CPU,24576顆核心。
總共使用了2560塊AMD Radeon HD4870X2顯卡,5120顆運行在575MHz的RV770 GPU,每顆GPU擁有1GB GDDR5內(nèi)存。
通過每個節(jié)點的主板來看,確實是兩顆四核CPU搭配兩塊HD4870X2顯卡的設(shè)計,外觀和普通顯卡沒有區(qū)別,但運行頻率比HD4850還要低,這應(yīng)該是為了保證穩(wěn)定性,從能效比的角度出發(fā)
#p#page_title#e#
知道了詳細的CPU和GPU配置之后,我們再來細算“天河一號”的理論計算能力與實際計算能力:
● 3072個E5540搭配3072個E5450的理論峰值計算能力為:
3072x(40.48+48)=271810.56GFlops≈272TFlops(雙精度)
● 2560塊HD4870X2的理論峰值計算能力為:
920x2x2560/5=942080GFlops≈942TFlops(雙精度)
這樣加起來的話,“天河一號”的理論雙精度浮點運算能力為1214TFLPOS,比官方公布的峰值數(shù)據(jù)稍高一點。
“天河一號”的實測雙精度浮點運算能力為564TFlops,一般CPU的運算效率最高可達80%左右,那么由此可估算出GPU所貢獻的運算量為346TFlops,也就是說GPU在該超級計算機中的性能貢獻已經(jīng)超過了CPU!
通過估算來看,目前的GPU運算效率只有37%左右,官方稱經(jīng)過優(yōu)化之后,GPU的計算效率可從20%提高至70%左右,看來“天河一號”還有很大的潛力可挖!
再來看看去年另外一臺基于Tesla GPU的超級計算機,它是由東京工業(yè)大學(xué)打造的首款基于CPU+GPU異構(gòu)計算架構(gòu)的超級計算機,并率先擠入世界500強。
TSUBAME超級計算機通過加入170臺Tesla S1070 1U系統(tǒng),理論峰值性能為170TFLOP,2008年11月實測的Linpack性能達到了77.48 TFLOP,排名世界第29位,其后經(jīng)過不斷調(diào)試與優(yōu)化,Linpack成績提高至87.01TFlops,2009年6月排名第41位。
日本東京工業(yè)大學(xué)的TSUBAME總體實力和“天河一號”有很大的差距,但兩者的運算效率差不多。由此可見中國國防科技大學(xué)的“天河一號”在異構(gòu)計算方面的研發(fā)已經(jīng)達到了世界頂尖水平,這對于我國超級計算機的發(fā)展來說是個不小的突破,也證明了異構(gòu)計算已經(jīng)成為了發(fā)展趨勢#p#page_title#e#
雖然“天河一號”的核心技術(shù)和配件依然是由國外進口,但能夠憑借自己的技術(shù)組裝如此強大的超級計算機,在世界范圍內(nèi)也是極其罕見的。龐大復(fù)雜系統(tǒng)無論協(xié)同運行還是維護都需要付出很大的代價。也許有人會問:一臺千萬億次的“天河一號”,是否等于10個百萬億次巨型機之和?中國科學(xué)院院士周興銘說,系統(tǒng)的效能絕不是各單元計算效能的簡單疊加。
“如果用高性能微處理器直接堆出一個千萬億次的系統(tǒng),功率會大得驚人,用戶可能連電費都付不起,同時機器的可靠性很低,根本無法穩(wěn)定工作。表面上看‘干活’的器件多了,結(jié)果卻是‘三個和尚沒水吃’。”周興銘說,“天河一號”采用7項關(guān)鍵技術(shù),使得“一加一”的結(jié)果盡量接近“二”,從而發(fā)揮出機器最大的整體效能。
這7項技術(shù)包括:多陣列可配置協(xié)同并行體系結(jié)構(gòu)、高速率擴展互聯(lián)通信技術(shù)、高效異構(gòu)協(xié)同計算技術(shù)、基于隔離的安全控制技術(shù)、虛擬化的網(wǎng)絡(luò)計算支撐技術(shù)、多層次的大規(guī)模系統(tǒng)容錯技術(shù)和系統(tǒng)能耗綜合控制技術(shù)。
周興銘介紹說,由于采用了一系列創(chuàng)新技術(shù),這臺計算機具有四大特點:
——高性能。無論是1206萬億次的峰值性能,還是563.1萬億次的Linpack實測性能,均位于國內(nèi)榜首、世界一流。
——低能耗。能耗是每瓦電創(chuàng)造的計算效能,“天河一號”目前能效為每瓦4.3億次運算,與2009年6月公布的Top500(全球超級計算機前500強)排名第一的美國“走鵑”(Roadrunner)相當(dāng)。參照2009年6月公布的Green500(全球綠色超級計算機前500強)排名,“天河一號”可以位居第5。
——高安全。“天河”實現(xiàn)了不同用戶間數(shù)據(jù)和工作信息的相互隔離。對用戶來說,相當(dāng)于到銀行租個保險柜,鑰匙掌握自己手里。
——易使用。“傻瓜化”的操作界面和菜單、鼠標(biāo)等常規(guī)操作,讓機器的使用變得簡單。同時,作為一臺國際通用的標(biāo)準(zhǔn)化的超級計算機,“天河”上能運行來自各行業(yè)的各種程序,不存在兼容性問題。
公共服務(wù)設(shè)施承載三大功能
按照工程計劃,“天河一號”將于2009年底至2010年在天津市濱海新區(qū)落戶,成為國家超級計算天津中心的業(yè)務(wù)主機,面向國內(nèi)外提供超級計算服務(wù)。 “天河”工程辦公室主任李楠說,“天河一號”在投入使用后將實現(xiàn)三大功能。
第一,作為提供超級計算服務(wù)的全球公共科研設(shè)施,“天河”向國內(nèi)外用戶開放。無論身在何處,用戶都可以通過國際互聯(lián)網(wǎng)使用“天河”進行科學(xué)計算。
第二,作為產(chǎn)業(yè)帶動平臺,“天河”上集中的當(dāng)今時代最先進的信息技術(shù)將逐步轉(zhuǎn)移到其他產(chǎn)業(yè),從而解決國家與社會發(fā)展中的各種問題。
第三,作為吸引人才的平臺,“天河”將進一步匯聚來自世界各地的尖端技術(shù)人才,對國民經(jīng)濟和世界科技的可持續(xù)發(fā)展作出更多貢獻。
天河一號:用數(shù)值模擬方法預(yù)報臺風(fēng),輔助設(shè)計飛機氣動外形
目前中國的巨型計算機用戶主要集中在石油勘探、天氣預(yù)報、基礎(chǔ)研究等領(lǐng)域。上個世紀(jì)末期,西方發(fā)達國家的汽車、建筑、動漫等行業(yè)已經(jīng)開始普及巨型計算機。
“我國對高性能計算機的需求已經(jīng)進入一個高峰期。”李楠說,“天河”將用于石油勘探數(shù)據(jù)處理、生物醫(yī)藥研究、航空航天裝備研制、資源勘探和衛(wèi)星遙感數(shù)據(jù)處理、金融工程數(shù)據(jù)分析、環(huán)渤海生態(tài)動力和污染數(shù)值模擬、基礎(chǔ)科學(xué)理論計算等方面。
與國家超級計算天津中心同時開始建設(shè)的,還有位于深圳的中心。這一南一北兩個國家級的超級計算中心,將成為中國高科技發(fā)展的重要引擎。
超級計算機是否只是科學(xué)研究者的“專利”?李楠介紹說,超級計算機的應(yīng)用與老百姓的生活息息相關(guān),最常見的天氣預(yù)報就是超級計算的結(jié)果。而隨著超級計算機的服務(wù)能力在未來進一步拓展,很可能會誕生一個龐大的巨型機服務(wù)產(chǎn)業(yè),面向個人用戶提供服務(wù)。
“天河的平臺是開放的,我們愿意與全世界共享中國的創(chuàng)新成果。”劉光明說