東工大采用GPU構(gòu)筑超級計算機,單精度性能居世界前列
時間:2008-12-11 19:05:00
來源:UltraLAB圖形工作站方案網(wǎng)站
人氣:6035
作者:admin
東京工業(yè)大學采用美國NVIDIA的最新圖形處理LSI(GPU)構(gòu)筑了高性能計算機(HPC)系統(tǒng),并已開始運行。這一消息是在目前正在舉行的高性能計算機相關(guān)國際會議及展會“Super Computing 2008”上透露的。
該大學曾于2006年構(gòu)筑過名為“TSUBAME Grid Cluster(TSUBAME)”的HPC系統(tǒng),在能夠處理長度超過64bit的數(shù)字的“雙精度”浮點運算中,運算速度達到38.18TFLOPS,在06年6月的HPC排名“TOP500”中位居全球第7位(參閱本站報道)。雖然之后也提高了性能,但很難趕上全球HPC系統(tǒng)迅速實現(xiàn)的高速化,在08年6月公布的TOP500中,運算速度為67.7TFLOPS,排名跌至第24位。
此次的系統(tǒng)在已有的TSUBAME上,追加了170個NVIDIA公司于08年11月18日剛剛宣布上市的由4臺GPU組成的機架用運算單元“Tesla S1070”。“追加工作是在10月中旬花費一周左右的時間完成的。當時認為只要去做就能成功”(東京工業(yè)大學學術(shù)國際信息中心教授松岡聰)。
在長度為32bit的單精度運算中,單個Tesla S1070的運算能力最大可達到4.1TFLOPS。170個合計的峰值性能為4.1TFLOPS×170=697TFLOPS。加上現(xiàn)有的TSUBAME的運算能力,整體峰值性能達到910TFLOPS。單從數(shù)字來看,只差一點就達到1PFLOPS,可以說是全球最高水平的運算能力。“如果按照單精度來排名的話,可進入全球前10名”(東京工業(yè)大學研究人員)。
但是,TOP500評價必須包括雙精度計算。另一方面,NVIDIA公司的GPU從此次才開始正式支持雙精度運算,其運算速度大大低于單精度。此次追加系統(tǒng)部分的雙精度運算能力的峰值性能為59TFLOPS。
結(jié)果,整個系統(tǒng)的雙精度運算的峰值性能僅為170TFLOPS。在求解用于TOP500評價的聯(lián)立線性方程的程序“Linpack”中,有效性能為77.48TFLOPS,在最新排名中位居第29位,未能實現(xiàn)提升。
松岡排名未提升的原因歸結(jié)為以下兩點,(1)因突擊工程調(diào)整不足;(2)Linpack與此次的系統(tǒng)不匹配。松岡表示,“如果仔細調(diào)整,Linpack速度也能達到90TFLOPS左右。但在此次的系統(tǒng)中,Linpack是一個會產(chǎn)生輕微不良后果的應(yīng)用程序。通過下工夫,多數(shù)科學計算都可以單精度運算獲得出色結(jié)果。實際上,可以說此次通過一些提高性能的措施,獲得了位居全球前列的高運算能力”。
另外,NVIDIA公司上市的最新GPU產(chǎn)品方面,用于工作站的產(chǎn)品稱為“Tesla C1060”,工作頻率為1.296GHz。在此次的Tesla S1070中,雖然采用相同的硬件,但工作頻率卻達到了1.44GHz,運算性能也稍高。(記者:野澤 哲生)
該大學曾于2006年構(gòu)筑過名為“TSUBAME Grid Cluster(TSUBAME)”的HPC系統(tǒng),在能夠處理長度超過64bit的數(shù)字的“雙精度”浮點運算中,運算速度達到38.18TFLOPS,在06年6月的HPC排名“TOP500”中位居全球第7位(參閱本站報道)。雖然之后也提高了性能,但很難趕上全球HPC系統(tǒng)迅速實現(xiàn)的高速化,在08年6月公布的TOP500中,運算速度為67.7TFLOPS,排名跌至第24位。
此次的系統(tǒng)在已有的TSUBAME上,追加了170個NVIDIA公司于08年11月18日剛剛宣布上市的由4臺GPU組成的機架用運算單元“Tesla S1070”。“追加工作是在10月中旬花費一周左右的時間完成的。當時認為只要去做就能成功”(東京工業(yè)大學學術(shù)國際信息中心教授松岡聰)。
在長度為32bit的單精度運算中,單個Tesla S1070的運算能力最大可達到4.1TFLOPS。170個合計的峰值性能為4.1TFLOPS×170=697TFLOPS。加上現(xiàn)有的TSUBAME的運算能力,整體峰值性能達到910TFLOPS。單從數(shù)字來看,只差一點就達到1PFLOPS,可以說是全球最高水平的運算能力。“如果按照單精度來排名的話,可進入全球前10名”(東京工業(yè)大學研究人員)。
但是,TOP500評價必須包括雙精度計算。另一方面,NVIDIA公司的GPU從此次才開始正式支持雙精度運算,其運算速度大大低于單精度。此次追加系統(tǒng)部分的雙精度運算能力的峰值性能為59TFLOPS。
結(jié)果,整個系統(tǒng)的雙精度運算的峰值性能僅為170TFLOPS。在求解用于TOP500評價的聯(lián)立線性方程的程序“Linpack”中,有效性能為77.48TFLOPS,在最新排名中位居第29位,未能實現(xiàn)提升。
松岡排名未提升的原因歸結(jié)為以下兩點,(1)因突擊工程調(diào)整不足;(2)Linpack與此次的系統(tǒng)不匹配。松岡表示,“如果仔細調(diào)整,Linpack速度也能達到90TFLOPS左右。但在此次的系統(tǒng)中,Linpack是一個會產(chǎn)生輕微不良后果的應(yīng)用程序。通過下工夫,多數(shù)科學計算都可以單精度運算獲得出色結(jié)果。實際上,可以說此次通過一些提高性能的措施,獲得了位居全球前列的高運算能力”。
另外,NVIDIA公司上市的最新GPU產(chǎn)品方面,用于工作站的產(chǎn)品稱為“Tesla C1060”,工作頻率為1.296GHz。在此次的Tesla S1070中,雖然采用相同的硬件,但工作頻率卻達到了1.44GHz,運算性能也稍高。(記者:野澤 哲生)