Nehalem在STREAM性能測試中擊敗Istanbul
幾周之前,高性能計算集群制造商Advanced Clustering Technologies的設(shè)計團(tuán)隊公布了基于Intel Nehalem和基于AMD Istanbul系統(tǒng)在High Performance Linpack (HPL)測試下的對比結(jié)果。當(dāng)時的結(jié)果顯示Istanbul在Linpack測試中超出了Nehalem。
現(xiàn)在,Advanced Clustering Technologies的工程師再次使用STREAM基準(zhǔn)測試對這兩款微處理器進(jìn)行測試,并在他們的網(wǎng)站上公布了結(jié)果。STREAM是HPC Challenge套件的一部分,主要是測試內(nèi)存帶寬——高性能計算系統(tǒng)的一個重要屬性。
自從內(nèi)核數(shù)不斷增加以來,內(nèi)存帶寬對很多應(yīng)用就變得越來越重要,計算能力已經(jīng)超出了內(nèi)存性能。與HPL一樣,STREAM也是一項綜合的性能測試,但是總得來說,如果一個應(yīng)用是內(nèi)存受限的,那么STREAM性能測試將是一個很好的相關(guān)性能指示。
一方面是一臺配置了兩個四核2.66GHz Xeon X5550的Pinnacle幾家服務(wù)器,每個的熱套封是95瓦,還配置了12GB的1.33GHz DDR3主內(nèi)存。
另一方面是一臺配置了兩個六核2.6GHz Opteron 2435和16 GB 800MHz DDR2主內(nèi)存,每個熱套封是75瓦。
Corder采用相同的電源、硬盤和操作系統(tǒng)。他表示,兩臺設(shè)備上的內(nèi)存容量之所以不相同是因?yàn)槊總€芯片架構(gòu)支持的內(nèi)存速度不同,而且內(nèi)存通道數(shù)的也不同。
Nehalem和Istanbul的STREAM結(jié)果是在意料之中的。如果你時常關(guān)注x86市場的競爭形勢,你可能已經(jīng)猜到依賴于更高級的內(nèi)存子系統(tǒng)的Intel Nehalem(至強(qiáng)5500)處理器會超出依賴于DDR2技術(shù)的AMD Istanbul Opteron。
測試結(jié)果是:基于至強(qiáng)5500的設(shè)備最高理論性能是85.12 gigaflops,在ACT的Linpack測試中實(shí)際表現(xiàn)為74.03 gigaflops。這說明,設(shè)備在實(shí)際工作負(fù)載下的性能是理論性能的86.97%。Istanbul設(shè)備的理論峰值是124.8 gigaflops,在ACT的Linpack測試中實(shí)際表現(xiàn)為99.38 gigaflops,有效率僅為79.63%。
Advanced Clustering Technologies工程師Shane Corder這樣表示:
“甚至內(nèi)存速度最慢的至強(qiáng)5500處理器也比速度最快的Opteron高出了20%,用Opteron與最快的至強(qiáng)相比,至強(qiáng)的性能高出75%多。至強(qiáng)5500獲得如此之高的內(nèi)存帶寬主要是因?yàn)椴捎昧巳ǖ蓝皇请p通道內(nèi)存、提高時鐘頻率的DDR3以及Quick Path互連技術(shù)提供的高速點(diǎn)對點(diǎn)CPU連接。”
另外一個需要注意的數(shù)據(jù)就是在六核Istanbul上的STREAM表現(xiàn)要比在四核Shanghai上略低一些,Advanced Clustering Technologies工程師認(rèn)為Istanbul額外增加的兩個內(nèi)核必須爭取與Shanghai芯片中兩個內(nèi)存控制器相同的帶寬。與Linpack結(jié)果一樣,這些結(jié)果也從一個側(cè)面反映了芯片的性價比。
“當(dāng)你將每臺設(shè)備的成本考慮其中的話,結(jié)果仍然顯示至強(qiáng)5500具有明顯優(yōu)勢。至強(qiáng)服務(wù)器的成本大約在3800美元左右,而皓龍服務(wù)器的成本在3500美元左右。至強(qiáng)服務(wù)器每小時每1美元的傳輸量為9.8MB,而皓龍服務(wù)器每小時每1美元的傳輸量為5.9美元,至強(qiáng)5500系列高出了66%。”
和以前一樣,需要提醒的是綜合性能測試結(jié)果可能與實(shí)際應(yīng)用情況并不相符。Advanced Clustering Technologies的建議是,你使用你自己的編碼來查看處理器和系統(tǒng)架構(gòu)是否會給你提供最多的回報。