AMD“推土機(jī)”和Intel Xeon 5600以及 Xeon E7性能評(píng)測(cè)對(duì)比
AMD新一代處理器架構(gòu)Bulldozer(推土機(jī))在兩年前就已經(jīng)引起業(yè)界的廣泛注意,由于其新穎的“物理雙線程”設(shè)計(jì)讓很多人對(duì)于AMD首次涉足多線程領(lǐng)域的表現(xiàn)非常期待。2009年11月11日,AMD正式明確了Bulldozer的架構(gòu),而隨著日后Bulldozer的細(xì)節(jié)公布,本站也做了相應(yīng)的報(bào)道,其雙核模塊的設(shè)計(jì)確實(shí)讓人眼前一亮,好奇心也因此更上一層樓。近日,桌面版的Bulldozer處理器率先亮相,8核心的FX8100與4核心的FX4100的評(píng)測(cè)已經(jīng)鋪天蓋地,而11月14日,面向企業(yè)級(jí)應(yīng)用市場(chǎng)的皓龍(Opteron)版Bulldozer終于正式亮相,分別是最高16核心/8模塊的Opteron 6200系列與最高8核心/4模塊的Opteron 4200系列。由此也正式向世人宣布了AMD的最新服務(wù)器平臺(tái)。在AMD的聲明中強(qiáng)調(diào),新一代基于Bulldozer的皓龍?zhí)幚砥鲗樵茣r(shí)代提供強(qiáng)大的動(dòng)力,同時(shí)也為企業(yè)帶來(lái)高效、節(jié)能的基礎(chǔ)運(yùn)算平臺(tái)。那么從理論到實(shí)踐,從期盼到現(xiàn)實(shí),Bulldozer能為將來(lái)的云“推”出多大 的天空任其馳騁呢?我們今天就來(lái)做一分析,而重點(diǎn)就是Opteron 6200系列。
Opteron 6200處理器新特性簡(jiǎn)介
有關(guān)Bulldozer處理器架構(gòu)的介紹,已經(jīng)有很多了,但為了文章的完整性,我們今天也在此做一簡(jiǎn)單的回顧與介紹(參見(jiàn)上面提到的本站專文),首先要明確的是,從Bulldozer開(kāi)始,傳統(tǒng)意義上的“CPU核心”的概念已經(jīng)有了變化。
Bulldozer的“模塊”架構(gòu)圖,可以看作是兩個(gè)整數(shù)處理核心共享一個(gè)浮點(diǎn)處理單元的設(shè)計(jì) ,因?yàn)槿粘5奶幚磉\(yùn)算中,更多的是整數(shù)處理,所以這就變向的等于在一個(gè)模塊可以同時(shí)處理兩個(gè)整數(shù)處理線程,而無(wú)需共享處理管線
AMD當(dāng)初開(kāi)發(fā)Bulldozer架構(gòu)的初衷在于,經(jīng)調(diào)查發(fā)現(xiàn)日常的IT應(yīng)用主要集中于整數(shù)運(yùn)算,而浮點(diǎn)運(yùn)算相對(duì)較少。為了提高多線程處理的性能,AMD設(shè)想可不可以用2+1的方式來(lái)解決,即兩個(gè)整數(shù)處理核心+1個(gè)浮點(diǎn)處理單元,以組成一個(gè)新架構(gòu)的處理單元——Module(模塊)。 眾所周知,在多線程處理方面,英特爾最早提出了Hyper-Threading(超線程)的理念,可以使操作系統(tǒng)或者應(yīng)用軟件的多個(gè)線程,同時(shí)運(yùn)行于一個(gè)超線程處理器上,其內(nèi)部的兩個(gè)邏輯處理器共享一組處理器執(zhí)行單元。而AMD CPU的兩個(gè)線程使用各自的單元,但兩個(gè)線程是共享命令解碼器和浮點(diǎn)運(yùn)算等資源的。因?yàn)槭钦麛?shù)運(yùn)算,所有線程之間沒(méi)有沖突,因此吞吐量有所提高。
從芯片級(jí)別看Bulldozer模塊,每個(gè)模塊擁有自己的L2緩存,L3緩存則為晶片級(jí)共享
Opteron 6200與4200的晶片設(shè)計(jì)圖,4200由單晶片(功能單元略有不同)構(gòu)成,最多4個(gè)模塊(8核心),6200由兩塊該晶片組成,最多8個(gè)模塊(16個(gè)核心)
由于這種2+1的核心設(shè)計(jì),在Bulldozer的架構(gòu)中,其核心(Core)的概念已經(jīng)與傳統(tǒng)認(rèn)識(shí)有了較大的不同,單一的核心并不是一個(gè)具備完整功能的處理單位,所以AMD一直在用Bulldozer Module來(lái)表示Bulldozer處理器的處理單元,所以在后文的介紹中,對(duì)于Opteron 6200我們也將用模塊和核心兩個(gè)概念表述——在這里,核心是指組成模塊中的整數(shù)處理單元,它們共享一個(gè)彈性浮點(diǎn)處理單元(Flex FP)。
Opteron 6200的內(nèi)部架構(gòu)圖,相當(dāng)于用兩塊4200組成,兩個(gè)芯片之間由HyperTransport總線互聯(lián)
在Bulldozer架構(gòu)中,非常值得一提的是由兩個(gè)整數(shù)處理核心共享的Flex FP處理單元與新增加的獨(dú)家指令集。這一Flex FP由兩個(gè)128bit FMAC(Fused Multiply–Add Capability,混合乘加)處理單元組成,之所以稱為彈性(Flex),是因?yàn)檫@兩個(gè)單元可以各自獨(dú)立,為每個(gè)整數(shù)核心提供獨(dú)享的128bit浮點(diǎn)處理單元(此時(shí)可以認(rèn)為是兩個(gè)具備有整數(shù)運(yùn)算+128bit浮點(diǎn)運(yùn)算單元的處理核心,組成了Bulldozer Module),也可以組合成一個(gè)256bit的浮點(diǎn)處理單元為一個(gè)模塊提供服務(wù),這其實(shí)給編程人員提供了很好的彈性,但也預(yù)示著對(duì)現(xiàn)有的應(yīng)用需要進(jìn)一步的優(yōu)化。 #p#page_title#e#
Opteron 6200與6100、英特爾的SandyBridge之間的浮點(diǎn)處理模式的對(duì)比
簡(jiǎn)單來(lái)說(shuō),這種兩個(gè)128bit單元彈性組合的方式,提供了有多種指令處理的模式,比如對(duì)于同時(shí)執(zhí)行兩個(gè)128bit的AVX指令,SandyBridge單一的256bit FP單元就不行了,而Flex FP則可以,同樣的,這也適用于SSE指令。所以,AMD強(qiáng)調(diào),除非是256bit的AVX指令環(huán)境,否則6200的單周期浮點(diǎn)處理能力是SandyBridge的兩倍,顯然靈活的可分拆也可組合的Flex FP功不可沒(méi)。
Opteron 6200除了具備與英特爾SandyBridge相同的指令集外,還獨(dú)家提供了兩套指令集
目前主流的編譯器大多已經(jīng)支持AMD的FMA4和XOP指令集
而為了發(fā)揮Flex FP的強(qiáng)大的威力,AMD也專門開(kāi)發(fā)了兩套針對(duì)浮點(diǎn)運(yùn)算的指令集FMA4與XOP,兩者可以說(shuō)都是為高性能計(jì)算所服務(wù),但側(cè)重點(diǎn)不太相同,F(xiàn)MA4更有針對(duì)性,比如向量和矩陣計(jì)算、多項(xiàng)式評(píng)估、數(shù)據(jù)信號(hào)處理等,而XOP則針對(duì)數(shù)學(xué)、多媒體應(yīng)用等。目前,主流的編譯器大多已經(jīng)全部或部分支持AMD的新指令集,因此在發(fā)揮Bulldozer的浮點(diǎn)威力方面,還是很讓人期待的。
新一代Opteron 6200/4200的主要特性
說(shuō)完主要的處理架構(gòu)的亮點(diǎn)外,我們?cè)賮?lái)看看其他方面的改。AMD強(qiáng)調(diào)了新一代處理器在三個(gè)方面的靈活性優(yōu)勢(shì),分別是處理性能的靈活性,能耗的靈活性與平臺(tái)及虛擬化的靈活性。而相較上一代的6100處理器平臺(tái),我認(rèn)為前兩者的改進(jìn)最為明顯。
Opteron 6200與6100對(duì)比,請(qǐng)注意整數(shù)處理的每周期發(fā)射數(shù)的提高(預(yù)示整數(shù)性能提升更明顯)、Turbo CORE超頻、C6能耗控制等新的變化
每個(gè)核心都有6個(gè)能耗/性能等級(jí)(P-States),可以根據(jù)TDP的設(shè)定而將最高性能限制在某一等級(jí)之下,而當(dāng)與TurboCORE技術(shù)相配合時(shí),我們能發(fā)現(xiàn)又多出兩個(gè)等級(jí),以提供最強(qiáng)的核心性能。在Opteron 6200平臺(tái)上,用戶可以在BIOS中通過(guò)AMD新推出的TDP Power Cap功能設(shè)定總功耗限制,而P-States也就會(huì)做出相應(yīng)的限定
新增加的C6能耗控制狀態(tài),在這一狀態(tài),空閑的模塊可以單獨(dú)進(jìn)入C6狀態(tài),此時(shí)模塊停止供電與時(shí)鐘信號(hào),從而可最多節(jié)省95%的能耗。在Bulldozer處理器,每個(gè)模塊的狀態(tài)將保存在內(nèi)存中
AMD TurboCORE技術(shù)實(shí)現(xiàn)了類似于英特爾“睿頻”(TurboBoost)的功能
我們已經(jīng)對(duì)英特爾的“睿頻”技術(shù)有所了解,它可以在處理器的能耗不超出TDP功率限制的前提下,根據(jù)應(yīng)用的性能需求,提升處理器核心的運(yùn)行頻率以最大限度挖掘核心的處理性能,而在Opteron 6200上也同樣具備了這一能力,它就是AMD 的TurboCORE技術(shù),它可分為兩個(gè)模式。一種是All Core模式,所有的模塊都可以提升300至500MHz的主頻,另一種是Max Turbo,即如果一些輕負(fù)載線程讓一半的模塊可以將進(jìn)入C6狀態(tài),但余下的模塊又需要最大的處理性能,此時(shí)可以在All Core的基礎(chǔ)上再增加500MHz(即最高可超頻1GHz)。
Opteron 6200處理器價(jià)格信息與規(guī)格比較
我們?cè)?月份曾做過(guò)Opteron 6100與至強(qiáng)7500和5600之間的對(duì)比。今天將延續(xù)我們以往的風(fēng)格,我們?cè)诖藭?huì)列出Opteron 6200的規(guī)格信息,以及與Opteron 4200的價(jià)格信息,并將開(kāi)始與主要的競(jìng)爭(zhēng)對(duì)手進(jìn)行對(duì)比。在這里需要強(qiáng)調(diào)的是,從6100系列來(lái),AMD就放棄了4路以上的服務(wù)器市場(chǎng),并且主攻雙插槽市場(chǎng),這一點(diǎn)與英特爾的戰(zhàn)略明顯不同。所以,AMD將Opteron 6200定位于主流的雙插槽及4路服務(wù)器市場(chǎng),4200則主要是面向云計(jì)算集群應(yīng)用以及輕負(fù)載的企業(yè)應(yīng)用,只有雙插槽平臺(tái)可供選擇。
Opteron 6200與Opteron 4200的官方報(bào)價(jià),4200最低價(jià)為125美元,6200最高為1019美元
年初發(fā)布的6100系列處理器的價(jià)格表,可以看出6200居然更便宜
24.jpg
英特爾E7處理器的價(jià)格,4路型號(hào)最高價(jià)格4394美元,雙插槽最高價(jià)格4227美元,相比之下Opteron 6200太廉價(jià)了……
25.jpg
與6100一樣,6200同樣面對(duì)兩個(gè)強(qiáng)大的對(duì)手,但4路平臺(tái)從至強(qiáng)7500換成E7,而雙插槽平臺(tái)仍然是至強(qiáng)5600
以價(jià)格段為區(qū)間,至強(qiáng)5600與Opteron 6200的型號(hào)對(duì)位表,這也將影響到我們下面的評(píng)測(cè)處理器的選擇