企業(yè)計算新動力 雙核服務(wù)器橫評
2005年四月份,AMD發(fā)布用于X86服務(wù)器的雙核Opteron處理器的時候,Intel還在試圖讓Netburst微架構(gòu)的單核心Xeon沖向4GHz,試圖繼續(xù)用主頻來提升處理器的性能以拉大同競爭對手的差距。
兩家公司在十字路口選擇了不同的方向,結(jié)果大家都已經(jīng)很清楚了,在此后的近半年的時間里面,無論是在雙路服務(wù)器平臺還是在多路服務(wù)器平臺上,Intel始終無法提供可同雙核Opteron處理器相抗衡的X86服務(wù)器產(chǎn)品——采用雙核Pentium D處理器的“雙核”服務(wù)器頂多是在單路服務(wù)器上表明一種姿態(tài):我也有。此刻,兩家公司在X86服務(wù)器上劍拔弩張的態(tài)勢達到了前所未有的程度,“真假雙核”的口水仗每天不絕于耳。顯然,一個希望借助于千載難逢的機遇從此翻盤,另外一個則急需調(diào)整“航母”的航向,重新領(lǐng)先。
代號Smithfield的單路雙核Pentium D處理器 |
然而雙核或者多核技術(shù)并非去年才出現(xiàn)的新技術(shù),早在2001年藍色巨人IBM就發(fā)布了雙核Power 4處理器,并且將其成功的產(chǎn)品化,先后應(yīng)用于從p690、p670、p630、615p等p系列服務(wù)器中。即便是四核處理器也并不新鮮,去年Sun公司就推出了4核心32線程UltraSPARC T1處理器,IBM的Power 5/Power +也可以采用QCM或者MCM封裝實現(xiàn)多核。只是這些產(chǎn)品大都應(yīng)用在Unix服務(wù)器中,定位一般相對較高。此類服務(wù)器的銷量遠遠低于X86服務(wù)器,其受關(guān)注度或者被普通用戶了解的程度自然也低了很多。
服務(wù)器應(yīng)用同普通的PC應(yīng)用有著很大的不同,它面臨的是大量的并行的任務(wù)。Sun在2003年開始倡導的高吞吐量計算 (Throughput Computing) 理念則是另外一個方向。Sun認為過去的幾十年中,處理器速度的提升依然神奇的遵循著摩爾定律,但是內(nèi)存速度卻是每6年提升2倍。網(wǎng)絡(luò)的普及也使得更多的計算任務(wù)是通過網(wǎng)絡(luò)進行的,它的速度同樣也遠遠低于處理器的速度。網(wǎng)絡(luò)應(yīng)用的效能更多的依賴計算單元整體吞吐量的執(zhí)行,而非單個線程。
代號Paxville DP 的雙核Xeon DP處理器
依靠頻率競爭取得競爭優(yōu)勢的Intel在服務(wù)器領(lǐng)域也不愿意輕易放棄他的拿手好戲,憑借著Netburst微架構(gòu)易于提升頻率的特性,不斷的提升著Xeon系列處理器的主頻。直到Intel發(fā)現(xiàn)競爭對手突然調(diào)轉(zhuǎn)方向——而且的確是一個正確的方向之后,才開始踏上雙核之路。2005年10月10日英特爾正式發(fā)布了其第一款雙核心Xeon處理器Dual-Core Xeon 2.8GHz,雖然只有一款,而且似乎是緊急從用于Xeon M(Paxville)處理器“借調(diào)”過來的,但是畢竟幫助英特爾從“無雙”的尷尬境地走了出來。
代號Sossaman的雙核Xeon LV處理器
今年的3月份,英特爾發(fā)布了代號為“Sossaman”的低電壓版雙核Xeon LV服務(wù)器處理器,包括2.0GHz和1.66Ghz兩款。這是自從Netburst微架構(gòu)應(yīng)用到Xeon處理器以來,第一款非Netburst微架構(gòu)的產(chǎn)品,它的TDP只有31瓦,是英特爾將類Core微架構(gòu)在Xeon系列處理器上的初步嘗試。
代號Dempsey的雙核Xeon 5000處理器
5月23日英特爾公司在發(fā)布“Bensley”平臺的同時,一口氣發(fā)布了Xeon 5080、Xeon 5070、Xeon 5060、Xeon 5063、Xeon 5050、Xeon 5040、Xeon 5030和Xeon 5020等8款處理器,這些代號為Dempsey的雙核Xeon DP處理器均配置了4MB L2緩存,其中每個核心獨享2MB L2緩存。這也是Netburst微架構(gòu)最后一次應(yīng)用在Xeon DP處理器。
代號Woodcrest的雙核Xeon 5100處理器 |
6月26日,距離發(fā)布Dempsey僅僅一個月的時間,英特爾又發(fā)布了代號為Woodcrest的Xeon 5100系列雙核處理器,這款處理器采用了Core微架構(gòu),不但具有出色的性能,還具有極低的功耗,徹底的扭轉(zhuǎn)了雙核雙路處理器市場的競爭形式。
代號Santa Rosa的雙核Opteron 2000處理器 |
8月28日,AMD發(fā)布了Opteron 1000/2000/8000系列處理器,其中的Opteron 2000/8000系列處理器開始采用全新的Socket F接口,該系列處理增加了對于虛擬化的硬件級的支持,并且終于將所整合的內(nèi)存控制器升級到DDR2內(nèi)存控制器。根據(jù)IT168評測中心的測試,Opteron 2000系列處理器和Opteron 200系列處理器性能上并無提升,似乎此次產(chǎn)品升級,主要是為了更換處理器接口,為下一步推出四核處理器做好準備。
代號Clovertown的Xeon 5300處理器 |
11月14日,英特爾在繼發(fā)布桌面四核處理器之后發(fā)布了代號為Clovertown的Xeon 5300系列處理器。根據(jù)英特爾公布的測試數(shù)據(jù)來看,Xeon 5355處理器相對于Xeon 5160處理器性能提升在60%左右,而我們對于同頻率的Xeon 5320和Xeon 5120處理器的測試來看,很多應(yīng)用中四核處理器的性能等于甚至大于同頻的雙路雙核處理器的性能。
英特爾在短短的8個月中,針對單一產(chǎn)品線(雙路服務(wù)器)發(fā)布了近16款處理器產(chǎn)品,可以說是前所未見的。也正是通過這種密集的、快速的產(chǎn)品發(fā)布方式,使得英特爾一下從沒有雙核產(chǎn)品的不利境地,重新的回到了業(yè)界領(lǐng)導者的位置上。
#p#page_title#e#
Intel Xeon 5100 VS. AMD Opteron2000
今年,用于雙路服務(wù)器的處理器很有意思。Intel把在桌面處理器使用了一年多的LGA775封裝移植到了Xeon處理器上(LGA771),并且開始將全新的Core微架構(gòu)裝了進去。AMD則采用了全新的以前從未用過的SOCKET F(LGA1207)封裝,其核心卻沒有太多的變化。一個是老瓶新酒,另一個則是新瓶陳釀。
雖然市場定位相同,但是Opteron 2000系列和Xeon 5100系列在設(shè)計理念上有很大的不同,進行完全的對比并不容易。AMD Opteron處理器棄用了前端總線結(jié)構(gòu),利用直接連接架構(gòu)(Direct Connect Architecture)高速連接處理器、內(nèi)存控制器和I/O。直接連接架構(gòu)的重要組成部分HyperTransport總線的應(yīng)用更是使得Opteron處理器及其整個平臺具有了良好的擴展性和靈活性。Opteron 2000/8000系列處理器最高支持3條cHT(coherent HyperTransport)鏈路,這中鏈路不僅可以作為雙路服務(wù)器兩顆處理器之間的通訊通道,還可以利用HTX擴展卡同集群內(nèi)的其它服務(wù)器進行高速通訊。總得來看,Opteron系列處理器設(shè)計之初的著眼點就相當?shù)母摺?/p>
Xeon 5100系列處理器雖然換用了全新的Core微架構(gòu),但是依然沿用了前端總線結(jié)構(gòu),為了解決上一代Xeon平臺前端總線存在嚴重瓶頸的問題,Intel此次為其運行平臺Intel 5000系列芯片組設(shè)計了雙獨立總線結(jié)構(gòu)(DIB),并且大幅度提升了前端總線運行頻率——從FSB800MHz到FSB1333MHz。Intel 5000系列芯片組主要利用高帶寬、點對點的PCI-Express總線技術(shù)來進行擴展,包括其南北橋之間的總線也是基于PCI-Express技術(shù)的,Intel體系中重要的I/O擴展芯片PXH也能通過這種總線進行擴展。
AMD Opteron處理器整合了內(nèi)存控制器,這種設(shè)計的最大優(yōu)點是可以有效的降低了內(nèi)存子系統(tǒng)的延遲,但是也使得AMD平臺在內(nèi)存技術(shù)上無法太靈活。借著新一代Opteron處理器的發(fā)布,AMD才終于開始支持業(yè)界已經(jīng)普通使用的DDR2內(nèi)存。新的Opteron處理器整合了DDR2內(nèi)存控制器,Opteron 1000最高可支持DDR2-800內(nèi)存,理論上可以提供12.8GB/s的內(nèi)存帶寬,而Opteron 2000/8000處理器最高可支持DDR2-667內(nèi)存,理論上可提供10.7GB/s的內(nèi)存帶寬。這相對于上一代Opteron是一個非常大的改進。
Xeon 5100系列處理器的內(nèi)存控制器依然在北橋芯片中,最大的改進是開始支持FB-DIMM內(nèi)存。Intel在現(xiàn)有的DDR2內(nèi)存芯片的技術(shù)上,引入了串行技術(shù),可以實現(xiàn)更多的內(nèi)存通道。比如Intel 5000P芯片組最多可支持4通道配置,配合FB-DIMM 667MHz內(nèi)存,可提供21.3GB/s的理論內(nèi)存帶寬,這使得Intel新Xeon平臺更趨向于平衡。但目前看來FB-DIMM遠非完美,單單是其居高不下的功耗就非常讓服務(wù)器廠商頭痛。
虛擬化也是今年X86服務(wù)器中的一個熱點,這種技術(shù)可以幫助解決“一個臺服務(wù)器,一個應(yīng)用”所造成的資源(計算能力、存儲能力、電力等)的浪費。Intel Virtualization Technology和AMD Virtualization均借助于硬件電路幫助提升虛擬化應(yīng)用的效率。AMD強調(diào)的是其直接連接架構(gòu)能夠為虛擬化應(yīng)用提供一個平衡的環(huán)境,從而提升AMD Virtualization技術(shù)執(zhí)行的效率。Intel則是強調(diào)眾多虛擬解決方案廠商的支持,目前VMware、Xen、Microsoft都已經(jīng)提供了對于VT的支持。
系統(tǒng)對比 | AMD Opteron 2000系列 | Intel Xeon 5100系列 |
模塊化/可擴展 | 支持 | 需要北橋 |
SMP | 雙路四核 | 雙路四核 |
直接連接架構(gòu) | 支持 | 不支持 |
雙核技術(shù) | 支持 | 支持 |
32bit計算 | 支持 | 支持 |
64bit計算 | AMD64 | EM64T |
HyperTransport技術(shù) | 支持 | 不支持 |
內(nèi)存控制器 | 整合于處理器 | 整合于北橋 |
硬件輔助虛擬化 | AMD-V | VT |
前端總線頻率 | 1800-3000MHz* | 1066MHz/1333MHz |
前端總線帶寬 | 14.4-24GB/s | 17-21.3GB/s |
最大處理器間帶寬 | 8.0GB/s | 8.5-10.66GB/s |
內(nèi)存類型 | DDR2 400/533/667 | FB-DIMM DDR2 533/667 |
最大雙路內(nèi)存帶寬 | 21.2GB/s | 21.3GB/s |
最大L1 Cache | 64KB Icache/core 64KB Dcache/core |
32KB Icache/core 32KB Dcache/core |
最大L2 Cache | 1MB/core | 4MB(share) |
雙路最大I/O帶寬 | 32GB/s | 14GB/s |
SIMD指令集 | SSE/SSE2/SSE3 | SSE/SSE2/SSE3/SSE4 |
#p#page_title#e#
本次年度橫評參測的14臺服務(wù)器中,有9臺服務(wù)器配置了Xeon 5100系列處理器,有2臺服務(wù)器配置Xeon 5000系列處理器,有2臺服務(wù)器配置了Opteron 2000系列處理器,只有1臺服務(wù)器配置了Opteron 200系列處理器。
其中ASUS RS162-E4/RX、DAWNING I650r-F1、DELL PowerEdge 2950、Inspur NF190D、Inspur NF280D、TP320-5110均配置了雙路Xeon 5100系列處理器,DELL PowerEdge 2950、Inspur NF190D更是分別配置了Xeon 5160和Xeon 5150處理器。令我們意想不到的是, HP、Lenovo都選擇了配置了Xeon 5000系列處理器的服務(wù)器( Lenovo R520 G6、HP ProLiant DL380 G5)來參評,而且均配置了一顆處理器,因此在進行SPEC CPU2000、Web應(yīng)用和數(shù)據(jù)庫應(yīng)用的測試項目中,大家會看到他們同其它的雙路產(chǎn)品之間存在著明顯的差異。 IBM X3650、Powerleader PR1510D、Powerleader 2700D也均配置了一顆Xeon 5100處理器,計算性能也較低。
我們收到了DAWNING A620r-F、IBM X3655、TongFang TR110-2160這三款采用AMD雙核處理器的產(chǎn)品,華碩和新近加盟AMD陣營的DELL并沒有送測AMD機型。
內(nèi)存技術(shù):并非完美的FB-DIMM
近年來從并行向串行轉(zhuǎn)變的趨勢非常明顯,F(xiàn)B-DIMM內(nèi)存技術(shù)也是其中之一,它采用了多條并聯(lián)的串行線,將內(nèi)存模組上的每個芯片同AMB芯片連接,然后整個內(nèi)存通道中的所有內(nèi)存模組也是串接在一起,這樣的設(shè)計方式可以系統(tǒng)更加容易獲得大容量、高頻率的內(nèi)存系統(tǒng)。Intel 5000系列芯片組開始支持FB-DIMM(fully buffered DIMM)內(nèi)存,英特爾計劃讓這種新型的內(nèi)存全面取代現(xiàn)有的ECC Register DIMM,因此在新的Intel 5000系列MCH的datasheet中我們發(fā)現(xiàn)它并不兼容現(xiàn)有的內(nèi)存規(guī)范。
FB-DIMM內(nèi)存的一般會包有散熱片 |
Intel 5000P MCH支持36bit尋址能力,總共可支持64GB物理內(nèi)存。MCH支持4個FB-DIMM內(nèi)存通道,每個通道最高支持4個雙bank FB-DIMM DDR DIMM。因此在非鏡像模式下,MCH最高可支持16 DIMM或者最大64GB物理內(nèi)存,在鏡像模式下最大可以支持32GB物理內(nèi)存。Intel 5000V MCH則僅支持2個FB-DIMM內(nèi)存通道,每個通道最高可支持4 DIMMs,總共可支持8 DIMM,那么最高內(nèi)存容量可達16 GB。目前上一代主流芯片組E7520 MCH最高可支持16GB DDR2內(nèi)存或者32GB DDR266內(nèi)存,在內(nèi)存容量上并沒有提高。
每個安裝了DDR533 FB-DIMM內(nèi)存的FB-DIMM通道的讀取帶寬為4.25 GB/s,所以4個通道最高可以提供17GB/s的內(nèi)存帶寬,這正好同F(xiàn)SB1066 DIB總線的帶寬相匹配。FB-DIMM采用了非對稱設(shè)計,其上行信號線為10bit,下行信號線為14bit,此時4通道FB-DIMM可以提供8.5GB/s的寫入帶寬。在雙通道配置的Intel 5000V平臺上,這些數(shù)字都將減半,讀取帶寬為8.5GB/s,寫入帶寬為4.25GB/s。
AMD Opteron 2000系列處理器最大的改變之一就是改進了內(nèi)存控制器,開始支持已經(jīng)是市場上絕對主流的DDR2內(nèi)存。不過,AMD對于其內(nèi)存控制器的細節(jié)透露的非常的少,我們只能比較籠統(tǒng)的了解它:其整合內(nèi)存控制器設(shè)計不僅可以有效的降低了內(nèi)存控制器的延遲,還能隨著處理器數(shù)量的增加“線性”的擴展內(nèi)存帶寬。新的Opteron處理器整合了DDR2內(nèi)存控制器,Opteron 1000最高可支持DDR2-800內(nèi)存,理論上可以提供12.8GB/s的內(nèi)存帶寬,而Opteron 2000/8000處理器最高可支持DDR2-667內(nèi)存,理論上可提供10.7GB/s的內(nèi)存帶寬。這相對于上一代Opteron是一個非常大的改進。
Intel 5000P所整合內(nèi)存控制器 | AMD Opteron 2000所整合內(nèi)存控制器 | |
尋址能力 | 36bit | 40bit |
可尋址容量 | 64GB | 1TB |
每控制器通道數(shù)量 | 4 FBD通道 | 2 DDR2通道 |
內(nèi)存類型 | FB-DIMM 533/667MHz | DDR2 400/533/667MHz |
支持設(shè)備 | 可支持容量為256Mbit、512Mbit、1Gbit、2Gbit的內(nèi)存芯片 | 可支持容量為256MB、512MB、1GB、2GB、4GB的內(nèi)存模組 |
熱冗余 | 支持 | 支持 |
鏡像 | 支持 | 不詳 |
x4 SDDC | 支持 | 支持 |
ECC | 支持 | 支持 |
不過,雙路X86服務(wù)器應(yīng)用實際會36bit(64GB)尋址的情況并不多,從服務(wù)器廠商所推出的產(chǎn)品可以看出這一點,大多的雙路服務(wù)器最高可配置32GB內(nèi)存(本次橫評14臺服務(wù)器中有9臺),少數(shù)的雙路服務(wù)器可配置64GB(本次橫評中只有2臺)??梢?,兩家廠商的內(nèi)存尋址能力差異還無法在雙路服務(wù)器的實際應(yīng)用中體現(xiàn)出來。
AMD和Intel在系統(tǒng)結(jié)構(gòu)上非常的不同,AMD將內(nèi)存控制器整合于Opteron處理器內(nèi),Intel則依然使用傳統(tǒng)的設(shè)計,將內(nèi)存控制器整合在北橋芯片中。Opteron所整合的內(nèi)存控制器具有128bit位寬,可支持雙通道DDR2 667MHz內(nèi)存配置,理論上最大帶寬可達10.7GB/s,更重要的是雙路Opteron系統(tǒng)中具有兩個內(nèi)存子系統(tǒng),總共可提供21GB/s的內(nèi)存帶寬。Intel 5000P MCH則結(jié)合FB-DIMM DDR2內(nèi)存,將串行技術(shù)引入了內(nèi)存子系統(tǒng)中,每個MCH支持2個Branch,每個Branch包括兩個FB-DIMM通道,總共可提供21GB/s的內(nèi)存帶寬。單單從簡單的數(shù)字上看,兩個系統(tǒng)是“半斤八兩”。
通過我們對于最新的AMD和Intel服務(wù)器平臺的緩存內(nèi)存子系統(tǒng)的測試來看,AMD Opteron整合內(nèi)存控制器的方案的確可以明顯的降低內(nèi)存訪問延遲,對比基于Netburst微架構(gòu)的Xeon平臺可以明顯的看到這一點,不過基于Core微架構(gòu)的Xeon平臺配合FB-DIMM內(nèi)存子系統(tǒng),在這個方面取得了很明顯的進步,兩者的延遲測試結(jié)果比較接近。
在RAS特性方面,AMD Opteron處理器的資料確認其支持單bit糾錯和雙bit偵錯ECC,也能支持內(nèi)存冗余功能,我們在一些生產(chǎn)AMD Opteron服務(wù)器廠商提供的資料中發(fā)現(xiàn),該系統(tǒng)也能支持x4 SDDC,不過我們沒有發(fā)現(xiàn)有資料顯示其支持內(nèi)存鏡像。Intel 5000P MCH可支持內(nèi)存冗余、內(nèi)存鏡像、x4 SDDC和ECC等特性。
還需要說明的是,F(xiàn)B-DIMM在理念上的確是比較先進,但是其功耗過大的問題的確是存在的,根據(jù)我們之前的測試發(fā)現(xiàn),單條FB-DIMM DDR2-533內(nèi)存功耗高達10瓦,而一般的DDR2內(nèi)存的功耗只有2瓦多一點。配置了4-8條FB-DIMM內(nèi)存的系統(tǒng)中,會又增加了除了處理器之外一個熱源,這是服務(wù)器散熱設(shè)計上一項新考驗。
FB-DIMM內(nèi)存和處理器位于不同的風道 |
FB-DIMM內(nèi)存和處理器位于同一風道 |
在本次橫評中的9款基于Intel Bensley平臺的服務(wù)器中,ASUS RS162-E4/RX服務(wù)器、DELL PowerEdge 2950服務(wù)器、HP ProLiant DL380 G5服務(wù)器、IBM X3650服務(wù)器均將內(nèi)存設(shè)計在單獨的風道上,以確保FB-DIMM得到充分的散熱,而其它的5款服務(wù)器中的FB-DIMM內(nèi)存的散熱要依賴于經(jīng)過處理器“預熱”氣流。
#p#page_title#e#
SAS存儲設(shè)備已經(jīng)普遍應(yīng)用
在服務(wù)器系統(tǒng)中,系統(tǒng)總線首先從并行PCI轉(zhuǎn)向了串行PCI-Express,掀起了串行革命。存儲子系統(tǒng)跟進的速度很快,目前包括LSI Logic、Adaptec在內(nèi)的控制器廠商都已經(jīng)推出了技術(shù)比較成熟、體系完整的產(chǎn)品線,并且獲得了服務(wù)器廠商的廣泛應(yīng)用,主流的企業(yè)級硬盤廠商,比如富士通、日立、希捷和已經(jīng)被收購的Maxtor也都推出了SAS硬盤產(chǎn)品。
在我們本次橫評中9大品牌14臺服務(wù)器中,有9臺服務(wù)器支持SAS技術(shù),只有3臺服務(wù)器支持SCSI技術(shù)(同方超強TP320-5110和曙光I650r-F和A620r-F1),另外還有一臺服務(wù)器選擇了SATA接口的存儲設(shè)備(同方超強TR110-2160)。需要說明的是,采用了SAS技術(shù)的服務(wù)器產(chǎn)品在實際使用和測試中并不一定會優(yōu)于不采用的產(chǎn)品,但是可以明顯的反映不同廠商的對于新技術(shù)的敏感程度以及跟進新技術(shù)的研發(fā)能力。另外還能看出不同廠商的市場策略的不同,比如IBM、HP、浪潮、聯(lián)想他們顯然不僅僅滿足于市場份額的領(lǐng)先,更希望能夠在技術(shù)上保持領(lǐng)先,從而獲得長期的競爭優(yōu)勢。
在10款采用SAS存儲設(shè)備的服務(wù)器產(chǎn)品中,有二款產(chǎn)品特別值得肯定。HP ProLiant DL380 G5、IBM X3655均采用了2.5英吋的萬轉(zhuǎn)SAS硬盤設(shè)備,相對于3.5英吋硬盤,它們的體積縮小了70%,從而可以在1U、2U和刀片服務(wù)器上容量更多數(shù)量的硬盤,在RAID應(yīng)用中會更靈活。另外,2.5英吋硬盤的功耗只有3.5英吋硬盤的一半多一點,這符合講求能效比“主旋律”。當然,支持3.5英吋SAS硬盤的服務(wù)器只要更換相應(yīng)的背板和托架就可以安裝2.5英吋硬盤,在實現(xiàn)上并無技術(shù)難度,成本是主要的因素。
在服務(wù)器SAS設(shè)備解決方案中,LSI Logic的產(chǎn)品占據(jù)了絕對的主流,在我們所測試的10臺支持SAS設(shè)備的服務(wù)器中,有8臺采用了LSI Logic生產(chǎn)的SAS控制器來設(shè)計服務(wù)器的存儲子系統(tǒng),其中的LSISAS1064和LSISAS1068芯片是板載SAS控制器的主力軍,整合了ARM處理器,分別可提供4個SAS端口和8個SAS端口,可支持RAID 0/1/10等磁盤陣列模式。
HP ProLiant DL380 G5服務(wù)器基本型均配置具有256MB高速緩存的智能陣列P400控制卡,這款卡采用了LSISAS1078控制器,可支持RAID 0/1/5,但不支持RIAD 6和電池支持的高速緩存寫入功能。浪潮NF190D和NF280D分別采用了LSI Logic MegaRAID SAS 8408E和LSI Logic MegaRAID SAS 8308E PCI-E控制卡,它們板載了256MB緩存,具有專用的IOP處理器,可支持RAID 0/1/10/5等磁盤陣列模式,并且支持電池支持的高速緩存寫入功能。
IBM X3655/3650服務(wù)器的磁盤子系統(tǒng)的設(shè)計有些特別,它們均板載了ServeRAID 8k/8k-l RAID控制器,該控制器利用了板載Adaptec AIC9580W SAS控制器芯片,通過上圖所示的插槽擴展了32MB或者64MB緩存,可支持RAID 0/1/10基本的磁盤陣列模式。根據(jù)我們測試,這種解決方案可以提供比普通的板載解決方案好的多的讀取性能。
目前SAS設(shè)備的接口尚不統(tǒng)一,大部分的擴展卡上(比如LSI Logic MegaRAID SAS 8408E和HP 智能陣列P400控制卡)都采用了出現(xiàn)較早的遵循SFF-8484規(guī)范的SAS x4接口,而我們所評測過的所有的服務(wù)器所采用的板載SAS解決方案均提供了遵循較新的SFF-8487規(guī)范的SAS x4接口,這種接口的更緊湊一些,也被稱為mini-SAS接口。
好在這些問題都是服務(wù)器廠商需要解決的,面對不同的接口,他們需要用不同的連接線連接SAS控制器端口和存儲背板,而背板上都是提供了統(tǒng)一接口,用于直接連接硬盤。還有一個好消息是,大部分的廠商都已經(jīng)表示今后會逐漸統(tǒng)一到mini-SAS接口上來,SAS向著成熟更近了一步。
#p#page_title#e#
英特爾I/O加速技術(shù)和TOE
去年參加我們服務(wù)器橫評的十幾款服務(wù)器中均配置了雙千兆網(wǎng)卡,今年參測的14款服務(wù)器也沒有例外的采用了雙千兆網(wǎng)卡的配置。在網(wǎng)絡(luò)應(yīng)用非常普及的今天,服務(wù)器的網(wǎng)絡(luò)接口是其同外界通訊的“咽喉要道”,否則服務(wù)器無法實時的接受外部的請求并且把處理結(jié)果發(fā)送出去。而在當今的網(wǎng)絡(luò)應(yīng)用中,還是以TCP/IP協(xié)議為基礎(chǔ)的,在TCP/IP協(xié)議的應(yīng)用過程中需要封裝、解包,這些動作對于處理器而言并不是一個復雜的過程,但是卻是會占用大量處理器時間,隨著網(wǎng)絡(luò)帶寬越高,這個問題就會越嚴重。
伴隨著英特爾Bensley平臺的發(fā)布,英特爾同時把英特爾I/O加速技術(shù)作為一個很重要的概念來推廣。概括的來說,英特爾I/O加速技術(shù)是一個著眼于整個平臺用于移動數(shù)據(jù)、訪問數(shù)據(jù)和降低網(wǎng)絡(luò)I/O過程中系統(tǒng)開銷的解決方案。英特爾I/O加速技術(shù)計劃幫助服務(wù)器應(yīng)用程序更快、更高效(占用更少的CPU周期)的獲取數(shù)據(jù)。
英特爾I/O加速技術(shù)所涉及的方方面面 |
Intel I/OAT通過適度的中斷、適度的內(nèi)存訪問、并行計算、數(shù)據(jù)移動和減少上下文切換等措施來降低系統(tǒng)開銷。比如通過預取操作來提升內(nèi)存訪問和數(shù)據(jù)移動效率,直接訪問子系統(tǒng)可用于卸載數(shù)據(jù)移動和異步拷貝,TSO(TCP segmentation offload)運算轉(zhuǎn)移給網(wǎng)卡或者板載LAN控制器,并且在數(shù)據(jù)流和特定的處理器核心之間建立密切的聯(lián)系。這些技術(shù)可以降低網(wǎng)絡(luò)I/O過程中的CPU占用率,包括協(xié)議計算,并且明顯的降低由于緩存未命中和Cache line bouncing所引起的CPU停滯。
在英特爾I/O加速技術(shù)之前,已經(jīng)有多種用于解決同樣問題的類似技術(shù),比如應(yīng)用比較廣泛的TOE(TCP Offload Engine,TCP卸載引擎),這種技術(shù)一般通過網(wǎng)卡上的專用處理器協(xié)助處理部分或者全部的封包,借此來降低對于系統(tǒng)處理器資源的占用。
其實,英特爾I/O加速技術(shù)和TOE技術(shù)都是用于提升網(wǎng)絡(luò)傳輸效能,同時盡量的降低了對于處理器資源占用的解決方案,只是英特爾把其提供的解決方案提升到整個平臺的層面上。通過統(tǒng)計參加本年度14款的服務(wù)器的網(wǎng)絡(luò)部件,我們發(fā)現(xiàn)英特爾I/O加速技術(shù)所面臨的局勢非常微妙:
在這14臺服務(wù)器中,有3臺服務(wù)器采用了AMD Opteron平臺,因此這21%的產(chǎn)品肯定不支持英特爾I/O加速技術(shù),在剩余的11臺服務(wù)器中,只有3臺服務(wù)器支持TOE技術(shù),剩余的8臺服務(wù)器全部支持英特爾I/O加速技術(shù),從數(shù)量上看英特爾I/O加速技術(shù)毫無懸念的取得了占有率的領(lǐng)先。
然而,我們發(fā)現(xiàn)此次參測的DELL POWEREDGE 2950服務(wù)器、HP ProLiant DL380 G5服務(wù)器、IBM X3650服務(wù)器全部選擇了TOE技術(shù),而沒有采用英特爾I/O加速技術(shù)。這三家廠商在全球服務(wù)器市場占據(jù)什么樣的地位自不必說,而這三款產(chǎn)品也是各家廠商的主力機型。這樣看來,英特爾I/O加速技術(shù)的推廣之路還相當?shù)穆L。
兩種技術(shù)在實際應(yīng)用的表現(xiàn),我們以后將會通過對比評測的形式展示給讀者,這里就不展開討論了。#p#page_title#e#
9大品牌14款雙核服務(wù)器規(guī)格一覽
本次年度橫評,我們邀請了在國內(nèi)占據(jù)了主流地位的9家服務(wù)器廠商參與,最后一共征集到了14款產(chǎn)品:華碩ASUS RS162-E4/RX、曙光Dawning A620r-F服務(wù)器、曙光Dawning I650r-F1服務(wù)器、戴爾Dell PowerEdge 2950服務(wù)器、惠普HP ProLiant DL380 G5服務(wù)器、IBM System X3650服務(wù)器、IBM System X3655服務(wù)器、浪潮Inspur英信NF190D服務(wù)器、浪潮Inspur英信NF280D服務(wù)器、寶德Powerleader星核5系列1510D服務(wù)器、寶德Powerleader星核7系列2700D服務(wù)器、同方Tongfang 超強TP320-5110服務(wù)器、同方Tongfang超強TR110-2160服務(wù)器、聯(lián)想Lenovo R520 G6服務(wù)器。
#p#page_title#e#
測試平臺和測試方法
一般的評估服務(wù)器都采用RASUM評價體系或者RUMA評介體系,兩者的內(nèi)容非常的相似,RASUM為Reliability(可靠性)、Availability(可用性)、Scalability(可擴展性)、Usability(易用性)、Manageability(可管理性)的縮寫,RUMA為Scalability(可擴展性),Usability(易用性),Manageability(易管理),Availability(可用性)。這些評估準則均是從長期的實踐中總結(jié)出來的,符合這些準則的服務(wù)器產(chǎn)品可以更好的為用戶服務(wù)。我們依據(jù)這些基本的準則結(jié)合我們的實際測試環(huán)境對于服務(wù)器的以下幾個方面進行了評估。
一、性能評估
2005年度服務(wù)器橫評之后,我們認為當時的網(wǎng)絡(luò)實驗室無法滿足今后繼續(xù)發(fā)展的服務(wù)器測試的需要。所以,2006年我們IT168評測中心又斥資幾十萬對于IT168網(wǎng)絡(luò)實驗室的服務(wù)器測試平臺進行了大幅度的升級,為思科Catalyst4500千兆交換機(WS-X4013+ Supervisor Engine II-Plus和WS-X4548-GB-RJ45)增加了一個思科全千兆24口模塊WS-X4424-GB-RJ45,可同時連接72個千兆銅纜設(shè)備和2個光纜設(shè)備。另外,我們還購置了29臺DELL PowerEdge SC430塔式服務(wù)器和原來的32臺主流配置PC一起為服務(wù)器測試平臺的提供負載。
Catalyst4500千兆交換機 |
新增的部分Dell PowerEdge SC430服務(wù)器 |
#p#page_title#e#
在新的測試環(huán)境下,我們進一步完善了服務(wù)器性能測試方案:
-
SPECCPU2000 v1.2
SPEC是標準性能評估公司(Standard Performance Evaluation Corporation)的簡稱。SPEC是由計算機廠商、系統(tǒng)集成商、大學、研究機構(gòu)、咨詢等多家公司組成的非營利性組織,這個組織的目標是建立、維護一套用于評估計算機系統(tǒng)的標準。
SPEC CPU2000是SPEC組織推出的一套CPU子系統(tǒng)評估軟件,它包括CINT2000和CFP2000兩個子項目,前者用于測量和對比整數(shù)性能,而后者則用于測量和對比浮點性能。計算系統(tǒng)中的處理器、內(nèi)存和編譯器都會影響最終的測試性能,而I/O(磁盤)、網(wǎng)絡(luò)、操作系統(tǒng)和圖形子系統(tǒng)對于SPEC CPU2000的影響非常的小。
SPECfp測試過程中同時執(zhí)行多個實例(instance),測量系統(tǒng)執(zhí)行計算密集型浮點操作的能力,比如CAD/CAM、DCC以及科學計算等方面應(yīng)用可以參考這個結(jié)果。SPECint測試過程中同時執(zhí)行多個實例(instances),然后測試系統(tǒng)同時執(zhí)行多個計算密集型整數(shù)操作的能力,可以很好的反映諸如數(shù)據(jù)庫服務(wù)器、電子郵件服務(wù)器和Web服務(wù)器等基于整數(shù)應(yīng)用的多處理器系統(tǒng)的性能。
我們在被測服務(wù)器中安裝了Intel C++ 8.1 Compiler、Intel Fortran 8.1 Compiler這兩款SPEC CPU2000必需的編譯器,另外安裝了Microsoft Visual Studio 2003.net提供必要的庫文件。按照SPEC的要求我們根據(jù)自己的情況編輯了新的Config文件,可以滿足Base測試。然后我們根據(jù)被測系統(tǒng)實際可同時處理的線程數(shù)量,設(shè)定用戶數(shù)量,分別運行SPEC base和SPEC rate base測試的結(jié)果(其中SPEC base代表系統(tǒng)執(zhí)行某個任務(wù)的速度,而SPEC base rate測試代表系統(tǒng)可以同時處理任務(wù)的能力)。
ScienceMark v2.0 Membench cienceMark v2.0是一款用于測試系統(tǒng)特別是處理器在科學計算應(yīng)用中的性能的軟件,MemBenchmark是其中針對處理器緩存、系統(tǒng)內(nèi)存而設(shè)計的功能模塊,它可以測試系統(tǒng)內(nèi)存帶寬、L1 Cache延遲、L2 Cache延遲和系統(tǒng)內(nèi)存延遲,另外還可以測試不同指令集的性能差異。
-
IOMeter 2004.7.30 IOMeter是一款功能非常強大的IO測試軟件,它除了可以在本機運行測試本機的IO(磁盤)性能之外,還提供了模擬網(wǎng)絡(luò)應(yīng)用的能力。在這次的測試中,我們僅僅讓它在本機運行測試服務(wù)器的磁盤性能。為了全面測試被測服務(wù)器的IO性能,我們分別選擇了不同的測試腳本。
-
Max_throughput(read):文件尺寸為64KB,100%讀取操作,隨機率為0%,用于檢測磁盤系統(tǒng)的最大讀取吞吐量
-
Max_IO(read):文件尺寸為512B,100%讀取操作,隨機率為0%,用于檢測磁盤系統(tǒng)的最大讀取操作IO處理能力
-
Max_throughput(write):文件尺寸為64KB,0%讀取操作,隨機率為0%,用于檢測磁盤系統(tǒng)的最大寫入吞吐量
-
Max_IO(write):文件尺寸為512B,0%讀取操作,隨機率為0%,用于檢測磁盤系統(tǒng)的最大寫入操作IO處理能力
-
SiSoftware.Sandra.SP1 v2007 SiSoftware Sandra是一款可運行在32bit和64bit Windows操作系統(tǒng)上的分析軟件,這款軟件可以對于系統(tǒng)進行方便、快捷的基準測試,還可以用于查看系統(tǒng)的軟件、硬件等信息。今年該軟件推出了2007版,該版本新增了4項基準測試,包括Power Management Efficiency、Memory Latency、Physical Disks和CD-ROM and DVD這四個項目。另外,它還對于原有的幾個基準測試模塊進行升級,比如在Arithmetic benchmarks中增加了對SSE3 & SSE4 SSE4的支持,在Multi-Media benchmark中增加了對于SSE4的支持,另外還升級了File System benchmark和Removable Storage benchmark兩個子項目。對于新的硬件的支持當然也是該軟件每次升級的重要內(nèi)容之一。SiSoftware Sandra所有的基準測試都針對SMP和SMT進行了優(yōu)化,最高可支持32/64路平臺,這也是我們選擇這款軟件的原因之一。
-
WebBench v5.0 WebBench是針對服務(wù)器作為Web Server時的性能進行測試,我們在被測服務(wù)器上安裝了IIS6.0組件,以提供測試所需的Web服務(wù)。在測試中我們開啟了網(wǎng)絡(luò)實驗室中的56臺客戶端,分別使用了WebBench 5.0內(nèi)置的動態(tài)CGI以及靜態(tài)頁面腳本對服務(wù)器進行了測試。
靜態(tài)測試是由客戶端讀取預先放置在服務(wù)器Web Server下的Web頁面(wbtree),這項測試主要考察的是服務(wù)器磁盤系統(tǒng)以及網(wǎng)絡(luò)連接性能。我們使用了實驗室中的56臺客戶端,配合Static_mt.tst多線程靜態(tài)腳本測試向被測服務(wù)器發(fā)送請求。
動態(tài)測試偏重于對服務(wù)器CPU子系統(tǒng)的性能測試,它對于Web服務(wù)器提供了足夠的負載。我們將一個C語言編寫的CGI源文件Simcigi.c編譯為Simcgi.exe,并將其作為動態(tài)測試中的CGI腳本。在測試過程中,每臺安裝了WebBench客戶端軟件的PC,會在300秒的時間內(nèi)持續(xù)向服務(wù)器發(fā)送CGI請求,而控制臺會紀錄并匯總服務(wù)器所響應(yīng)CGI請求的數(shù)據(jù)。CGI測試的成績高低,主要取決于服務(wù)器處理器子系統(tǒng)性能的優(yōu)劣。處理器子系統(tǒng)包括CPU、內(nèi)存以及內(nèi)存控制器,CPU頻率、緩存以及內(nèi)存容量大小和內(nèi)存帶寬,都會影響該項成績。
-
NetBench v7.03 NetBench是針對文件服務(wù)器的性能測試軟件,影響NetBench性能的主要是服務(wù)器的磁盤子系統(tǒng),服務(wù)器磁盤控制器、條帶大小、讀寫緩存、硬盤類型、組建磁盤陣列模式、內(nèi)存容量、網(wǎng)絡(luò)拓樸結(jié)構(gòu)等都會對測試結(jié)果有明顯的影響。我們在被測服務(wù)器上設(shè)立了文件服務(wù)器,NetBench通過網(wǎng)絡(luò)實驗室中60個客戶端來模擬網(wǎng)絡(luò)中的PC向文件服務(wù)器所發(fā)出的文件傳輸請求,文件服務(wù)器則將存儲在磁盤上的文件數(shù)據(jù)發(fā)送給相應(yīng)的客戶端。在測試過程中,客戶端會以每四臺一組的步進依次增加并且向服務(wù)器發(fā)送文件傳輸請求,測試結(jié)束后控制臺收集數(shù)據(jù)并繪制出服務(wù)器的數(shù)據(jù)傳輸變化曲線。
-
Benchmarkfactory 4.6 大部分的服務(wù)器應(yīng)用都同數(shù)據(jù)庫有著密切的聯(lián)系,因此我們今年開始著手在在服務(wù)器測試中加入對于數(shù)據(jù)庫性能的測試。我們選擇了Benchmark Factory 4.6軟件和Microsoft SQL2000 SP4來測試不同的硬件平臺在數(shù)據(jù)庫應(yīng)用中的表現(xiàn)。
我們選擇了BF內(nèi)置的標準測試腳本AS3AP,這項測試可用于對于ANSI結(jié)構(gòu)化查詢語言(SQL)關(guān)系型數(shù)據(jù)庫進行測試,它可用于測試DBMS(單用戶微機數(shù)據(jù)庫管理系統(tǒng)),也可用于測試高性能并行或者分布式數(shù)據(jù)庫。
-
系統(tǒng)功耗監(jiān)測 我們使用UNI-T UT71E智能數(shù)字萬用表對于被測服務(wù)器系統(tǒng)的整體功耗進行了監(jiān)測,利用隨機附帶的接口程序,我們可以記錄被測服務(wù)器任意時間段內(nèi)的功率變化。
#p#page_title#e#
二、主要規(guī)格和技術(shù)驗證
這個部分主要對于送測服務(wù)器的物理特性、硬件配置等等進行考察、評估,比如服務(wù)器機箱架構(gòu)、規(guī)格尺寸、處理器型號/數(shù)量/主頻、芯片組、內(nèi)存型號和容量、磁盤控制器、硬盤型號、磁盤陣列、網(wǎng)卡型號和接口類型、散熱設(shè)備、供電、擴展槽、IO接口、托架數(shù)量等等。此外還對于處理器技術(shù)(SMP技術(shù)、HT技術(shù)、EMT64、Dual Core)、內(nèi)存技術(shù)(DDR、DDRII、FB-DIMM、雙/多通道、內(nèi)存鏡像、內(nèi)存熱備、內(nèi)存?zhèn)慑e/糾錯)、磁盤接口技術(shù)(SATA、IDE、SCSI、SAS)、磁盤陣列技術(shù)(RAID 0、RAID 1、RAID 10、RAID 5)等等進行了全面的考查和驗證。
三、服務(wù)器管理功能
決大多數(shù)的服務(wù)器廠商都會提供給用戶服務(wù)器管理解決方案,我們對于不同的管理解決方案的具體組件、采用的協(xié)議、安全特性、維護和更新系統(tǒng)的能力、系統(tǒng)監(jiān)測的項目、報警和日志的方式與方法、故障分析和修復等多個方面進行了考查。我們還對于廠商提供了服務(wù)器部署導航解決方案進行了考查,比如其所支持的操作系統(tǒng)的類型、支持本地部署的前提下還能否支持遠程部署等等。
六、技術(shù)支持和質(zhì)保
這個部分主要包括對隨機文檔、網(wǎng)站資訊、在線支持方式、電子郵件支持情況、電話支持情況以及上門服務(wù)的承諾都進行了對比。比如,內(nèi)容豐富、圖文并茂的隨機文檔會得到我們較高的評價,這畢竟是用戶獲得基本技術(shù)支持最基本、最及時、最有效的方案之一。而隨著網(wǎng)絡(luò)應(yīng)用的普及,我們的考察重點也放在了在線互動、在線支持上。
2006年度服務(wù)器橫評總評
根據(jù)前面的介紹,讀者可以了解到,我們IT168評測中心對于服務(wù)器評估主要包括性能因素和非性能因素,它們分別占據(jù)總評50%的權(quán)重。
影響性能得分主要是廠商送測產(chǎn)品的配置,比如處理器性能越高服務(wù)器整體性能也越過,內(nèi)存容量和頻率也對于性能有影響,此外服務(wù)器的磁盤子系統(tǒng)配置的高低也對于測試結(jié)果有明顯的影響。不同廠商此次參測的出發(fā)點并不相同,比如Dell和浪潮是本著展示其產(chǎn)品最佳狀態(tài)而來的,所以他們送測的產(chǎn)品幾乎是當前基于Benlsey平臺服務(wù)器的最頂級配置,在性能測試中DELL PowerEdge 2950服務(wù)器以48.58的成績高居榜首,而浪潮英信NF190D服務(wù)器則以46.24分成績獲得了亞軍。還有的廠商的出發(fā)點比較務(wù)實,比如寶德1510D和2700D,雖然它們的性能得分看似不高,但是市場上主流產(chǎn)品的硬件配置大都會在這個水平上。
非性能因素則不僅僅包括送測服務(wù)器本身的設(shè)計,還包括了服務(wù)器配套的管理解決方案、技術(shù)支持方式和情況,特別是后兩者不是單純的給送測機型增加高端配件就能獲得的,而是服務(wù)器廠商在較長時間內(nèi)積累的效果。從我們的統(tǒng)計表格來看, IBM高舉榜首,幾乎獲得了滿分。聯(lián)想、浪潮、DELL、HP都位于第二梯隊也具有不錯的成績。寶德和華碩在這個方面也具有不錯的表現(xiàn)。
綜合評估則涵蓋了上述兩個方面的成績,其中DELL PowerEdge 2950服務(wù)器、浪潮英信NF190D服務(wù)器、IBM System X3655服務(wù)器位列三甲。其中DELL PowerEdge 2950服務(wù)器依靠絕對頂級的硬件配置、出色的設(shè)計和完備的技術(shù)支持獲得了第一名,但是其管理維護功能相對不夠完美。IBM System X3655服務(wù)器的硬件配置非常的普通,因此性能得分較低,但是其出色的設(shè)計、頂級的管理管理功能和完備的技術(shù)支持使得也獲得了第三名的好成績。浪潮英信NF190D服務(wù)器則提供了接近于頂級的硬件配置,雖然設(shè)計比較普通,但依靠較為出色的管理功能和技術(shù)支持也獲得綜合成績第二名的成績。
#p#page_title#e#
綜上所述,我們
授予浪潮英信NF190D服務(wù)器編輯推薦獎:
授予IBM System X3655服務(wù)器編輯推薦獎:
授予DELL PowerEdge 2950服務(wù)器最佳性能獎:
每瓦特性能或者說能效比也是今年非常流行的詞語,我們測量了所有14款參測服務(wù)器處理器、內(nèi)存、磁盤子系統(tǒng)工作在滿載的情況下的服務(wù)器整體功耗,然后用性能評估得分比上服務(wù)器整體功耗得到了該款服務(wù)器的能效比。測試結(jié)果顯示,浪潮英信NF190D服務(wù)器具有最佳能效比,為此我們
授予浪潮英信NF190D服務(wù)器最佳能效比獎:
按照以往橫評的慣例,我們還會選出最佳性價比產(chǎn)品。首先,由于今天廠商送測服務(wù)器硬件配置差異巨大,因此實際價格也差異也較大,對比性價比困難較大。第二,部分參測廠商并沒有能夠按照我們的要求提供產(chǎn)品報價,或者報價同我們市場調(diào)查差異較大,也使得我們無法進行性價比的對比。因此,我們決定,本次服務(wù)器橫評的最佳性價比獎空缺。