Quadro FX5600 SLI創(chuàng)造SPEC測分新紀(jì)錄
我們看到,這臺HP xw9400工作站使用的是液冷CPU散熱系統(tǒng)。由于Quadro FX 5600的最大功耗高達(dá)171W,因此每塊顯卡都連接了2個(gè)6pin供電插頭。
拆掉CPU散熱器后,我們看到2顆AMD Opteron處理器在HP xw9400工作站主板上的位置不像Intel Xeon系統(tǒng)那樣并排在一列上,而是一前一后的方式。這一點(diǎn)與AMD的CPU中整合了內(nèi)存控制器有關(guān),因?yàn)槊總€(gè)CPU控制的4根內(nèi)存插槽都要以并聯(lián)的方式連接到處理器上。如果使用傳統(tǒng)的風(fēng)冷散熱器,由于機(jī)箱內(nèi)的空氣是從前向后流動(dòng),靠近機(jī)箱后背板的那個(gè)CPU溫度會相對高一些。(Intel即將發(fā)布的下一代基于Nehalem架構(gòu)的雙路Xeon 5500平臺在散熱設(shè)計(jì)上也會遇到類似的問題。)在這種情況下,液冷的優(yōu)勢就顯現(xiàn)出來了,這也是惠普目前只在xw9400一款工作站上引入液冷CPU散熱器的原因。另外,HP還在內(nèi)存上方設(shè)置了一個(gè)風(fēng)扇和導(dǎo)風(fēng)罩來幫助內(nèi)存散熱。
我們對這套液冷CPU散熱系統(tǒng)比較感興趣,于是專門研究一下它。上圖中每個(gè)CPU上方的液冷頭分別引出2條導(dǎo)管(一進(jìn)一出)連接至后方的散熱片。
再來看看散熱器的底部,2個(gè)銅質(zhì)并帶有熱管的液冷吸熱裝置固定在CPU的上方。整套CPU散熱系統(tǒng)共有3個(gè)12V風(fēng)扇接頭,左邊的4pin連接位于機(jī)箱后部的大尺寸溫控風(fēng)扇(即原來的機(jī)箱風(fēng)扇位置);中間是位于散熱器底部的一個(gè)3pin小風(fēng)扇,該風(fēng)扇的作用應(yīng)該是輔助主板上的CPU VRM(供電)等元件的散熱;最右邊的那條線連接的可不是風(fēng)扇,而是液冷系統(tǒng)的核心部件——水泵。
我們進(jìn)一步拆開液冷散熱器的塑料外殼,終于露出了儲液(水)盒和水泵。右邊這個(gè)被黑色膠皮包裹的就是日本Shinano Kenshi(信濃)公司生產(chǎn)的微型水泵,它采用了與4pin風(fēng)扇相同的PWM轉(zhuǎn)速控制技術(shù)。(為什么很多優(yōu)質(zhì)的風(fēng)扇等馬達(dá)設(shè)備如:Nidek、Sanyodenki、Matsushita等都是日本的品牌呢?看來想抵制日貨也不容易?。?/p>
這就是巨大的鋁制散熱片和15cm直徑的NMB風(fēng)扇,惠普在用料上可謂不惜成本。
這臺HP xw9400工作站配置了2個(gè)四核Opteron 2356 2.3GHz處理器,我們曾經(jīng)在2008年7月做過相關(guān)報(bào)道(詳見:“HP xw9400工作站配置更新 可選Opteron 2300系列四核處理器”一文)。在惠普工作站2008年11月的價(jià)格表(見下圖)中,可選的CPU項(xiàng)目發(fā)生了變化,其中2MB三級緩存的4核處理器只保留了Opteron 2352(2.1GHz)、2358SE(2.4GHz)和2360SE(2.5GHz)3個(gè)型號,新加入了4款6MB三級緩存的Opteron 2376(2.3GHz)、2378(2.4GHz)、2380(2.5GHz)和2384(2.7GHz)即代號為“shanghai(上海)”的服務(wù)器/工作站CPU。
上圖中的“LiqCool”字樣就是搭配液冷散熱器的CPU選項(xiàng)。在HP的價(jià)格表中,xw9400工作站選配的每種CPU型號都有風(fēng)冷(AirCool)和液冷兩種,后者的價(jià)格比前者高出265美金。
該HP xw9400工作站共安裝了4條4GB DDR2-667 ECC Reg.內(nèi)存,分別對應(yīng)連接每個(gè)CPU中整合的雙通道內(nèi)存控制器。內(nèi)存顆粒和模組的制造商為Micron(美光),芯片的配置方式為2 Rank×4,也就是說每條內(nèi)存正反兩面一共有36個(gè)內(nèi)存芯片(其中4個(gè)用于ECC校驗(yàn))。
這就是本文的主角,2片NVIDIA Quadro FX 5600顯卡使用軟質(zhì)SLI橋接電纜相連。需要注意的是,目前主流的Intel芯片組主板中只有最新的X58(通過NVIDIA授權(quán)的)能夠支持SLI多顯卡互聯(lián)技術(shù)。因此惠普的工作站產(chǎn)品線中只有AMD平臺的HP xw9400(采用NVIDIA nForce Professional 3600+3050芯片組)一款能夠支持真正的SLI,其它機(jī)型即使擁有2個(gè)全速PCI Experss x16顯卡插槽(Intel X38、5400芯片組)也無法實(shí)現(xiàn)SLI。
以上配件特別是2片Quadro FX 5600的功耗可不是個(gè)小數(shù)字,惠普為了保證充足的供電,給這臺xw9400工作站配備了Delta(臺達(dá))1050W 80 Plus #p#page_title#e#電源。該電源的+12V輸出共有8路之多,其中包括CPU-0、CPU-1、D(外設(shè))、G1、G2(顯卡)、R、M、B(主板),每一路的最大輸出電流都是18A,+12V連續(xù)工作的最大組合負(fù)載不超過84A。
在本次測試中,Quadro FX 5600 SLI分別在SPECvierperf 10的ensight-03、tcvis-01、ugnx-01三個(gè)子項(xiàng)和SPECapc for UGS NX 4的圖形成績上超過了SPEC網(wǎng)站(www.spec.org)上公布的測試結(jié)果中的最好成績。詳細(xì)的測試結(jié)果請看下文。
測試平臺
說明:HP xw9400工作站提供了2個(gè)PCI-E x16擴(kuò)展槽,不過規(guī)格是1.0而不是最新的PCI Experss 2.0;NVIDIA Quadro FX 5600顯卡推出的時(shí)間比較長,正好也是PCI-E 1.0接口規(guī)格,因此沒有造成瓶頸。16GB內(nèi)存在32位Windows XP系統(tǒng)下實(shí)際只能用到3GB左右;另外這臺樣機(jī)上的2塊SAS硬盤使用板載SAS控制器配置為RAID 0,我們沒有做修改。
系統(tǒng)信息
設(shè)備管理器
NVIDIA Quadro FX專業(yè)顯卡驅(qū)動(dòng)SLI設(shè)置
測試安裝了NVIDIA專業(yè)顯卡最新的178.46版驅(qū)動(dòng),兩塊1.5GB顯存的Quadro FX 5600,我想這是許多人都夢寐以求的頂級圖形工作站配置。
上圖為NVIDIA Quadro專業(yè)顯卡的SLI設(shè)置界面,只有當(dāng)顯卡、主板全都支持SLI并安裝了橋接電纜才會出現(xiàn)這個(gè)菜單。下面的“SLI渲染模式”選項(xiàng)才是真正的多顯卡并聯(lián)加速,而上方的“SLI多屏顯示模式”其實(shí)就是2塊顯卡獨(dú)立工作并沒有打開SLI。
進(jìn)行完上述設(shè)置后,運(yùn)行SPECvierperf等測試軟件還不會獲得性能上的提升,因?yàn)镹VIDIA推薦的SLI性能模式默認(rèn)為“單一 GPU”(見下圖)。
在“管理3D設(shè)置”界面中還需要進(jìn)行強(qiáng)制選擇才能夠成功應(yīng)用Quadro SLI。這里又有3種不同的加速模式,其中“分割幀渲染”和“交替幀渲染”即為SFR和AFR兩種方式,前者對顯卡輸出的每一幀畫面分割為2部分由兩塊顯卡來渲染,而后者則是將奇數(shù)幀和偶數(shù)幀分別交給不同的顯卡渲染。SFR多用于游戲,而基于OpenGL的3D圖形設(shè)計(jì)通常采用AFR的效果比較好。
右邊的“程序設(shè)置”菜單中,顯卡驅(qū)動(dòng)識別到了安裝的UGS NX軟件,在這里也能單獨(dú)設(shè)置針對UGS NX的SLI性能模式。
1.SPECViewperf 10
我們分別記錄了Quadro FX 5600單卡、強(qiáng)制使用交替幀渲染1(AFR1)和強(qiáng)制使用交替幀渲染2(AFR2)三種設(shè)置下的SPECviewperf 10測試成績??梢钥闯?,專業(yè)顯卡SLI在ugnx-01子項(xiàng)的提升接近1倍;ensight-03和tcvis-01(模擬的是UGS Teamcenter Visualization Mockup可視化仿真應(yīng)用)兩項(xiàng)分別有58%和36%的優(yōu)勢;其余項(xiàng)目除了3dsmax-04和catia-02兩個(gè)之外SLI也存在小幅領(lǐng)先。另外我們還發(fā)現(xiàn)AFR1在proe-04和sw-01的表現(xiàn)相對好一些,而AFR2在maya-02一項(xiàng)上效果更明顯。
Quadro FX 5600 SLI SPECviewperf成績
下面我們列出了SPEC網(wǎng)站公布的viewperf測試結(jié)果列表,供大家參考:
SPECviewperf 10 TM
Benchmark Results Summary
注:以上表格來源于SPEC官方網(wǎng)站,2008年12月17日
我們測試的Quadro FX SLI系統(tǒng)分別在ensight-03、tcvis-01、ugnx-01三項(xiàng)上超過了SPEC網(wǎng)站上公布的最好成績,對比系統(tǒng)中包括了NVIDIA Quadro FX 3700 SLI和ATI FireGL V7700這樣強(qiáng)勁的對手。然而SPECvierperf 10畢竟只是一個(gè)測試軟件,下面我們來進(jìn)行實(shí)際應(yīng)用測試,看看專業(yè)顯卡SLI真正的價(jià)值有多大。
2.SPECapc for UGS NX 4
我們先在沒有修改UGS NX 4軟件中任何設(shè)置的情況下運(yùn)行了測試(以前我們也都是這樣做的),發(fā)現(xiàn)Quadro FX 5600 SLI的性能提升幅度并沒有在SPECvierperf測試中那么大。這里只對比了單卡和AFR1設(shè)置的測試結(jié)果,AFR2(強(qiáng)制使用交替幀渲染2)在NX 4中的成績與AFR1相似而略低,故不再列出。同時(shí)我們發(fā)現(xiàn)Quadro FX 5600單卡在AMD架構(gòu)的HP xw9400工作站上表現(xiàn)還不如xw4600工作站上的FX 3700(詳見:“08年最值得期待的專業(yè)顯卡-Quadro FX 3700深入對比測試”一文),不知道AMD最新的“shanghai(上海)”CPU能有多大的改觀? #p#page_title#e#
下面是SPEC網(wǎng)站公布的SPECapc for UGS NX 4測試結(jié)果:
SPECapc SM UGS NX 4 TM
Benchmark Results Summary
注:以上表格來源于SPEC官方網(wǎng)站,2008年12月17日
參考系統(tǒng)中Fujitsu Siemens CELSIUS V840配置了2塊nVidia Quadro FX3700組成SLI,其圖形得分高達(dá)21.56。難道是因?yàn)樗腛pteron 2222 3.016GHz CPU主頻超過了我們測試的系統(tǒng)?不過根據(jù)我們以往的經(jīng)驗(yàn),SPECapc for UGS NX 4測試的圖形成績瓶頸在于顯卡而不是CPU。因此還有必要做進(jìn)一步的研究。
上圖摘自SPEC網(wǎng)站上參考系統(tǒng)運(yùn)行測試時(shí)的相關(guān)設(shè)置信息,其中“View frustrum culling”和“translucency”(透明)2個(gè)選項(xiàng)是關(guān)閉的。
在UGS NX 4軟件中,我們找到了“View frustum culling”這個(gè)選項(xiàng),它的默認(rèn)設(shè)置為打勾狀態(tài)(另外一項(xiàng)本身就是關(guān)閉的)。從字面上解釋的意思應(yīng)該是“隱藏面剔除”或者“切除不可見部分”。
View frustum culling打開
上圖和下圖分別為打開和關(guān)閉“View frustum culling”選項(xiàng)時(shí)模型Studio(展示)瀏覽方式的實(shí)際效果,我們看到包括透明頂蓋下方在內(nèi)的模型細(xì)節(jié)沒有任何顯示上的差別。不顯示隱藏(被遮擋)部分的圖形能夠有效節(jié)約顯示子系統(tǒng)的資源,提高速度,類似的技術(shù)在3D游戲中也有應(yīng)用。既然是SPEC官方推薦的設(shè)置,應(yīng)該不算是“作弊”,關(guān)閉該選項(xiàng)(見下圖)后我們又運(yùn)行了一遍測試。
View frustum culling關(guān)閉
這一次,Quadro FX 5600 SLI(AFR1)的圖形得分達(dá)到驚人的27.62(見下圖),而單卡的成績也提高了不少。此時(shí)專業(yè)顯卡SLI的領(lǐng)先幅度為39.7%,雖然距離理論的一倍性能提升還有相當(dāng)大的差距,但在百尺竿頭,能夠更進(jìn)一步已經(jīng)相當(dāng)不簡單了。
不知道這是不是SPEC系列圖形測試中又一項(xiàng)新的世界紀(jì)錄?
我們又列出了修改軟件“View frustum culling”設(shè)置前后(上方和下方)不同測試模型的單項(xiàng)成績。在默認(rèn)設(shè)置下,“中等大小模型完全著色”一項(xiàng)SLI的優(yōu)勢最大,其它幾個(gè)模型也有不同程度的提升,只有小模型2出現(xiàn)了下降;關(guān)閉View frustum culling選項(xiàng)之后,Quadro FX 5600 SLI在部分項(xiàng)目的領(lǐng)先幅度有所加大,“中等模型線框”一項(xiàng)也開始明顯占優(yōu),而小模型2依然處于落后??磥韺I(yè)顯卡SLI并不是在所有的UGS NX模型應(yīng)用中都有良好的效果。
下面的圖表為Quadro SLI優(yōu)勢最大的一項(xiàng)——“中等模型完全著色” 測試的具體時(shí)間記錄,數(shù)值越小代表圖形操作的幀速度越快。
前面幾種圖形操作Quadro FX 5600 SLI都只用了單卡一半左右的時(shí)間,這樣的情況和前文中SPECvierperf 10測試中ugnx-01子項(xiàng)的水平相當(dāng);而最后一項(xiàng)主要取決于CPU的操作SLI耗時(shí)比單卡還要多出0.7秒。
上方和下方分別列出了修改軟件“View frustum culling”設(shè)置前后模型旋轉(zhuǎn)測試的成績匯總(時(shí)間總和的反比)。這部分測試包括每個(gè)模型在各種顯示方式下分別進(jìn)行200次旋轉(zhuǎn)操作(并不是指旋轉(zhuǎn)200周,而是指畫面的每一幀動(dòng)作)。我們看到采用UGS NX默認(rèn)設(shè)置時(shí)Quadro FX 5600 SLI在“線框”和“著色不顯示邊框”2項(xiàng)中還出現(xiàn)了落后;而當(dāng)關(guān)閉了“View frustum culling”以后除了線框之外的其它模式下SLI都大幅領(lǐng)先50%左右。
Quadro專業(yè)顯卡SLI適合那些應(yīng)用?
除了UGS NX之外,我們還測試了Quadro FX 5600 SLI在Maya和SolidWorks中的表現(xiàn)。由于NVIDIA專業(yè)顯卡驅(qū)動(dòng)針對Maya的優(yōu)化設(shè)置中“覆蓋(Overlay)”一項(xiàng)是默認(rèn)打開的,因此強(qiáng)行啟用SLI后速度不升反降,如果關(guān)閉Overlay也無法獲得性能上的改善;至于SolidWorks,該軟件對顯卡的要求不是太高,Quadro FX 1700就能夠滿足絕大多數(shù)的應(yīng)用,如果用1片Quadro FX 5600已經(jīng)屬于浪費(fèi),打開SLI之后測試成績幾乎沒有變化。 #p#page_title#e#
那么,專業(yè)顯卡SLI還適合其它方面的應(yīng)用嗎?我們注意到SPECviewperf 10測試中提升比較大的ensight-03和tcvis-01兩項(xiàng),它們都屬于可視化一類的應(yīng)用。其中tcvis-01對應(yīng)的UGS Teamcenter Visualization Mockup軟件是Siemens PLM(產(chǎn)品生命周期管理)系列軟件中的一員;而EnSight軟件用于將ANSYS等分析軟件生成的工程和科學(xué)數(shù)據(jù)進(jìn)行可視化。由于手頭沒有合適的模型,我們沒有進(jìn)行相關(guān)的測試。
在可視化應(yīng)用中還包括RTT和Opticore這兩個(gè)廣泛應(yīng)用于汽車模型實(shí)時(shí)仿真的軟件,它們也可以歸類為VR(虛擬現(xiàn)實(shí))應(yīng)用。二者共同的特點(diǎn)是對顯示質(zhì)量和畫面精細(xì)程度的要求非??量蹋ǔP枰ㄟ^顯卡開啟高倍數(shù)的FSAA(全屏幕反鋸齒)功能。而Quadro專業(yè)顯卡SLI能夠?qū)慰ㄗ罡咧С值腇SAA級別提高一倍,例如1塊Quadro FX 5600顯卡支持32X FSAA,而2塊Quadro FX 5600組成SLI之后就能夠支持到64X FSAA。Quadro Plex外置式高端顯示方案就是針對這種應(yīng)用而設(shè)計(jì)的,其中的多顯卡互聯(lián)用的也是SLI技術(shù)。
作為HP惠普工作站產(chǎn)品增值合作伙伴和ELSA艾爾莎專業(yè)產(chǎn)品全國分銷平臺的北京科卓同創(chuàng)信息技術(shù)有限公司,長期以來一直致力于為用戶提供性價(jià)比更高的圖形工作站及相關(guān)產(chǎn)品解決方案