術(shù)業(yè)有專攻 Quadro FX380/FX1800評(píng)測(cè)
NVIDIA與AMD之間在桌面的競(jìng)爭(zhēng)愈發(fā)激烈,轉(zhuǎn)眼之間,Geforce系列顯卡已經(jīng)進(jìn)入第十代陣營(yíng)。與之相比,專業(yè)繪圖領(lǐng)域的Quadro則是顯得有些不溫不火,AMD旗下FireGL系列顯卡雖然也有不小的市場(chǎng)份額,但兩家廠商的產(chǎn)品更顯得涇渭分明,主攻平面與主攻3D設(shè)計(jì)各不沖突,簡(jiǎn)單來說,就是自己玩自己的。在這種情況下,NVIDIA在2009年上半年終于更新Quadro的產(chǎn)品線,Quadro產(chǎn)品線終于也進(jìn)入第十代產(chǎn)品。NVIDIA Quadro更新的產(chǎn)品主要是針對(duì)臺(tái)式機(jī)和圖形工作站的FX系列,包括FX3800、FX1800、FX580和FX380。
實(shí)話實(shí)說,如果只是這種規(guī)格提升并沒啥太大的驚喜,畢竟顯卡架構(gòu)升級(jí)都會(huì)帶來性能提升,單純提高多邊形生成數(shù)量和速度意義不大,還沒用等到顯卡全部能力都得以發(fā)揮就可能從市場(chǎng)淘汰。真正值得欣慰的是NVIDIA將CUDA帶入專業(yè)繪圖領(lǐng)域,特別是FX380和FX580這種面向中低端領(lǐng)域的產(chǎn)品也保留通用計(jì)算能力,是一件值得高興的事情。利用CUDA,顯卡的性能能夠發(fā)揮得更出色,而且在傳統(tǒng)3D制圖領(lǐng)域之外,向視頻編輯領(lǐng)域進(jìn)軍。不過保留CUDA可能讓FX系列產(chǎn)品對(duì)CX系列產(chǎn)品造成沖擊,如何避免這種情況,是NVIDIA需要面對(duì)的話題。不過對(duì)消費(fèi)者來說,CUDA出現(xiàn)絕對(duì)是利好的消息,不僅提升了顯卡的附加性能,也延長(zhǎng)了顯卡的壽命。全部采用C語言作為編程語言的CUDA能夠提供大量的高性能計(jì)算指令開發(fā)能力,使開發(fā)者能夠在GPU的強(qiáng)大計(jì)算能力的基礎(chǔ)上建立起一種效率更高的密集數(shù)據(jù)計(jì)算解決方案。#p#page_title#e#
關(guān)于顯卡的做工,我們無需太過挑剔。與消費(fèi)級(jí)的Geforce系列顯卡不同的是,Quadro系列產(chǎn)品頗有些“山寨”的味道——沒有夸張的散熱器也沒用鮮艷的PCB顏色,電感電容數(shù)量也不能壓倒同級(jí)別的Geforce顯卡。實(shí)際上由于顯卡絕對(duì)屬于NVIDIA的“原廠品質(zhì)”,所以顯卡做工論在專業(yè)級(jí)顯卡身上并不適用,因?yàn)槲覀儧]有更多的同類型產(chǎn)品可供選擇,想要玩專業(yè),做的簡(jiǎn)陋也要忍受。
名稱 |
FX1800 |
FX1700 |
FX380 |
FX370 |
CUDA并行處理器數(shù)量 |
64 |
32 |
16 |
16 |
顯存容量 |
786MB |
512MB |
256MB |
256MB |
顯存帶寬 |
192bit |
128bit |
128bit |
64bit |
顯存吞吐量 |
38.4GB/s |
12.8GB/s |
22.4GB/s |
6.4GB/s |
PCI-Express規(guī)范 |
2.0 |
2.0 |
2.0 |
2.0 |
精確度 |
FP32 |
FP32 |
FP32 |
FP32 |
輸出接口 |
DUAL-LINK DVI+Dispalyport |
DUAL-LINK DVI |
DUAL-LINK DVIX 2 |
DVI X 2 |
TDP |
59 |
42 |
34W |
-- |
SLI/SDI |
NO/NO |
NO/NO |
NO/NO |
NO/NO |
除了架構(gòu)改良之外,全新的380和1800支持更多特效,具體體現(xiàn)在: 30位色彩精度 30位色彩保真度(每種色彩10位)可實(shí)現(xiàn)數(shù)以十億計(jì)的色彩變化,而非百萬種色彩變化。在最大動(dòng)態(tài)范圍內(nèi)呈現(xiàn)出豐富、絢麗的圖像質(zhì)量。 先進(jìn)的色彩壓縮、無失真Z坐標(biāo)壓縮(Early Z-Cull)技術(shù) 全景抗鋸齒(FSAA) 最高32倍速全景抗鋸齒大大減少了視覺混疊假象或鋸齒摂現(xiàn)象,呈現(xiàn)出極其逼真的場(chǎng)景。 硬件3D窗口剪輯 硬件加速的剪輯區(qū)(窗口與幀緩存之間的數(shù)據(jù)傳輸機(jī)制)通過提高色彩緩存與幀緩存之間的傳輸速度,提升了整體圖形性能。 支持HDMI 可將視頻與音頻傳輸?shù)礁咔咫娨曇约捌渌С諬DMI的設(shè)備上(通過HDMI轉(zhuǎn)接器)。 最高工作站級(jí)應(yīng)用程序性能 下一代架構(gòu)在幾何學(xué)以及填充率方面的提升高達(dá)兩倍以上,能夠?yàn)閷I(yè)級(jí)CAD(計(jì)算機(jī)輔助設(shè)計(jì))、DCC(數(shù)字內(nèi)容制作)以及科學(xué)應(yīng)用程序提供行業(yè)最高性能。 下一代頂點(diǎn)以及像素可編程性 NVIDIA PureVideo HD技術(shù) 通過在支持HDCP的平臺(tái)以及HDCP電路上將高清電影解碼加速與后期處理融為一體并整合到高清電影播放器中,為用戶帶來PC上的頂級(jí)高清電影體驗(yàn)。 本技術(shù)能夠?yàn)樗幸曨l格式以及精美的HD DVD與藍(lán)光(Blu-ray)電影實(shí)現(xiàn)絕佳畫質(zhì),同時(shí)保持極低的CPU占用率和功耗。 NVIDIA 統(tǒng)一GPU架構(gòu) 業(yè)界首款統(tǒng)一架構(gòu)能夠動(dòng)態(tài)地分配計(jì)算、幾何、著色以及像素處理能力,從而實(shí)現(xiàn)優(yōu)化的GPU(圖形處理器)性能。 nView多顯示器技術(shù) NVIDIA nView 先進(jìn)的顯示器軟件可實(shí)現(xiàn)最大靈活度,讓用戶能夠選用單臺(tái)超大顯示器或多臺(tái)顯示器。該軟件為最終用戶帶來了前所未有的桌面控制體驗(yàn),提升了生產(chǎn)率。 符合PCI Express 2.0標(biāo)準(zhǔn) 數(shù)據(jù)傳輸速率提升一倍,最高可達(dá)每巷道5 GT/秒,雙向總帶寬高達(dá)16 GB/秒(每個(gè)方向8 GB/秒)。 支持OpenGL四方體緩沖立體 OpenGL 四方體緩沖立體為專業(yè)應(yīng)用帶來流暢和逼真的 3D立體體驗(yàn)。 兩個(gè)DisplayPort數(shù)字顯示器接口 兩個(gè)DisplayPort接口支持超高分辨率平板顯示器(最高2560 x 1600),可呈現(xiàn)出細(xì)膩逼真的驚人的圖像質(zhì)量。 一個(gè)雙鏈路數(shù)字顯示器接口 雙鏈路TMDS發(fā)送器支持超高分辨率平板顯示器(最高可達(dá)3840 x 2400 @ 24Hz),可呈現(xiàn)出細(xì)膩逼真的驚人的圖像質(zhì)量。 超靜音設(shè)計(jì) 帶來強(qiáng)勁性能的同時(shí)最大程度減少噪音,為用戶營(yíng)造安靜的桌面環(huán)境。 統(tǒng)一的驅(qū)動(dòng)程序架構(gòu)(UDA) NVIDIA統(tǒng)一驅(qū)動(dòng)程序架構(gòu)確保了軟件驅(qū)動(dòng)程序向前和向后的兼容性。 由于所有NVIDIA產(chǎn)品均在相同的驅(qū)動(dòng)程序軟件下工作,因此簡(jiǎn)化了升級(jí)為NVIDIA新產(chǎn)品的過程。#p#page_title#e# 測(cè)試平臺(tái) 名稱 CPU Intel Core2 Duo 6750 主板 冠盟P45 內(nèi)存 威剛DDR2 1066MHz 硬盤 希捷7200.12 1TB 顯示器 DELL 2405 顯示卡驅(qū)動(dòng) Quadro Driver Release 186 MAXTreme 名稱 X380 X1800 9800GT Graphics 3.88 2.25 14.26 Hardware Shaders 6.23 4.37 9.98 CPU Render 4.14 4.12 4.73 沒有安裝MAXTreme驅(qū)動(dòng),FX系列顯卡的運(yùn)算能力就明顯好于Geforce系列顯卡,在安裝之后,兩者差距非常明顯。憑借較高的核心運(yùn)算能力和更高的貸款,X1800領(lǐng)先X380性能接近0.5以上,硬件頂點(diǎn)渲染能力差別比較明顯,CPU之間的差距比較小。對(duì)比X1800和9800GT,可以看到專業(yè)卡與游戲卡之間的性能差別。 SPECapc for Maya 6.5 這個(gè)測(cè)試項(xiàng)目隊(duì)線框、著色、紋理、高亮度紋理和紋理模塊進(jìn)行測(cè)試,測(cè)試過程中還會(huì)測(cè)試大紋理和多視點(diǎn)性能測(cè)試。SPECapc for Maya 6.5由30項(xiàng)單獨(dú)的測(cè)試組成,其中的27項(xiàng)運(yùn)行3遍。最終得分基于圖形占70%,CPU性能占20%,I/O占10%。 Overall Scores X380 X1800 9800GT GFX 7.47 8.26 3.72 I/O 5.65 5.69 5.03 CPU 8.43 8.33 8.35 Overall 7.44 7.97 5.98 嚴(yán)格來說Maya2009的測(cè)試成績(jī)更能放映X1800與X380之間的性能差距,但測(cè)試過程中,9800GT顯卡頻繁報(bào)錯(cuò),導(dǎo)致測(cè)試成績(jī)不具備對(duì)比性,所以只好繼續(xù)使用MAYA 6.5的測(cè)試成績(jī)。測(cè)試成績(jī)可以看到X1800在顯卡測(cè)試項(xiàng)目領(lǐng)先幅度接近10%左右。如果使用此款軟件進(jìn)行復(fù)雜的建模設(shè)計(jì),X380也可以輕松完成項(xiàng)目。相比之下,Geforce 9800GT的性能差距相當(dāng)明顯,接近50%左右,整體性能差距也在20%左右。 SPECapc for SolidWorks 2007 SolidWorks 2007的測(cè)試項(xiàng)目中使用了大量形狀不同的CAD和CAM solid模型,其中最大的模型由313萬個(gè)頂點(diǎn)組成的發(fā)動(dòng)機(jī)引擎,測(cè)試項(xiàng)目不僅可以考慮顯卡帶寬的吞吐量,也可以考驗(yàn)顯卡頂點(diǎn)引擎的運(yùn)算能力。測(cè)試項(xiàng)目包括8個(gè)測(cè)試項(xiàng)目: 考驗(yàn)IO吞吐量的密集型操作,考驗(yàn)整機(jī)性能的處理器密集運(yùn)算,以及6個(gè)不同的圖形測(cè)試。一個(gè)單一的數(shù)字得自全部8項(xiàng)測(cè)試標(biāo)準(zhǔn)化得分的幾何平均數(shù)加權(quán)。當(dāng)然,這些測(cè)試不是SolidWorks2007的全部,體驗(yàn)專業(yè)卡的特性就在于此,只有3D專業(yè)顯卡才能夠支持SolidWorks中的ReadView功能,通過硬件加速顯示模型,這是其顯卡不具備的功能。 X380 X1800 GTS250 Complete 157.30 168.89 159.23 Graphics 52.47 61.69 51.45 Processon 45.41 46.36 43.36 I/O 29.42 61.14 35.50 測(cè)試成績(jī)讓人感覺驚訝,專業(yè)卡不敵游戲卡。其實(shí)沒什么好奇怪,GTS250本身就是面向中高端的產(chǎn)品,3D運(yùn)算能力不俗,成績(jī)落后X1800不足10%也屬于正常。X380與GTS250以及X1800的差距并不明顯,也就是說GTS250也可以使用在Solidworks2007的工作環(huán)境中。 SPECapc for Lightwave 9.6 LightWave 9.6的測(cè)試項(xiàng)目相當(dāng)復(fù)雜,測(cè)試需要使用11個(gè)模型模型,模型大小從6.4萬個(gè)模型到175萬個(gè)多邊形構(gòu)成,通過構(gòu)建多邊形、移動(dòng)多邊形、縮放以及快速旋轉(zhuǎn)測(cè)試3D顯卡的整體運(yùn)算能力。 X380 X1800 GTS250 Lnteractive 1.98 2.15 1.37 Render 3.56 3.56 3.57 Multiask 2.83 2.86 2.89 測(cè)試結(jié)果證明GTS250與X380和X1800之間略有差距,而且差距比較明顯,特別是在Lnteractive的得分中,差距接近50%以上。在1900X1200的高分辨率下,專業(yè)繪圖卡的性能優(yōu)勢(shì)比較明顯。 SPECapc for UGS NX 4 由一個(gè)在發(fā)動(dòng)機(jī)工業(yè), UGS, 和SPECapc之間的合作努力完成。密集化的SUV(車身模型包含了超過30000個(gè)顯示線條,變速箱模型包含了84000個(gè)顯示線條。測(cè)試項(xiàng)目包括旋轉(zhuǎn)、縮放)全景、前端、后端透視、預(yù)覽等操作。測(cè)試項(xiàng)目記錄圖形、CPU、磁盤盒I/O操作結(jié)果,屬于整個(gè)系統(tǒng)性能的復(fù)雜測(cè)試。
X380 X1800 GTS250 Total I/O 2.22 2.29 2.02 Total CPU 3.62 3.66 3.81 Total Graphics 6.12 8.34 4.27 Total 5.01 6.03 4.98
FX380的散熱器,看起來很單薄#p#page_title#e#
128位精度圖形管線
每個(gè)色彩分量(RGBA)都具備完整的IEEE 32位浮點(diǎn)精度,可在最大動(dòng)態(tài)范圍內(nèi)實(shí)現(xiàn)上百萬種色彩變化。 在著色、濾波、紋理以及合成方面樹立了圖像清晰度和畫質(zhì)的全新標(biāo)準(zhǔn)。 在視覺特效處理方面可實(shí)現(xiàn)前所未有的渲染圖像質(zhì)量。
改善了管線色彩壓縮以及無失真Z坐標(biāo)壓縮(Early Z-Cull)技術(shù),提升了有效帶寬、渲染效率和性能。
兼容行業(yè)標(biāo)準(zhǔn)架構(gòu)
兼容Intel/AMD的x86 32位以及64位微處理器架構(gòu)以及Microsoft/Linux操作系統(tǒng)。
Cg高級(jí)圖形著色器語言
Cg — 圖形專用“C”語言 — 是一種開放標(biāo)準(zhǔn)的高級(jí)編程語言,這種語言能夠利用可編程GPU的強(qiáng)大動(dòng)力。 NVIDIA Quadro FX可編程圖形管線利用高級(jí)著色語言來創(chuàng)造實(shí)時(shí)的逼真效果并將這些效果整合到3D模型、場(chǎng)景以及設(shè)計(jì)中。 想要在CAD(計(jì)算機(jī)輔助設(shè)計(jì))、DCC(數(shù)字內(nèi)容制作)以及科學(xué)應(yīng)用程序中創(chuàng)造出實(shí)時(shí)、逼真的視覺效果,該語言是一種主要的途徑。
高性能顯示器輸出
400MHz RAMDAC(隨機(jī)存取存儲(chǔ)器數(shù)模轉(zhuǎn)換器)以及最多兩個(gè)DisplayPort數(shù)字接口能夠驅(qū)動(dòng)市面上最高分辨率的數(shù)字顯示器。
8K紋理以及渲染處理
能夠從8K x 8K的表面采集紋理以及對(duì)這些表面進(jìn)行渲染。 本特性有利于這些需要最高分辨率和最高圖像質(zhì)量的處理任務(wù)。
下一代頂點(diǎn)以及像素可編程性Shader Model 4.0
面向OpenGL以及下一代DirectX 10業(yè)界領(lǐng)先的專業(yè)應(yīng)用程序,shader model 4.0參考標(biāo)準(zhǔn)可實(shí)現(xiàn)更高級(jí)別的性能與逼真效果。
Quadro FX GPU引入了無限長(zhǎng)度頂點(diǎn)程序以及動(dòng)態(tài)流量控制技術(shù),消除了之前對(duì)著色器程序復(fù)雜度與結(jié)構(gòu)的限制。 Quadro FX GPU能夠?qū)崿F(xiàn)實(shí)時(shí)圖形系統(tǒng)從前不敢想象的復(fù)雜特效。
CUDA架構(gòu)
NVIDIA CUDA 是 Quadro專業(yè)級(jí)GPU(圖形處理器)的一種革命性并行計(jì)算架構(gòu),該架構(gòu)在視頻編碼、圖像處理以及精確物理效果等方面可實(shí)現(xiàn)巨大性能突破。
NVIDIA圖形應(yīng)用程序接口(API)擴(kuò)展
NVIDIA為L(zhǎng)inux以及Windows提供了一套標(biāo)準(zhǔn)圖形API的擴(kuò)展,讓應(yīng)用程序能夠最大限度地利用最前沿的GPU功能。
NVIDIA高精度高動(dòng)態(tài)范圍(HDR)技術(shù)
在著色、濾波、紋理填充以及合成方面的超高浮點(diǎn)性能樹立了圖像清晰度與畫質(zhì)的全新標(biāo)準(zhǔn)。 在視覺特效處理方面可實(shí)現(xiàn)前所未有的渲染圖像質(zhì)量。
由于測(cè)試平臺(tái)相同,I/O與CPU和匯總的成績(jī)幾乎相同,差距不大,只有顯卡得分選項(xiàng)略有差別,X1800幾乎領(lǐng)先GTS250接近一倍以上,在大量多線條的考核下,吞吐量與多邊形生成能力有優(yōu)勢(shì)的GTS250甚至敵X380,可以充分專業(yè)繪圖卡的優(yōu)勢(shì)所在。
SPECviewperf 10
Viewperf 10.0 是 SPECopc發(fā)布的大型 3D 圖形測(cè)試工具,對(duì)大量圖形設(shè)計(jì)軟件進(jìn)行綜合性測(cè)試,其中包括 3dsmax-04、catia-02、ensight-03、maya-02、proe-04、sw-01、tvis-01、ugnx-01,分別對(duì)應(yīng) 3dsmax、CATIA、EnSight、Maya、Pro/Engineer、Solidworks、UGS Teamcenter Visualization Mockup、UGS NX 等多個(gè)應(yīng)用軟件的對(duì)應(yīng)測(cè)試項(xiàng)目。SPECviewperf 10與apc出品的測(cè)試軟件不同,后者注重實(shí)戰(zhàn)效果,必須安裝終端軟件才能運(yùn)行Benchmark,而且測(cè)試得分評(píng)價(jià)系統(tǒng)相當(dāng)復(fù)雜,SPECviewperf 10的測(cè)試比較簡(jiǎn)單,而且考察的是顯卡的綜合性能。簡(jiǎn)單理解如果SPECviewperf 10的得分領(lǐng)先比較明顯,在設(shè)計(jì)方面的性能表現(xiàn)也就會(huì)越出眾。
X380 |
X1800 |
GTS250 |
|
3DSMAX |
39.26 |
44.35 |
12.88 |
Catia |
47.25 |
52.55 |
8.81 |
Ensight |
30.54 |
47.44 |
18.27 |
Maya |
123.04 |
147.07 |
26.51 |
Proe |
40.90 |
45.11 |
9.70 |
SolidWorks |
61.62 |
100.02 |
17.30 |
Tcvis |
17.08 |
26.85 |
4.32 |
UGNX |
13.80 |
31.15 |
9.56 |
綜合測(cè)試可以清楚顯示游戲顯卡與專業(yè)繪圖卡在OpenGL模式下的差距。在常規(guī)的驅(qū)動(dòng)下,X380的領(lǐng)先幅度非常明顯,特別是在MAYA、ProE和SolidWorks領(lǐng)先接近3倍以上,特別是MYA的測(cè)試項(xiàng)目圖形與此前進(jìn)行Spec for MAYA 6.5的測(cè)試項(xiàng)目幾乎相同,但性能差距在6倍左右。Tcvis與3DSMAX的項(xiàng)目性能差距接近4倍左右。
由此可見,在D3D渲染引擎下,如果不考慮超大型模型的渲染穩(wěn)定性的情況下,游戲顯卡也勉強(qiáng)應(yīng)付較為復(fù)雜的渲染,但在OpenGL模式下,專業(yè)顯卡的渲染性能絕非游戲顯卡可以對(duì)比,即使不是一個(gè)級(jí)別的顯卡,恐怕也難以匹敵。#p#page_title#e#
測(cè)試總結(jié)
由于我們沒有找到FX370和FX1700進(jìn)行對(duì)比測(cè)試,所以FX380和FX1800的測(cè)試成績(jī)也沒用直接的競(jìng)爭(zhēng)對(duì)手,GTS250雖然規(guī)格高于FX380和FX1800,但在OpenGL的渲染模式中全面敗陣。對(duì)大多數(shù)入門級(jí)消費(fèi)者來說,或許一片價(jià)格低廉的游戲顯卡或許也可以專業(yè)設(shè)計(jì),但在超大型的模型面前,游戲顯卡無法滿足穩(wěn)定性的需求,這是致命的死穴。舉例說明,如果想要在3DS中渲染一個(gè)超過2GB的模型文件,Geforce系列顯卡往往以死機(jī)告終,這不是顯卡快與慢的問題,而是設(shè)計(jì)理念不同,正所謂術(shù)業(yè)有專攻。
對(duì)專業(yè)繪圖卡的用戶來說,并沒有更多的選擇空間,與FX370和FX1700相比,由于核心與架構(gòu)進(jìn)步帶來的改良肯定是明顯的,CUDA與全新的DX10渲染就是最大的吸引力,對(duì)入門級(jí)工作站來說FX380就是一個(gè)不錯(cuò)的選擇。FX1800的售價(jià)性能更好,但售價(jià)也略高一些,對(duì)經(jīng)常渲染更高規(guī)格的用戶來說,X1800可以節(jié)省下更多的時(shí)間。此外還有一般游戲卡上暫時(shí)還很罕見的 DisplayPort 支持,對(duì)于需要這些特性的行業(yè)用戶來說,Quadro FX 1800 是更理想的選擇