Nvidia Tesla和Quadro、GeForce的區(qū)別
Tesla和Quadro、GeForce的區(qū)別
記者:從硬件層面看,Tesla配備的顯存容量比GeForce更大。但Quadro也有一些4GB顯存的版本。NVIDIA如何說服消費者購買Tesla產(chǎn)品而不去選擇價格更便宜的Quadro或GeForce呢?
Andy:這里其實有兩個問題。
確實有4GB顯存的Quadro顯卡,但是其價格遠(yuǎn)高于Tesla。Quadro支持高速OpenGL渲染,速度遠(yuǎn)高于GeForce,因此這項技術(shù)的價格自然高于Tesla。Tesla不支持OpenGL。
記者:在后續(xù)產(chǎn)品及芯片技術(shù)規(guī)格上,Tesla是沿用同期的GeForce和Quadro產(chǎn)品,還是采用只為計算用途而重新設(shè)計的芯片和架構(gòu)?
Andy:當(dāng)前的策略是在Tesla產(chǎn)品線中采用具備特殊特性的標(biāo)準(zhǔn)GPU?,F(xiàn)在,GeForce、Quadro以及Tesla中的計算特性是相同的,但是在將來的產(chǎn)品中,Tesla將擁有專為高性能計算而設(shè)計的其它特性。這些產(chǎn)品線中的性能級別也會有所變化。
GPU與CPU計算的不同
記者:Tesla基于NVIDIA CUDA,該技術(shù)最顯著的特點就是能夠利用GPU的并行計算能力,在大規(guī)模、高帶寬計算中有著極大的優(yōu)勢。 但是,面對串行計算密集型任務(wù),Tesla是否有解決辦法呢?
Andy:GPU及其內(nèi)部的CUDA架構(gòu)是專為并行計算而設(shè)計的。
串行計算是一種有很大區(qū)別的架構(gòu),這種架構(gòu)的設(shè)計目的是為了解決不同的問題。CPU執(zhí)行指令的方式就是一個接著另一個地執(zhí)行。CPU中有許多能夠加速串行計算的技術(shù)。高速緩存、無次序執(zhí)行、超標(biāo)量技術(shù)、分支預(yù)測……均為抽取指令的技術(shù)或一系列指令的串行級并行機制。CPU對片上高速緩存的設(shè)計與容量的依賴也非常大。如果程序大小與CPU高速緩存容量不匹配,那么該程序在CPU上的運行速度將會很慢。
GPU內(nèi)部的并行計算架構(gòu)圍繞兩個基本概念而設(shè)計。首先,程序中的數(shù)據(jù)可分成許多個部分,而為數(shù)眾多的核群可以并行地處理這些數(shù)據(jù)。第二個架構(gòu)方面的設(shè)想是,數(shù)據(jù)將不與高速緩存匹配。例如在圖形計算或石油天然氣數(shù)據(jù)處理上,數(shù)據(jù)量可能會達(dá)到兆字節(jié)甚至是太字節(jié),用高速緩存來容納如此巨大的數(shù)據(jù)量幾乎是不切實際的??紤]到這兩點設(shè)想,GPU被設(shè)計為能夠使用數(shù)以千計的線程,所有線程均并行地執(zhí)行,能夠訪問巨大容量的本地存儲器。在最新的Tesla產(chǎn)品中,每顆GPU均配備4GB存儲器,可容納待執(zhí)行的數(shù)據(jù)。同時針對反復(fù)使用的數(shù)據(jù),還設(shè)有較小的片上存儲空間,GPU所配備的巨大容量存儲器等同于CPU內(nèi)部的高速緩存,只是容量大了許多倍而已。 #p#page_title#e#
Tesla在高性能計算領(lǐng)域
記者:目前GPU系統(tǒng)在全球高性能計算機TOP500排行榜中最好的成績是第29位——東京大學(xué)的Tsubame超級計算機。 在您看來,到2010年之前,Tsubame是否有機會躋身世界十強超級計算機? 還有哪些超級計算機有希望躋身世界十強或五百強?
Andy:我不能代表東京工業(yè)大學(xué)超級計算領(lǐng)軍人物的意見。但東京工業(yè)大學(xué)全球科學(xué)資訊和計算中心總監(jiān)Satoshi Matsuoka博士曾公開表示,他打算使用GPU在2010年打造出一臺榮登世界最快榜單的計算機。還有更多使用GPU打造的超級計算機。美國國家超級運算應(yīng)用中心(NCSA)以及法國原子能委員會(CEA)是兩家著名的超級計算中心,他們將躋身下一屆世界五百強榜單。
記者:當(dāng)前,NVIDIA GPU的雙精度性能僅相當(dāng)于單精度的8%。 到2010年之前,你認(rèn)為這種性能可以有多大的改善? NVIDIA會采取怎樣的技術(shù)手段來確保這種性能提升呢?
Andy:當(dāng)前10系列GPU是首批擁有雙精度的NVIDIA處理器。過去這種性能曾作為GPU的一個模塊添加在GPU當(dāng)中。而在這一代產(chǎn)品中,我們?yōu)槊拷M八個單精度處理器加入了一個雙精度單元。隨著快速發(fā)展,未來的GPU將擁有更多雙精度單元。由于GPU的性能一般每年都會翻一番,未來雙精度性能將至少比當(dāng)前的速度快5倍。
Andy:我們與打算發(fā)布超級計算軟件的獨立軟件供應(yīng)商都進(jìn)行了積極的開發(fā)工作。分子動力學(xué)領(lǐng)域的《NAMD/VMD》以及《GROMACS》是為群集GPU發(fā)布的兩個應(yīng)用程序例子。在美國的超級計算展會上,我們還展示了許多用于石油天然氣領(lǐng)域地震處理、量子化學(xué)以及Ansys有限元設(shè)計的應(yīng)用程序。
對于想要自己設(shè)計和開發(fā)應(yīng)用程序的開發(fā)人員,用于CUDA架構(gòu)的并行計算開發(fā)C語言編譯器可從NVIDIA網(wǎng)站上免費下載。Portland Group的Fortran等其它編譯器也正在陸續(xù)推出。有很多來自NVIDIA以及其它來源的程序庫,這些庫使應(yīng)用程序更易于開發(fā)。針對這些不懂C語言或Fortran的開發(fā)人員,Accelereyes以及Wolfram(Mathematica)等公司還提供了GPU加速版的軟件。因此你可以看到,利用GPU計算優(yōu)勢的方式有許多種。
記者: 今年NVIDIA推出了Tesla個人高性能計算機,并會與惠普、CRAY公司聯(lián)合發(fā)布一系列的小型高性能計算系統(tǒng)。 這是否意味著NVIDIA認(rèn)為高性能計算將從大型計算機發(fā)展到臺式機以及桌邊型計算機上來?這對傳統(tǒng)超大型計算機會產(chǎn)生怎樣的影響?
Andy:想要對科學(xué)技術(shù)產(chǎn)生最大的影響,高性能計算就必須發(fā)展到科學(xué)家們的桌面上。每一名研究人員、科學(xué)家以及工程師都應(yīng)該擁有自己的超級計算機,這些計算機應(yīng)該具備足夠的實用性能來滿足他們的工作需要。想象一下如果這些才華橫溢的人們能夠更快地解決問題,那么科學(xué)發(fā)展的節(jié)奏將會變得怎樣。憑借這些基于GPU的工作站以及擁有兼容處理器的超級計算機,現(xiàn)在的技術(shù)計算達(dá)到了前所未有的全新水平。
在接下來的幾年里,GPU將越來越多地被大型計算所采用。GPU擁有超高的計算密度和顯存帶寬,足以支持這種計算性能的增長。GPU將成為超級計算機中極其重要的動力源泉。GPU每年的出貨量數(shù)以百萬計,在超級計算領(lǐng)域中,它現(xiàn)在已經(jīng)成為高性能、低能耗并且是人們買得起的并行處理器