Nvidia Tesla和Quadro、GeForce的區(qū)別
Tesla和Quadro、GeForce的區(qū)別
記者:從硬件層面看,Tesla配備的顯存容量比GeForce更大。但Quadro也有一些4GB顯存的版本。NVIDIA如何說(shuō)服消費(fèi)者購(gòu)買(mǎi)Tesla產(chǎn)品而不去選擇價(jià)格更便宜的Quadro或GeForce呢?
Andy:這里其實(shí)有兩個(gè)問(wèn)題。
確實(shí)有4GB顯存的Quadro顯卡,但是其價(jià)格遠(yuǎn)高于Tesla。Quadro支持高速OpenGL渲染,速度遠(yuǎn)高于GeForce,因此這項(xiàng)技術(shù)的價(jià)格自然高于Tesla。Tesla不支持OpenGL。
記者:在后續(xù)產(chǎn)品及芯片技術(shù)規(guī)格上,Tesla是沿用同期的GeForce和Quadro產(chǎn)品,還是采用只為計(jì)算用途而重新設(shè)計(jì)的芯片和架構(gòu)?
Andy:當(dāng)前的策略是在Tesla產(chǎn)品線(xiàn)中采用具備特殊特性的標(biāo)準(zhǔn)GPU?,F(xiàn)在,GeForce、Quadro以及Tesla中的計(jì)算特性是相同的,但是在將來(lái)的產(chǎn)品中,Tesla將擁有專(zhuān)為高性能計(jì)算而設(shè)計(jì)的其它特性。這些產(chǎn)品線(xiàn)中的性能級(jí)別也會(huì)有所變化。
GPU與CPU計(jì)算的不同
記者:Tesla基于NVIDIA CUDA,該技術(shù)最顯著的特點(diǎn)就是能夠利用GPU的并行計(jì)算能力,在大規(guī)模、高帶寬計(jì)算中有著極大的優(yōu)勢(shì)。 但是,面對(duì)串行計(jì)算密集型任務(wù),Tesla是否有解決辦法呢?
Andy:GPU及其內(nèi)部的CUDA架構(gòu)是專(zhuān)為并行計(jì)算而設(shè)計(jì)的。
串行計(jì)算是一種有很大區(qū)別的架構(gòu),這種架構(gòu)的設(shè)計(jì)目的是為了解決不同的問(wèn)題。CPU執(zhí)行指令的方式就是一個(gè)接著另一個(gè)地執(zhí)行。CPU中有許多能夠加速串行計(jì)算的技術(shù)。高速緩存、無(wú)次序執(zhí)行、超標(biāo)量技術(shù)、分支預(yù)測(cè)……均為抽取指令的技術(shù)或一系列指令的串行級(jí)并行機(jī)制。CPU對(duì)片上高速緩存的設(shè)計(jì)與容量的依賴(lài)也非常大。如果程序大小與CPU高速緩存容量不匹配,那么該程序在CPU上的運(yùn)行速度將會(huì)很慢。
GPU內(nèi)部的并行計(jì)算架構(gòu)圍繞兩個(gè)基本概念而設(shè)計(jì)。首先,程序中的數(shù)據(jù)可分成許多個(gè)部分,而為數(shù)眾多的核群可以并行地處理這些數(shù)據(jù)。第二個(gè)架構(gòu)方面的設(shè)想是,數(shù)據(jù)將不與高速緩存匹配。例如在圖形計(jì)算或石油天然氣數(shù)據(jù)處理上,數(shù)據(jù)量可能會(huì)達(dá)到兆字節(jié)甚至是太字節(jié),用高速緩存來(lái)容納如此巨大的數(shù)據(jù)量幾乎是不切實(shí)際的??紤]到這兩點(diǎn)設(shè)想,GPU被設(shè)計(jì)為能夠使用數(shù)以千計(jì)的線(xiàn)程,所有線(xiàn)程均并行地執(zhí)行,能夠訪(fǎng)問(wèn)巨大容量的本地存儲(chǔ)器。在最新的Tesla產(chǎn)品中,每顆GPU均配備4GB存儲(chǔ)器,可容納待執(zhí)行的數(shù)據(jù)。同時(shí)針對(duì)反復(fù)使用的數(shù)據(jù),還設(shè)有較小的片上存儲(chǔ)空間,GPU所配備的巨大容量存儲(chǔ)器等同于CPU內(nèi)部的高速緩存,只是容量大了許多倍而已。 #p#page_title#e#
Tesla在高性能計(jì)算領(lǐng)域
記者:目前GPU系統(tǒng)在全球高性能計(jì)算機(jī)TOP500排行榜中最好的成績(jī)是第29位——東京大學(xué)的Tsubame超級(jí)計(jì)算機(jī)。 在您看來(lái),到2010年之前,Tsubame是否有機(jī)會(huì)躋身世界十強(qiáng)超級(jí)計(jì)算機(jī)? 還有哪些超級(jí)計(jì)算機(jī)有希望躋身世界十強(qiáng)或五百?gòu)?qiáng)?
Andy:我不能代表東京工業(yè)大學(xué)超級(jí)計(jì)算領(lǐng)軍人物的意見(jiàn)。但東京工業(yè)大學(xué)全球科學(xué)資訊和計(jì)算中心總監(jiān)Satoshi Matsuoka博士曾公開(kāi)表示,他打算使用GPU在2010年打造出一臺(tái)榮登世界最快榜單的計(jì)算機(jī)。還有更多使用GPU打造的超級(jí)計(jì)算機(jī)。美國(guó)國(guó)家超級(jí)運(yùn)算應(yīng)用中心(NCSA)以及法國(guó)原子能委員會(huì)(CEA)是兩家著名的超級(jí)計(jì)算中心,他們將躋身下一屆世界五百?gòu)?qiáng)榜單。
記者:當(dāng)前,NVIDIA GPU的雙精度性能僅相當(dāng)于單精度的8%。 到2010年之前,你認(rèn)為這種性能可以有多大的改善? NVIDIA會(huì)采取怎樣的技術(shù)手段來(lái)確保這種性能提升呢?
Andy:當(dāng)前10系列GPU是首批擁有雙精度的NVIDIA處理器。過(guò)去這種性能曾作為GPU的一個(gè)模塊添加在GPU當(dāng)中。而在這一代產(chǎn)品中,我們?yōu)槊拷M八個(gè)單精度處理器加入了一個(gè)雙精度單元。隨著快速發(fā)展,未來(lái)的GPU將擁有更多雙精度單元。由于GPU的性能一般每年都會(huì)翻一番,未來(lái)雙精度性能將至少比當(dāng)前的速度快5倍。
Andy:我們與打算發(fā)布超級(jí)計(jì)算軟件的獨(dú)立軟件供應(yīng)商都進(jìn)行了積極的開(kāi)發(fā)工作。分子動(dòng)力學(xué)領(lǐng)域的《NAMD/VMD》以及《GROMACS》是為群集GPU發(fā)布的兩個(gè)應(yīng)用程序例子。在美國(guó)的超級(jí)計(jì)算展會(huì)上,我們還展示了許多用于石油天然氣領(lǐng)域地震處理、量子化學(xué)以及Ansys有限元設(shè)計(jì)的應(yīng)用程序。
對(duì)于想要自己設(shè)計(jì)和開(kāi)發(fā)應(yīng)用程序的開(kāi)發(fā)人員,用于CUDA架構(gòu)的并行計(jì)算開(kāi)發(fā)C語(yǔ)言編譯器可從NVIDIA網(wǎng)站上免費(fèi)下載。Portland Group的Fortran等其它編譯器也正在陸續(xù)推出。有很多來(lái)自NVIDIA以及其它來(lái)源的程序庫(kù),這些庫(kù)使應(yīng)用程序更易于開(kāi)發(fā)。針對(duì)這些不懂C語(yǔ)言或Fortran的開(kāi)發(fā)人員,Accelereyes以及Wolfram(Mathematica)等公司還提供了GPU加速版的軟件。因此你可以看到,利用GPU計(jì)算優(yōu)勢(shì)的方式有許多種。
記者: 今年NVIDIA推出了Tesla個(gè)人高性能計(jì)算機(jī),并會(huì)與惠普、CRAY公司聯(lián)合發(fā)布一系列的小型高性能計(jì)算系統(tǒng)。 這是否意味著NVIDIA認(rèn)為高性能計(jì)算將從大型計(jì)算機(jī)發(fā)展到臺(tái)式機(jī)以及桌邊型計(jì)算機(jī)上來(lái)?這對(duì)傳統(tǒng)超大型計(jì)算機(jī)會(huì)產(chǎn)生怎樣的影響?
Andy:想要對(duì)科學(xué)技術(shù)產(chǎn)生最大的影響,高性能計(jì)算就必須發(fā)展到科學(xué)家們的桌面上。每一名研究人員、科學(xué)家以及工程師都應(yīng)該擁有自己的超級(jí)計(jì)算機(jī),這些計(jì)算機(jī)應(yīng)該具備足夠的實(shí)用性能來(lái)滿(mǎn)足他們的工作需要。想象一下如果這些才華橫溢的人們能夠更快地解決問(wèn)題,那么科學(xué)發(fā)展的節(jié)奏將會(huì)變得怎樣。憑借這些基于GPU的工作站以及擁有兼容處理器的超級(jí)計(jì)算機(jī),現(xiàn)在的技術(shù)計(jì)算達(dá)到了前所未有的全新水平。
在接下來(lái)的幾年里,GPU將越來(lái)越多地被大型計(jì)算所采用。GPU擁有超高的計(jì)算密度和顯存帶寬,足以支持這種計(jì)算性能的增長(zhǎng)。GPU將成為超級(jí)計(jì)算機(jī)中極其重要的動(dòng)力源泉。GPU每年的出貨量數(shù)以百萬(wàn)計(jì),在超級(jí)計(jì)算領(lǐng)域中,它現(xiàn)在已經(jīng)成為高性能、低能耗并且是人們買(mǎi)得起的并行處理器