為科學(xué)計算而生!NVIDIA全新Tesla解析
NVIDIA公司發(fā)布GPU計算產(chǎn)品的新家族——NVIDIA® Tesla™,全新Tesla品牌既不同于個人娛樂消費級的GeForce,也不同于專業(yè)圖形渲染的Quadro,它是專為通用計算而生的,憑借強大的流處理架構(gòu)將科學(xué)計算性能提高到新的巔峰!
NVIDIA三大GPU品牌,相同的架構(gòu)在不同領(lǐng)域扮演重要角色
如今的GPU擁有數(shù)十倍于CPU的浮點運算能力,如此強大的實力僅僅用來渲染3D圖形是莫大的浪費。NVIDIA在GeForce 8一代啟用了全新的流明引擎架構(gòu),龐大的流處理器陣容奠定了堅實的硬件基礎(chǔ)。隨后NVIDIA便開始致力于通用計算CUDA(Compute Unified Device Architecture,統(tǒng)一計算設(shè)備架構(gòu))的開發(fā),驅(qū)動和軟件方面日漸成熟。
由于產(chǎn)品定位不同,為GPU開辟了一個全新的應(yīng)用領(lǐng)域,因此NVIDIA發(fā)布了一個新的品牌——Tesla(特斯拉)。Tesla是一位擁有700多項專利的著名科學(xué)家,交流電和無線電的創(chuàng)始人,變壓器和交流電動機的發(fā)明人,提出了低損耗高壓電傳輸?shù)母拍?。高中物理課本中磁感應(yīng)密度的單位就是特斯拉!
三款Tesla產(chǎn)品
NVIDIA此次發(fā)布的Tesla品牌下目前共有三款產(chǎn)品,分別是Tesla GPU運算處理器,Tesla桌面超級計算機和Tesla GPU運算服務(wù)器。下面就對他們進行詳細(xì)的介紹。
Tesla GPU運算處理器C870可以看作之前的NVIDIA Quadro專業(yè)卡的通用計算版本,使用GeForce 8系列GPU,1.5GB顯存,擁有518Gflops的浮點運算能力,售價約1499美元。
Tesla C870
外觀和普通的8800GTX有些相似,但Tesla不需要輸出接口,只負(fù)責(zé)數(shù)據(jù)處理 Tesla C870的硬件規(guī)格和這塊Quadro FX 5600基本相同
我們都知道,專業(yè)顯卡和游戲顯卡其實并無本質(zhì)區(qū)別,GPU架構(gòu)硬件規(guī)格相同,頻率也不會有很大落差。主要區(qū)別就是專業(yè)顯卡經(jīng)過嚴(yán)格的測試和認(rèn)證,做工用料無比奢華,保證長期高負(fù)荷運行不會出現(xiàn)故障,另外專業(yè)顯卡的驅(qū)動也有別于普通驅(qū)動,它能夠讓顯卡在作圖軟件中效能提升數(shù)倍以上!
專供科學(xué)計算的Tesla也是同樣的道理,NVIDIA新開發(fā)的CUDA開發(fā)軟件才是通用計算的精髓,經(jīng)過NVIDIA的不懈努力,在配套驅(qū)動和軟件的支持下,GPU可以在非圖形領(lǐng)域發(fā)揮出超高浮點運算能力的優(yōu)勢。Tesla C870單卡就能達到每秒5000億次的能力,而兩片Tesla C870就可輕松達到每秒萬億次的恐怖實力!
Tesla桌面超級計算機D870革新自NVIDIA去年發(fā)布的QuadroPlex圖形處理子系統(tǒng),內(nèi)部安裝兩塊C870通用計算顯卡,3GB顯存,擁有超過1Tflops的運算能力,售價約7500美元。
Tesla D870和去年NVIDIA發(fā)布的Quadro Plex系統(tǒng)類似,相當(dāng)于外置圖形工作站,它將圖形子系統(tǒng)獨立了出來,在一個小型的機箱當(dāng)中安置了兩塊Tesla C870,并輔以專用的供電和散熱措施,用戶安裝、使用和維護都非常方便。
專用的數(shù)據(jù)傳輸接口,走PCI-E總線
當(dāng)然,外置圖形系統(tǒng)需要通過專用的數(shù)據(jù)通道和服務(wù)器主機相連,NVIDIA提供了一塊特殊的子卡用來傳輸PCI-E X16信號。
我們可以把Tesla D870和Quadro Plex看作是一套完整的外置顯卡解決方案,這套系統(tǒng)最多可以安裝兩塊C870通用計算處理器,達到1GFlops級別的運算能力! #p#page_title#e#
Tesla GPU運算服務(wù)器S870則是一臺全新的標(biāo)準(zhǔn)1U服務(wù)器,內(nèi)部安裝四塊C870通用計算顯卡,6GB顯存,運算能力超過2Tflops,功率最高可達800W,售價約12000美元。
Tesla S870是套全新的系統(tǒng),1U規(guī)格的機箱內(nèi)可以容納四塊C870通用計算顯卡,整套系統(tǒng)采用了一體式的散熱方案,妥善解決了四顆GPU的散熱問題和供電問題。
Tesla S870的工作原理與Tesla D870和Quadro Plex類似,也屬于外置顯卡解決方案,四塊C870通用計算處理器組成了Quad SLI系統(tǒng),將浮點運算能力提高至每秒兩萬億次以上!
當(dāng)然Tesla S870和Tesla D870還能夠通過級連的方式組成更多GPU的集群超級服務(wù)器,用以代替?zhèn)鹘y(tǒng)的CPU服務(wù)器進行科學(xué)計算!
● NVIDIA Tesla通用處理器的前景展望:
一片Tesla C870通用計算處理器的運算能力相當(dāng)于高端雙核心CPU的10倍以上!而且GPU在流處理器方面的執(zhí)行效率很容易達到90%以上,而CPU由于傳統(tǒng)架構(gòu)的限制想要發(fā)揮出60%的效能都很困難。因此GPU通用計算擁有更大的潛力!
A16.jpg
GPU的浮點運算能力和CPU不在一個數(shù)量級
GPU的架構(gòu)更加適合通用計算
G80特殊的緩存式架構(gòu)進一步提高了ALU浮點運算效能
Tesla S870(雙GPU)和Tesla D870(四GPU)這兩套獨立的系統(tǒng),其運算能力就相當(dāng)于數(shù)十臺甚至上百臺普通服務(wù)器,無論體積、成本、功耗方面都有著不可估量的優(yōu)勢。如果用它們來組建超級服務(wù)器的話,只需更少的GPU就能達到同樣的規(guī)模,性能上限也將大幅提升!