超級(jí)電腦靈魂-Fermi架構(gòu)Tesla C2050并行計(jì)算卡21500元
NVIDIA®(英偉達(dá)™)Tesla™ C2050與C2070計(jì)算處理器能夠推動(dòng)整個(gè)行業(yè)向并行計(jì)算的過(guò)渡,為臺(tái)式機(jī)帶來(lái)了小型集群般的性能。Tesla GPU的20系列產(chǎn)品家族基于代號(hào)為“Fermi”的下一代CUDA架構(gòu),支持技術(shù)與企業(yè)計(jì)算所“必備”的諸多特性,其中包括C++支持、可實(shí)現(xiàn)極高精度與可擴(kuò)展性的ECC存儲(chǔ)器以及7倍于Tesla 10系列GPU的雙精度性能。Tesla™ C2050與C2070 GPU旨在重新定義高性能計(jì)算并實(shí)現(xiàn)超級(jí)計(jì)算的平民化。
與最新的四核CPU相比,Tesla C2050與C2070計(jì)算處理器以十分之一的成本和二十分之一的功耗即可實(shí)現(xiàn)同等超級(jí)計(jì)算性能。
特性
基于新一代Fermi CUDA架構(gòu)的GPU |
與基于最新四核CPU的純CPU系統(tǒng)相比,該GPU以十分之一的成本和二十分之一的功耗即可實(shí)現(xiàn)同等的集群性能。 |
448個(gè)CUDA核心 |
每顆GPU最高可實(shí)現(xiàn)515 Gigaflop雙精度峰值性能,從而讓一臺(tái)工作站即可實(shí)現(xiàn)Teraflop級(jí)甚至更高的性能。每顆GPU的單精度峰值性能超過(guò)1 Teraflop。 |
ECC存儲(chǔ)器 |
能夠滿足工作站計(jì)算精度與可靠性方面的關(guān)鍵需求。能夠?yàn)榇鎯?chǔ)器中的數(shù)據(jù)提供保護(hù)功能,從而為應(yīng)用程序增強(qiáng)數(shù)據(jù)完整性和可靠性。寄存器文件、L1/L2高速緩存、共享存儲(chǔ)器以及DRAM均受ECC的保護(hù)。 |
臺(tái)式機(jī)上的集群性能 |
與一個(gè)小型服務(wù)器集群相比,配備多顆GPU的單臺(tái)工作站能夠更快地解決大型難題。 |
每顆GPU最多配備6GB GDDR5存儲(chǔ)器 |
更大的數(shù)據(jù)集能夠保存在直接附屬于GPU的本地存儲(chǔ)器上,從而實(shí)現(xiàn)了性能的最大化并減少了數(shù)據(jù)傳輸?shù)那闆r。 |
NVIDIA®(英偉達(dá)™)并行DataCache™ |
能夠?yàn)槲锢硇Ч馑闫?、光線追蹤以及稀疏矩陣乘法等諸多算法加速,在這些算法中,數(shù)據(jù)地址事先都是未知的。每個(gè)流式多處理器模塊均包含一個(gè)可配置的L1高速緩存,所有處理器核心使用統(tǒng)一的L2高速緩存。 |
NVIDIA®(英偉達(dá)™)GigaThread™引擎 |
通過(guò)多項(xiàng)技術(shù)實(shí)現(xiàn)了吞吐量的最大化,其中包括10倍于上一代架構(gòu)的高速上下文切換、并發(fā)內(nèi)核執(zhí)行以及改良的線程塊調(diào)度。 |
異步傳輸 |
計(jì)算核心在PCIe總線上傳輸數(shù)據(jù)的同時(shí)還能夠處理其它數(shù)據(jù),因而增強(qiáng)了系統(tǒng)性能。即便是地震處理這類需要大量數(shù)據(jù)傳輸?shù)膽?yīng)用程序,也能夠通過(guò)事先將數(shù)據(jù)傳輸至本地存儲(chǔ)器的方法來(lái)最大限度提升計(jì)算效率。 |
CUDA編程環(huán)境受到各種編程語(yǔ)言與API的廣泛支持 |
開(kāi)發(fā)人員無(wú)論選擇C語(yǔ)言、C++、OpenCL、DirectCompute還是選擇Fortran語(yǔ)言,都能夠?qū)崿F(xiàn)應(yīng)用程序的并行機(jī)制,進(jìn)而利用“Fermi”GPU的創(chuàng)新架構(gòu)。Microsoft Visual Studio開(kāi)發(fā)人員可以使用NVIDIA®(英偉達(dá)™)Parallel Nsight工具。 |
高速PCIe Gen 2.0數(shù)據(jù)傳輸率 |
實(shí)現(xiàn)了主系統(tǒng)與Tesla處理器之間帶寬的最大化。讓Tesla系統(tǒng)能夠應(yīng)用于幾乎所有具備一條開(kāi)放式PCIe x16插槽且符合PCIe規(guī)范的主系統(tǒng)。 |
|
|
#p#page_title#e#
尺寸規(guī)格 |
9.75英寸PCIe x16規(guī)格 |
Tesla GPU的數(shù)量 |
1 |
CUDA核心數(shù)量 |
448 |
CUDA核心頻率 |
1.15 GHz |
雙精度浮點(diǎn)性能(峰值) |
515 Gflops |
單精度浮點(diǎn)性能(峰值) |
1.03 Tflops |
專用存儲(chǔ)器總?cè)萘?/strong>* Tesla C2050 |
3GB GDDR5 |
存儲(chǔ)器頻率 |
1.5 GHz |
存儲(chǔ)器接口 |
384位 |
存儲(chǔ)器帶寬 |
144 GB/秒 |
功耗 |
247W熱設(shè)計(jì)功耗 |
系統(tǒng)接口 |
PCIe x16 Gen2 |
散熱解決方案 |
主動(dòng)式風(fēng)扇散熱器 |
軟件開(kāi)發(fā)工具 |
CUDA C/C++/Fortran、OpenCL以及DirectCompute工具包。 |
*注:在開(kāi)啟ECC功能的情況下,專用存儲(chǔ)器中的一部分將用于ECC數(shù)據(jù),因此用戶可用存儲(chǔ)器容量將減少12.5%。(例如總?cè)萘繛? GB的存儲(chǔ)器將僅能為用戶提供2.68 GB的可用容量。)