對(duì)Top500超級(jí)計(jì)算機(jī)排名"非議"
2003年世界最快超級(jí)計(jì)算機(jī)日本的地球模擬器每秒運(yùn)算次數(shù)高才35.8萬億次,其成本也高達(dá)2.5億美元,現(xiàn)在僅僅過去7年,單單單個(gè)NVIDIA的GPU每秒運(yùn)算次數(shù)就超過萬億次,成本只有幾百美元,科技尤其是半導(dǎo)體科技發(fā)展太快了
沒什么不同,當(dāng)然是個(gè)計(jì)算機(jī)愛好者都知道CPU擅長整數(shù)計(jì)算,GPU擅長浮點(diǎn)并行計(jì)算,現(xiàn)在的GPU比CPU復(fù)雜多了,超級(jí)計(jì)算機(jī)的發(fā)展就是關(guān)鍵核心CPU和GPU的發(fā)展,其他都是浮云,現(xiàn)在就是家庭里的個(gè)人PC比起十幾年前的超級(jí)電腦速度快多了,就像現(xiàn)在的什么天河1A世界第一好像很牛B,十幾年后可能連普通家庭PC都比不上。換句話說,人人都在用超級(jí)電腦,只要你懂得讓它干什么。用超級(jí)電腦當(dāng)年磁帶機(jī)的時(shí)候還可以吹一吹,現(xiàn)在科技大爆炸時(shí)代在摩爾定律下實(shí)在沒什么好吹的(以下一點(diǎn)科普知識(shí))
-------------------------------------------------------
CPU發(fā)展趨勢:不斷的整合功能模塊
通過前面詳細(xì)的介紹我們可以發(fā)現(xiàn),CPU的發(fā)展趨勢就是不斷去整合更多的功能和模塊,從協(xié)處理器、到緩存、再到內(nèi)存控制器甚至整個(gè)北橋?!?br />
目前AMD和Intel的所有主流CPU都已經(jīng)整合了內(nèi)存控制器,Intel最新的Lynnfield(Core i7 8XX和i5 7XX)已經(jīng)整合了包括PCIE控制器在內(nèi)的整個(gè)北橋,而Clarkdale(Core i5 6XX和i3 5XX)更是將GPU也整合了進(jìn)去。
★ GPU發(fā)展趨勢:不斷的蠶食CPU功能
至于GPU,從某種意義上來說,它本身就是一顆協(xié)處理器,主要用于圖像、視頻、3D加速。之所以這么多年來沒有被CPU所整合,是因?yàn)镚PU實(shí)在太復(fù)雜了,以現(xiàn)有的制造工藝限制,CPU不可能去整合一顆比自身規(guī)模還要大很多的GPU,它頂多只能整合一顆主流中低端的GPU,而這樣的產(chǎn)品只能定位入門級(jí),無法滿足游戲玩家和高性能計(jì)算的需要?!?br />
GPU從誕生至今一步步走來,就是在不斷蠶食著原本屬于CPU的功能,或者說是幫助CPU減負(fù)、去處理哪些CPU并不擅長的任務(wù)。比如最開始的T&L(坐標(biāo)轉(zhuǎn)換與光源)、VCDDVDHDBD視頻解碼、物理加速、幾何著色。而今后和未來,GPU將奪走一項(xiàng)CPU最重要的功能——并行計(jì)算、高精度浮點(diǎn)運(yùn)算
GPU前途似錦:浮點(diǎn)運(yùn)算的未來
我們知道,CPU第一個(gè)整合的就是專門用來加速浮點(diǎn)運(yùn)算的協(xié)處理器,此后歷代SSE指令集也都是為了加強(qiáng)CPU的SIMD(單指令多數(shù)據(jù)流)浮點(diǎn)運(yùn)算性能。而GPU打從一開始就被設(shè)計(jì)成為了SIMD架構(gòu)(至今Cypress也還是這種架構(gòu)),擁有恐怖浮點(diǎn)運(yùn)算能力的處理器。當(dāng)今GPU的浮點(diǎn)運(yùn)算能力更是達(dá)到多核CPU的幾十倍甚至上百倍!
CPU永遠(yuǎn)都趕不上GPU的發(fā)展速度,因此最適合進(jìn)行浮點(diǎn)運(yùn)算的顯然是GPU,CPU繼續(xù)擴(kuò)充核心數(shù)目已經(jīng)變得毫無意義,因此整個(gè)業(yè)界都在想方設(shè)法的發(fā)掘GPU的潛能,將所有的并行計(jì)算任務(wù)都轉(zhuǎn)移到GPU上面來。即便是Intel也看到了GPU廣闊的前景,因此著手研發(fā)GPU。
此前由于API和軟件的限制,GPU在并行計(jì)算方面的應(yīng)用舉步維艱、發(fā)展緩慢,NVIDIA孤身推廣CUDA架構(gòu)雖然小有成就但孤掌難鳴。好在OpenCL和DirectCompute兩大API的推出讓GPU并行計(jì)算的前途豁然開朗,此時(shí)ATI和NVIDIA又重新站在了同一起跑線上,那么很顯然誰的架構(gòu)更適合并行計(jì)算,那么誰就能獲得更強(qiáng)的性能和更大范圍的應(yīng)用,通過本文的分析可以看出,ATI的架構(gòu)依然是專注于傳統(tǒng)的圖形渲染,并不適合并行計(jì)算;而NVIDIA的架構(gòu)則完全針對(duì)通用計(jì)算API和指令集優(yōu)化設(shè)計(jì),確保能發(fā)揮出接近理論值最大效能,提供最強(qiáng)的浮點(diǎn)運(yùn)算性能!#p#page_title#e#
★ CPU面臨拐點(diǎn):強(qiáng)化整數(shù)性能,浮點(diǎn)運(yùn)算交給GPU
AMD同時(shí)擁有CPU和GPU,而且AMD在技術(shù)方面往往能夠引領(lǐng)業(yè)界,因此其未來發(fā)展規(guī)劃非常值得大家思考。根據(jù)AMD最新的產(chǎn)品路線圖來看,其下一代的高端CPU核心Bulldozer(推土機(jī)),它最大的亮點(diǎn)就是每一顆核心擁有雙倍的整數(shù)運(yùn)算單元,整數(shù)和浮點(diǎn)為非對(duì)稱設(shè)計(jì):
在一個(gè)推土模塊里面有兩個(gè)獨(dú)立的整數(shù)核心,每一個(gè)都擁有自己的指令、數(shù)據(jù)緩存,也就是scheduling/reordering邏輯單元。而且這兩個(gè)整數(shù)單元的中的任何一個(gè)的吞吐能力都要強(qiáng)于Phenom II上現(xiàn)有的整數(shù)處理單元。Intel的Core構(gòu)架無論整數(shù)或者浮點(diǎn),都采用了統(tǒng)一的scheduler(調(diào)度)派發(fā)指令。而AMD的構(gòu)架使用獨(dú)立的整數(shù)和浮點(diǎn)scheduler。
據(jù)AMD透露,目前存在于服務(wù)器上的80%的操作都是純粹的整數(shù)操作,因此AMD新一代CPU大幅加強(qiáng)了整數(shù)運(yùn)算單元而無視浮點(diǎn)運(yùn)算單元。而且,隨著CPU和GPU異構(gòu)計(jì)算應(yīng)用越來越多,GPU將會(huì)越來越多的負(fù)擔(dān)起浮點(diǎn)運(yùn)算的操作,預(yù)計(jì)未來3-5年的時(shí)間內(nèi),所有浮點(diǎn)運(yùn)算都將會(huì)交給最擅長做浮點(diǎn)運(yùn)算的GPU,這也就是推土機(jī)加強(qiáng)整數(shù)運(yùn)算的真正目的。
當(dāng)然,AMD和Intel都會(huì)推出CPU整合GPU的產(chǎn)品,不管是膠水還是原生的解決方案,其目的并不是為了消滅顯卡和GPU,而是通過內(nèi)置的GPU為CPU提供強(qiáng)大的浮點(diǎn)運(yùn)算能力。但由于制造工藝所限,被CPU所整合的GPU不是集成卡就是中低端,只能滿足基本需求。所以想要更強(qiáng)大的游戲性能和并行計(jì)算性能的話,專為浮點(diǎn)運(yùn)算而設(shè)計(jì)的新一代架構(gòu)的GPU產(chǎn)品,才是最明智的選擇。
所以說,CPU和GPU,誰也不可能取代誰,雙方是互補(bǔ)的關(guān)系,只有CPU和GPU協(xié)同運(yùn)算,各自去處理最擅長的任務(wù),才能發(fā)揮出計(jì)算機(jī)最強(qiáng)的效能。CPU會(huì)整合GPU的,但僅限中低端產(chǎn)品;GPU會(huì)取代CPU進(jìn)行浮點(diǎn)運(yùn)算的,但它仍然需要CPU來運(yùn)行操作系統(tǒng)并控制整個(gè)計(jì)算機(jī)。只有當(dāng)制造工藝發(fā)達(dá)到一定程度時(shí)才有可能將CPU和GPU完美融合在一起,到時(shí)候是CPU整合GPU還是GPU整合CPU都很難說,但誰被誰整合已經(jīng)不重要了
Linpack測試簡介
Linpack是國際上使用最廣泛的測試高性能計(jì)算機(jī)系統(tǒng)浮點(diǎn)性能的基準(zhǔn)測試。通過對(duì)高性能計(jì)算機(jī)采用高斯消元法求解一元N次稠密線性代數(shù)方程組的測試,評(píng)價(jià)高性能計(jì)算機(jī)的浮點(diǎn)計(jì)算性能。Linpack的結(jié)果按每秒浮點(diǎn)運(yùn)算次數(shù)(flops)表示
-----------------------------------------------------
就是個(gè)單純的浮點(diǎn)測試,說它測試不全面也沒錯(cuò),現(xiàn)在有超級(jí)GPU超恐怖浮點(diǎn)計(jì)算能力的加入,可以想見超級(jí)計(jì)算機(jī)的Linpack測試速度一日千里
什么玩意!這個(gè)計(jì)算機(jī)排名也超過十年了吧.怎么從來沒有什么質(zhì)疑.偏偏中國第一了就來質(zhì)疑了?奧運(yùn)會(huì)金牌排名幾十年沒有疑問.偏偏中國得到第一.就弄出來個(gè)什么“獎(jiǎng)牌排名”?是不是不要臉到了極點(diǎn)了?質(zhì)疑吧.質(zhì)疑吧.質(zhì)疑到你沒有遮羞步的時(shí)候.看你還質(zhì)疑什么
------------------------------------
搞笑,這個(gè)排名早就有人質(zhì)疑了,國內(nèi)沒有報(bào)道,天涯沒有人發(fā)帖給你知道而已,現(xiàn)在中國第一了,大家感興趣了有人發(fā)個(gè)帖,如果以前發(fā)個(gè)Linpack質(zhì)疑帖你會(huì)關(guān)心么?(給個(gè)帖提醒一下,對(duì)Linpack質(zhì)疑遠(yuǎn)在什么天河1A之前,看以下報(bào)道的日期)
#p#page_title#e#
Linpack:舊有評(píng)價(jià)體系的注定死亡
DoSERV服務(wù)器在線 3月29日原創(chuàng)報(bào)道:大約在35年前,同樣也是一個(gè)四月,美國Argonne國家實(shí)驗(yàn)室應(yīng)用數(shù)學(xué)所主任Jim Pool提出,應(yīng)該建立一套專門解決線性系統(tǒng)系統(tǒng)問題的數(shù)學(xué)軟件及其模型——直到現(xiàn)在,在一系列關(guān)于Linpack的紀(jì)年表中,Jim Pool的名字仍然高居榜首。隨后,他在當(dāng)年六月的一次學(xué)術(shù)會(huì)議上正式提出了自己對(duì)線性系統(tǒng)軟件包(Linear system package),也就是Linpack的想法。在此之后,Linpack這一想法正式被美國國家科學(xué)基金會(huì)所采納,Cleve Moler及其同時(shí)在沒改過國家科學(xué)基金會(huì)的資助下,開發(fā)了Linpack和EISPACK的Fortan子程序庫,這兩個(gè)程序庫作為解決線性方程和特征值問題的“法寶”代表了上世紀(jì)七十年代矩陣計(jì)算軟件的最高水平。
國際上一般就是把用Linpack基準(zhǔn)測試出的最高性能指標(biāo)作為衡量機(jī)器性能的標(biāo)準(zhǔn)。之所以選擇Linpack,主要是因?yàn)樗褂脧V泛而且它的指標(biāo)幾乎可以在所有參加測試的系統(tǒng)上得到。雖然這些指標(biāo)并不反映給定系統(tǒng)的全部系統(tǒng)性能,但可以作為對(duì)系統(tǒng)峰值性能的一個(gè)修正?!?br />
至目前為止, LINPACK 還是廣泛地應(yīng)用于解各種數(shù)學(xué)和工程問題。 也由于它高效率的運(yùn)算, 使得其它幾種數(shù)學(xué)軟件例如 IMSL、 MATLAB 紛紛加以引用來處理矩陣問題, 所以足見其在科學(xué)計(jì)算上有舉足輕重的地位?! ?br />
但是,在高性能計(jì)算界已經(jīng)有人對(duì)其提出了不同的看法,而這些質(zhì)疑聲音正在變得越來越強(qiáng)大,并正在動(dòng)搖Linpack在高性能計(jì)算界的影響力。
Linpack的原理與特色
Linpack的出現(xiàn)基本上可以稱之為力學(xué)(Mechanics)分析軟件的鼻祖,并建立了數(shù)學(xué)軟件的比較機(jī)制,與此同時(shí),提供軟件鏈接庫, 允許使用者加以修正以便處理特殊問題,兼顧了對(duì)各計(jì)算機(jī)系統(tǒng)的通用性, 并提供高效率的運(yùn)算——基本上來說,Linkpack代表了線性計(jì)算評(píng)價(jià)標(biāo)準(zhǔn)的最高水平?! ?br />
事實(shí)上,Linpack現(xiàn)在在國際上已經(jīng)成為最流行的用于測試高性能計(jì)算機(jī)系統(tǒng)浮點(diǎn)性能的benchmark。通過利用高性能計(jì)算機(jī),用高斯消元法求解一元N次稠密線性代數(shù)方程組的測試,評(píng)價(jià)高性能計(jì)算機(jī)的浮點(diǎn)性能。
Linpack測試包括三類,Linpack100、Linpack1000和HPL。Linpack100求解規(guī)模為100階的稠密線性代數(shù)方程組,它只允許采用編譯優(yōu)化選項(xiàng)進(jìn)行優(yōu)化,不得更改代碼,甚至代碼中的注釋也不得修改。Linpack1000要求求解規(guī)模為1000階的線性代數(shù)方程組,達(dá)到指定的精度要求,可以在不改變計(jì)算量的前提下做算法和代碼上做優(yōu)化。HPL即High Performance Linpack,也叫高度并行計(jì)算基準(zhǔn)測試,它對(duì)數(shù)組大小N沒有限制,求解問題的規(guī)??梢愿淖?,除基本算法(計(jì)算量)不可改變外,可以采用其它任何優(yōu)化方法。前兩種測試運(yùn)行規(guī)模較小,已不是很適合現(xiàn)代計(jì)算機(jī)的發(fā)展,因此現(xiàn)在用較多的測試標(biāo)準(zhǔn)為HPL,而且階次N也是linpack測試必須指明的參數(shù)。
HPL是針對(duì)現(xiàn)代并行計(jì)算機(jī)提出的測試方式。用戶在不修改任意測試程序的基礎(chǔ)上,可以調(diào)節(jié)問題規(guī)模大小N(矩陣大小)、使用到的CPU數(shù)目、使用各種優(yōu)化方法等來執(zhí)行該測試程序,以獲取最佳的性能。HPL采用高斯消元法求解線性方程組。當(dāng)求解問題規(guī)模為N時(shí),浮點(diǎn)運(yùn)算次數(shù)為(2/3 * N^3-2*N^2)。因此,只要給出問題規(guī)模N,測得系統(tǒng)計(jì)算時(shí)間T,峰值=計(jì)算量(2/3 * N^3-2*N^2)/計(jì)算時(shí)間T,測試結(jié)果以浮點(diǎn)運(yùn)算每秒(Flops)給出。#p#page_title#e#
Linpack的局限:浮點(diǎn)與線性計(jì)算
Cleve Moler所為人熟知的原因并非他對(duì)Linpack計(jì)算所作出的努力,幾乎每一個(gè)數(shù)學(xué)系畢業(yè)的學(xué)生(包括我本人這個(gè)數(shù)學(xué)系畢業(yè)的不才學(xué)生),幾乎對(duì)Cleve Moler的名字都十分熟知,因?yàn)樗_發(fā)了對(duì)數(shù)學(xué)計(jì)算,尤其是計(jì)算數(shù)學(xué)產(chǎn)生重大影響的MATLAB:
到70年代后期,身為美國New Mexico大學(xué)計(jì)算機(jī)系系主任的Cleve Moler,在給學(xué)生講授線性代數(shù)課程時(shí),想教學(xué)生使用EISPACK和LINPACK程序庫,但他發(fā)現(xiàn)學(xué)生用FORTRAN編寫接口程序很費(fèi)時(shí)間,于是他開始自己動(dòng)手,利用業(yè)余時(shí)間為學(xué)生編寫EISPACK和LINPACK的接口程序。Cleve Moler給這個(gè)接口程序取名為MATLAB。
MATLAB時(shí)至今日已經(jīng)是一種用于算法開發(fā)、數(shù)據(jù)可視化、數(shù)據(jù)分析以及數(shù)值計(jì)算的高級(jí)技術(shù)計(jì)算語言和交互式環(huán)境,在數(shù)值計(jì)算方面無比強(qiáng)大,可以進(jìn)行矩陣運(yùn)算、繪制函數(shù)和數(shù)據(jù)、實(shí)現(xiàn)算法、創(chuàng)建用戶界面、連接其他編程語言的程序等,主要應(yīng)用于工程計(jì)算、控制設(shè)計(jì)、信號(hào)處理與通訊、圖像處理、信號(hào)檢測、金融建模設(shè)計(jì)與分析等領(lǐng)域——但是,在初期,無論是Linpack和MATLAB都是以線性計(jì)算為基礎(chǔ)的,這從Linpack的原名即可得知。
另一方面,Linpack專注于浮點(diǎn)運(yùn)算,首先,我們要明白,數(shù)和計(jì)算通常是按“整數(shù)”或“浮點(diǎn)數(shù)”進(jìn)行劃分的。整數(shù)計(jì)算使用計(jì)算的所有位(如32位)記錄整數(shù)“值”。而浮點(diǎn)計(jì)算則使用計(jì)算的一部分位表示“值”(如23位),另一部分位表示指數(shù)(8位)。由于一部分位用來表示指數(shù),所以浮點(diǎn)計(jì)算得出的值可以比整數(shù)計(jì)算得出的值大很多或是小很多。換句話說,對(duì)于給定數(shù)量的位,浮點(diǎn)計(jì)算的精度沒有整數(shù)計(jì)算高,但浮點(diǎn)計(jì)算結(jié)果的范圍卻比整數(shù)計(jì)算大很多——后面我們隨提及為何整數(shù)計(jì)算并非如人們所傳言無所大用。
這也就是說,Linpack幾乎可以被人做是一個(gè)面向數(shù)學(xué)計(jì)算領(lǐng)域的線性計(jì)算方法及評(píng)價(jià)標(biāo)準(zhǔn),這也就意味著,盡管Linpack數(shù)據(jù)具有極強(qiáng)的評(píng)價(jià)能力,卻正顯得有些不合時(shí)宜了。
對(duì)于大部分高性能計(jì)算用戶來說,HPC被用來進(jìn)行大量的科學(xué)計(jì)算,所以對(duì)于諸如石油勘探、地質(zhì)勘測、天氣預(yù)報(bào)等用戶來說,非常注重服務(wù)器的浮點(diǎn)計(jì)算能力,而對(duì)于整數(shù)運(yùn)算能力卻并不太關(guān)心,整數(shù)運(yùn)算能力是指系統(tǒng)對(duì)于16位以內(nèi)數(shù)據(jù)的計(jì)算精確度和速度,而浮點(diǎn)運(yùn)算能力代表的是一個(gè)計(jì)算機(jī)系統(tǒng)對(duì)于16位以上數(shù)據(jù)的計(jì)算速度和結(jié)果精確度。所以,對(duì)于高性能計(jì)算機(jī)的用戶來說,在采購服務(wù)器的時(shí)候,對(duì)于廠商提供的SPECfp2000浮點(diǎn)運(yùn)算基準(zhǔn)測試要給予重點(diǎn)關(guān)注,而對(duì)于一般的商業(yè)用戶來說,一個(gè)計(jì)算機(jī)系統(tǒng)的浮點(diǎn)運(yùn)算能力強(qiáng)或者弱,并沒有太大的實(shí)質(zhì)意義,這個(gè)用戶群體更應(yīng)該關(guān)注諸如TPC-C等在線事務(wù)交易處理性能。
另一方面,Linpack的出現(xiàn)主要是因?yàn)樯鲜兰o(jì)七十年代線性代數(shù)方程組在各個(gè)領(lǐng)域的應(yīng)用十分廣泛,所以該軟件包就很自然地稱為測試各種機(jī)器性能的測試程序,但是隨著科學(xué)計(jì)算的深入,更多數(shù)學(xué)方法出現(xiàn)在人們面前,即使是線性計(jì)算方面的計(jì)算方法也獲得了強(qiáng)大的發(fā)展。
更有甚者,盡管Linpack作為數(shù)學(xué)型的測試程序現(xiàn)在仍很有生命力,但作為實(shí)際求解線性代數(shù)問題的軟件包甚至都已經(jīng)開始落伍了:
1992年出現(xiàn)了代替Linpack以及EisPACK(特征值軟件包)的LAPACK,它使用了數(shù)值線性代數(shù)中最新、最精確的算法,同時(shí)采用了大型矩陣分解成小矩陣的方法從而可有效地使用存儲(chǔ)器。LAPACK是建立在BLAS1 ,BLAS2,BLAS3的基礎(chǔ)上的,其中BLAS2執(zhí)行矩陣-向量運(yùn)算,BLAS3執(zhí)行矩陣-矩陣運(yùn)算。
隨后出現(xiàn)的是ScaLAPACK,其被稱為LAPACK的增強(qiáng)版,主要為可擴(kuò)放的,分布存儲(chǔ)的并行計(jì)算機(jī)而設(shè)計(jì)的。ScaLAPACK支持稠密和帶狀矩陣上各類操作,諸如乘法,轉(zhuǎn)置和分解等。在國際上,ScaLAPACK例程可以加入多個(gè)并行算法,并且可根據(jù)數(shù)據(jù)分布,問題規(guī)模和機(jī)器大小選擇這些算法,然而用戶卻不必關(guān)心這些細(xì)節(jié)。
高性能計(jì)算的更多基準(zhǔn)測試方法
相較于Linpack,更多的高性能計(jì)算基準(zhǔn)測試方法正在逐步應(yīng)用到測試中,以更加可觀的衡量和對(duì)比不同高性能計(jì)算系統(tǒng)在各種不同應(yīng)用上面的性能特征。
以SPECfp_rate_base2006為例,其是一項(xiàng)計(jì)算密集型性能指標(biāo)評(píng)測,用于衡量計(jì)算機(jī)系統(tǒng)在運(yùn)行大量并行任務(wù)時(shí)的浮點(diǎn)吞吐性能。性能指標(biāo)評(píng)測包括從實(shí)際最終用戶應(yīng)用開發(fā)而來的一組十四個(gè)浮點(diǎn)工作負(fù)載。通過將性能指標(biāo)評(píng)測的拷貝數(shù)量設(shè)置成操作系統(tǒng)可識(shí)別的邏輯硬件內(nèi)核數(shù)量而同時(shí)運(yùn)行多個(gè)性能指標(biāo)評(píng)測拷貝來測量系統(tǒng)吞吐率。報(bào)告的性能得分是按工作/小時(shí)測量的系統(tǒng)吞吐率的衡量標(biāo)準(zhǔn)。得分越高表示性能越好。
從分類上來說,綜合型、核心型、數(shù)學(xué)計(jì)算型、應(yīng)用型和并行計(jì)算型等,上面所說的SPEC計(jì)算與Whetstone和Dhrystone即屬于綜合型,不過在綜合型中,后兩種基準(zhǔn)測試方法由于編譯程序較為敏感,造成了對(duì)用戶程序性能預(yù)測的不確定性,因此已經(jīng)基本上被不同類型的SPEC計(jì)算所取代,SPEC最早是作為NCGA(National computer graphics association)的一個(gè)小組20世紀(jì)80年代創(chuàng)立的,第一組基準(zhǔn)測試程序叫SPEC89,包含10個(gè)程序; SPEC92擴(kuò)從到20個(gè)程序,6個(gè)整數(shù)程序,和14個(gè)浮點(diǎn)程序分別稱為SPECint92,SPECfp92。隨后SPEC又發(fā)布了一些新的基準(zhǔn)測試程序(如SPEC95,SPEChpc96,SPECweb96, SPEC2000等)。SPEC原主要是測試CPU性能的,現(xiàn)在強(qiáng)調(diào)開發(fā)能反映真實(shí)應(yīng)用(如實(shí)際負(fù)載等)的基準(zhǔn)測試程序,并已推廣至客戶/服務(wù)器計(jì)算,商業(yè)應(yīng)用,I/O子系統(tǒng)等。
數(shù)學(xué)計(jì)算型基本上可以等同于Linpack計(jì)算+FFT(FFT有浮點(diǎn)的(就是普通的FFT),有整數(shù)的(就是離散化的FFT)),而核心型的主要包括Livemore、Fortran Kernals、NASA NAS等,而并行的主要為NPB和PARKBENCK,具體的測試方式介紹在此就不在贅述,可以從http://www.netlib.org/liblist.html查到,可以在其中的“Benchmark Programs and Reports”頁面看到比較全面的測試介紹