Xeon Phi加速處理器細(xì)節(jié):最多61核心、300W
六月份,Intel正式發(fā)布了首款基于IMC眾核架構(gòu)、22nm Knights Corner核心的加速處理器“Xeon Phi”,Larrabee借此重生,準(zhǔn)備與NVIDIA Tesla、AMD Fusion等等在高性能計算領(lǐng)域一較高下。不過,Intel當(dāng)時并未公布太多技術(shù)細(xì)節(jié),規(guī)格上語焉不詳。
上周,Intel開始向合作伙伴提供B0步進(jìn)的Xeon Phi芯片樣品,我們也得到了比較詳細(xì)的技術(shù)參數(shù)。
昨天——
Larrabee獨立顯卡項目失敗后,Intel并未放棄,而是撿起了“Aubrey Isle”核心與合作伙伴繼續(xù)試驗,而搭載此核心的擴(kuò)展卡代號“Knights Ferry”,2010年三月正式亮相,并稱之為“MIC”眾核架構(gòu)。
Aubrey Isle采用的是45nm工藝,32個核心,1MB一級緩存,8MB二級緩存,主頻1.2GHz,搭載2GB GDDR5顯存,位寬達(dá)到驚人的1024-bit,而且是環(huán)形總線設(shè)計,熱設(shè)計功耗300W左右。
Knights Ferry擴(kuò)展卡可以執(zhí)行x86標(biāo)準(zhǔn)代碼,能提供750GFlops的單精度浮點性能,雙精度效率41-47%,也就是不到400GFlops。至于這塊卡出貨了多少,誰也不清楚,反正難得一見,畢竟只是個試驗品。
2011年初,準(zhǔn)備采用22nm工藝的新核心“Knights Corner”出現(xiàn)了,BIOS、PCB、規(guī)格都有很多版本。A0步進(jìn)的有48、52、60個核心,1.5-1.9MB一級緩存,24-30MB二級緩存,顯存拋棄環(huán)形總線,位寬縮減到512-bit(待確認(rèn)),容量2、4、8GB GDDR5,等效頻率不過2.4-4.5GHz,主頻也只有1GHz,因為即便這樣熱設(shè)計功耗也有300W了。
60核心版本曾經(jīng)演示過1TFlops的單精度浮點性能,但雙精度比較慘淡,不足以成氣候。
Intel隨后準(zhǔn)備繼續(xù)發(fā)展B0、C1等新步進(jìn),并且計劃盡快出貨,以登上2013年六月的全球超級計算機(jī)五百強(qiáng)名單。
今天——
B0就是現(xiàn)在的步進(jìn)版本,ES2版工程樣品,進(jìn)步很大,引入了一些非常必要的功能特性,BIOS也做了全面完善。
核心數(shù)量為57、60、61個(很不規(guī)整的數(shù)字),一級緩存1.8-1.9MB,二級緩存28-30.5MB,顯存增加到3、6、8GB GDDR5。
頻率方面有多種不同設(shè)定,57核心3/6GB顯存的600-1100MHz,60/61核心8GB顯存的則是630-1050/1090MHz,顯存頻率達(dá)到了5000-5500MHz,帶寬超過300GB/s。
值得一提的是,Intel這次引入了Turbo動態(tài)加速技術(shù),類似桌面上的睿頻,但具體多少個核心能加速到什么程度不詳。
熱設(shè)計功耗,57核心3GB顯存、60核心6GB顯存的是245W,57核心6GB、61核心8GB(兩種版本)的則是300W。
散熱方案有主動風(fēng)扇、被動靜音兩種,其中被動靜音的用于自備大風(fēng)量的機(jī)架系統(tǒng),但也有完全無散熱的,用于自行安裝水冷等其它散熱器。順便說一句,這些卡很重很重。
具體性能沒有實際數(shù)據(jù),Intel的內(nèi)部目標(biāo)是單精度2TFlops、雙精度1TFlops,從已知情況看難度不大。
C1步進(jìn)還沒出來,會是什么樣子還有待觀察。
再往后,還有第二代“Knights Landing”,Intel對高性能計算的追求不會停歇