Xeon Phi真身首曝,Intel戳穿百倍性能提升假象
經(jīng)過長達八年各類相干研究,Intel終于正式推出了MIC眾核架構(gòu)的Xeon Phi協(xié)處理器,為高性能計算帶來了一股新鮮權(quán)勢。
Xeon Phi協(xié)處理器在很大程度上延續(xù)了流產(chǎn)的顯卡并行計算開發(fā)項目Larrabee的技術(shù),外部造型看似顯卡,其實是和Tesla類似的專用并行計算卡,其架構(gòu)采 取次序、雙發(fā)射x86,支持64位數(shù)據(jù)運算,每個核心支支持最多四個線程,最多61個核心、244個線程,并且每個核心都搭配一個512-bit SIMD矢量引擎。
當然了,這里的“核心”跟Tesla里邊的CUDA核心是沒有直接可比性的,它們分別來自CPU、GPU的世界。
前后做了這么多的介紹,Xeon Phi畢竟是個什么樣子呢?田納西州大學的田納西高性能計算中間(TACC)正在他們的新超級計算機“Stampede”(驚跑)里安裝Xeon Phi,也讓我們得以一睹其真容:
不明說的話必然會認為這是塊標準的顯卡吧?Tesla其實也是這個樣子,標準的雙插槽架構(gòu)PCI-E x16擴展卡,并且是因為專用于并行計算的,都沒有視頻輸出接口(AMD的還有)。
Xeon Phi也分主動散熱、被動散熱兩種版本,這里用的是被動散熱的,外殼下邊是多量厚重的散熱片和熱管,尾部則能看到一個6pin和一個8pin供電接口,最大供電功率能300W。
只可惜人家不讓拆,看不到里邊的樣子。
至于實際性能如何,很可能如今哪兒都不具備測試條件,畢竟結(jié)果這玩意兒因為架構(gòu)的緣故請求操縱體系、面向?qū)ο筌浖嫉迷谝欢ǔ潭壬蠌念^編寫和優(yōu)化,Intel也幾回再三夸大優(yōu)化的首要性。
Intel也沒有一味夸大加快計算性能,而是首先澄清了一個誤會。Intel拿出了一段Fortran代碼,先運行未優(yōu)化的單線程代碼,然后優(yōu)化并以Xeon Phi運行,機能差別達到了驚人的300倍。
NVIDIA Tesla鼓吹的并行性能差不多就是如次而已,讓加快計算的成果和單線程計算結(jié)果對比,幾十甚至幾百倍的提升就輕松得來。
Intel則證了然其謬誤:在雙路Xeon E5上從頭運行相同的代碼,Xeon Phi只快了大約兩倍罷了。也就是說,若是代碼本身就針對多核心處理器做過優(yōu)化,加快計算的真實結(jié)果會小得多。
在另一個C++的例子中,109倍的性能提升被證實實際只有2-2.5倍。
隨后,Intel顯現(xiàn)了Xeon Phi協(xié)處理器計算計算所帶來的真正性能提升,經(jīng)由過程Intel MKL理論測試獲得的幅度為最多2.2-2.9倍,實際應(yīng)用中則廣泛只有最多1.7-2.53倍,只有金融辦事方面取得了10倍以上的跳躍(布萊克斯 克爾斯期權(quán)訂價模型和蒙特卡羅算法)。
Intel還請來了CAE軟件商Altair的一名代表,讓他證實把代碼移植到Xeon Phi平臺上是多么的簡單,并證實潰散測試模仿之類的應(yīng)用一般可以帶來2.5倍的性能提升。