英特爾平衡HPC多樣化需求
至強滿足多樣化需求
作為我國最早開展HPC研究的單位之一,清華大學早在2005年就開始自建HPC平臺,如今,該校HPC平臺二期工程也于今年4月正式投入使用。據(jù)清華大學副教授張武生介紹,清華大學HPC平臺具有一百萬億次浮點計算能力,共使用740臺基于英特爾至強5600的刀片服務器,總CPU核數(shù)達8880個,存儲容量1PB,通過22個IO節(jié)點與集群相連。
“由于多個院系共享一個HPC平臺,上面跑的HPC應用種類繁多,各個科研用戶對HPC計算環(huán)境的需求也不一樣,可以說是‘眾口難調(diào)’。因此,我們這種高校計算中心普遍面臨的問題就是如何解決不同用戶作業(yè)的個性化控制難題,如何在兼顧公平的同時,服務好重點應用。”張武生說。
客戶所面臨的難題也是英特爾倡導去尋求“平衡計算”的初衷。英特爾(中國)服務器平臺產(chǎn)品經(jīng)理張振宇表示,“Pegaflop和LinPack只是衡量高性能計算系統(tǒng)的一個方面,我們更多地需要關(guān)注到用戶的多樣化需求。HPC客戶往往面臨著許多挑戰(zhàn),比如在構(gòu)建一套系統(tǒng)時,如何滿足性能成本比、性能能耗比、性能空間比等。這需要根據(jù)應用的實際特征進行分析。不同的應用對于主頻、內(nèi)存、帶寬,或者是網(wǎng)絡時延的需求不同,這決定了HPC發(fā)展的多樣性。”
正是基于HPC用戶的不同需求,英特爾也提出了全面的HPC解決方案,包括目前被客戶廣為應用的至強5600系列;針對高度并行的應用所推出的MIC架構(gòu);針對大內(nèi)存需求的應用和Shared Memory編程模式,以及推出了EX平臺和基于Sandy Bridge的 EP、E5系列四路平臺。
眾核開啟低耗未來
從應用的角度來看計算、內(nèi)存、能耗、成本、資源等五大因素,是當今高性能計算面對的主要性能挑戰(zhàn)。張武生認為,未來的高性能計算系統(tǒng)隨著計算性能的攀升,會帶來不可避免的高能耗。而要避免CPU堆疊帶來的過高耗能,只有采用協(xié)處理加速的方式。目前的GPU+CPU解決方案存在的弊病在于編程困難,對于高性能計算來說,需要重新編寫很多代碼。
其實,英特爾也早已發(fā)現(xiàn),未來的高性能計算系統(tǒng)已經(jīng)不可能純粹靠CPU來堆,過高的功耗是用戶難以承受的——最新TOP500第一名的日本K超算系統(tǒng)功耗高達10MW(每小時10萬度電)。而英特爾早在ISC2010上宣布的MIC眾核計算架構(gòu),則可以大幅度地減少超級計算機在達到相同性能情況下的能耗。對于其他沒有需求要用這么多計算能力的HPC用戶,在逐步開始使用MIC架構(gòu)加速產(chǎn)品的過程中,可以面向未來盡早地減少自身計算集群的功耗。
最為重要的是,針對MIC的并行程序優(yōu)化非常簡單,只需要在原有至強并行加速代碼之前加一句MIC的調(diào)用語句即可。而英特爾針對多核與眾核的Parallel Studio系列并行優(yōu)化編程套件,也可以幫助用戶將自身的程序有針對性地優(yōu)化。在張武生看來,GPU需要用新的架構(gòu)來編程,對于自主研發(fā)的軟件難度也很大,需要有專門的隊伍,而MIC兼容傳統(tǒng)的CPU編程模式,軟件移植與優(yōu)化更容易。另外,由于MIC完全采用了x86內(nèi)核設(shè)計,未來清華大學HPC平臺的遷移就會變得非常容易。
如今,還有不少學?;蚩蒲袡C構(gòu)正在嘗試用云計算的方式提供HPC服務,去年成都建成了國內(nèi)第一家商用的高性能計算云中心,北京工業(yè)大學的“科教云”和北京計算中心的“工業(yè)云”也均屬于“HPC云”。而英特爾也在努力為云計算的成熟營造技術(shù)基礎(chǔ)。例如,英特爾一直研究硬件輔助虛擬化技術(shù)。“我們希望將Hypervisor(虛擬機管理程序)變得越來越薄,甚至完全消失掉,從而最大程度地減輕虛擬機的開銷。” 張振宇說