內(nèi)存瓶頸導(dǎo)致多核超級(jí)計(jì)算機(jī)性能下降
由于沒有其它方法進(jìn)一步改善處理器性能,芯片廠商把未來的賭注押在了在同一個(gè)芯片上放入越來越多的處理器內(nèi)核。芯片廠商稱多核處理器是行業(yè)未來。新墨西哥州的Sandia國家實(shí)驗(yàn)室的研究人員模擬了未來的配置8個(gè)內(nèi)核、16個(gè)內(nèi)核和32個(gè)內(nèi)核的處理器的高性能計(jì)算機(jī)。這個(gè)模擬的結(jié)果令人難受。由于有限的內(nèi)存帶寬和不適合超級(jí)計(jì)算機(jī)的內(nèi)存管理方案,采用更多內(nèi)核的高性能計(jì)算機(jī)的性能沒有提高,甚至還下降了,特別是對(duì)于信息學(xué)的數(shù)據(jù)密集型應(yīng)用程序的性能更糟糕。對(duì)于這個(gè)實(shí)驗(yàn)室的國家安全功能來說,數(shù)據(jù)密集型應(yīng)用程序越來越重要。
高性能計(jì)算歷史上重點(diǎn)用于解決解釋物理系統(tǒng)的微分方程,如地球的大氣層或者氫彈的裂變觸發(fā)器。這些系統(tǒng)把自己分為許多網(wǎng)格,這樣,物理系統(tǒng)在這種程度上就能夠映射到處理器或者處理器內(nèi)核的物理位置上,從而最大限度地減少移動(dòng)數(shù)據(jù)中的延遲。
但是,重要的科學(xué)和工程問題(更不用說國家安全問題了)數(shù)量的增加是不同的。這些問題數(shù)據(jù)通用類型的信息學(xué),并且包括計(jì)算在一個(gè)自然災(zāi)害期間運(yùn)輸網(wǎng)絡(luò)可能發(fā)送什么事情,以及尋找預(yù)測(cè)恐怖主義襲擊或者核擴(kuò)散失敗的方式。這些操作通常需要通過詳審大量的信息數(shù)據(jù)庫。
根據(jù)Sandia國家實(shí)驗(yàn)室的模擬,對(duì)于信息學(xué)來說,更多的內(nèi)核并不意味著更好的性能。Sandia的計(jì)算、計(jì)算機(jī)、信息和數(shù)學(xué)主任James Peery說,超過8個(gè)內(nèi)核之后,性能沒有改善。在使用16個(gè)內(nèi)核的時(shí)候,計(jì)算機(jī)看起來與2個(gè)內(nèi)核的計(jì)算機(jī)一樣。在過去的一年里,Sandia團(tuán)隊(duì)與芯片廠商、計(jì)算機(jī)設(shè)計(jì)者和高性能計(jì)算機(jī)用戶廣泛地討論了這個(gè)結(jié)果。除非計(jì)算機(jī)設(shè)計(jì)師找到一個(gè)解決方案,否則,Peery和其他人都預(yù)計(jì)超級(jí)計(jì)算機(jī)程序員將關(guān)閉多余的內(nèi)核或者使用多余的內(nèi)核處理解決主要問題之外的輔助的事情。
這個(gè)難題的核心是所謂的內(nèi)存墻:處理器能夠操作數(shù)據(jù)的速度與處理器能夠得到它需要的數(shù)據(jù)的速度之間的日益加大的差距。Sandia的高級(jí)技術(shù)人員Richard C. Murphy解釋說,雖然每個(gè)處理器上的內(nèi)核數(shù)量在增長,但是,芯片連接到計(jì)算機(jī)其它部分的連線數(shù)量沒有增加。因此,讓所有的內(nèi)核都獲得充足的數(shù)據(jù)是一個(gè)問題。在信息學(xué)應(yīng)用中,問題更糟糕,因?yàn)樘幚砥髡谔幚淼臄?shù)據(jù)和下一套數(shù)據(jù)所在的地方?jīng)]有相互之間的物理聯(lián)系。數(shù)據(jù)不是在隔壁的內(nèi)核的緩存中,而是有可能在20米之外的一個(gè)機(jī)架的DRAM內(nèi)存芯片中,并且需要離開那個(gè)芯片通過一個(gè)或者更多的路由器和光纖找到通向處理器的道路。
為了使事情重回正軌,美國能源部今年組建了高級(jí)架構(gòu)和算法研究所。這個(gè)研究所在Sandia并且在田納西州的橡樹嶺國家實(shí)驗(yàn)室,其工作是找出未來五年之十年將需要什么高性能計(jì)算機(jī)架構(gòu),并且?guī)椭笇?dǎo)這個(gè)行業(yè)向那個(gè)方向發(fā)展。
Peery說,解決這個(gè)瓶頸的關(guān)鍵是把內(nèi)存和處理器更緊密地(也許是更聰明地)結(jié)合在一起。因此,Sandia正在探索處理器上面的堆疊內(nèi)存芯片的影響以便改善內(nèi)存帶寬。