石油勘探與高性能計(jì)算深度應(yīng)用
擴(kuò)展閱讀1:了解高性能計(jì)算與石油勘探的關(guān)系
高性能計(jì)算與石油勘探,都是蘊(yùn)含著很強(qiáng)專業(yè)性的詞匯,雖然大眾對(duì)于石油勘探還有一些了解,但對(duì)于高性能計(jì)算與它的關(guān)系,就不是很清楚了。因?yàn)楦咝阅苡?jì)算的出現(xiàn),似乎總是有尖端科研等字眼相伴,而談到石油勘探,在人們的印象中更多浮現(xiàn)出來的,則是石油公司的野外勘探人員背著各種專用設(shè)備,通過一系列地質(zhì)勘探的方法來偵測(cè),甚至是預(yù)估所探測(cè)地區(qū)的地層中是否存在石油,而后在這個(gè)區(qū)域內(nèi)打上幾口試驗(yàn)性的油井,以驗(yàn)證其預(yù)估是否準(zhǔn)確。在這個(gè)過程中,好像并不需要高性能計(jì)算的手段。
其實(shí),人們認(rèn)識(shí)中的這種石油勘探作業(yè)方式,早就已經(jīng)過時(shí)。這種方式通常使用的是傳統(tǒng)的地質(zhì)學(xué)方法和地球化學(xué)方法來勘測(cè),其結(jié)果是很不精確的。由于油田在地下并不是以所謂“油海”的形式存在,而是由一個(gè)個(gè)彼此隔離的“葡萄串”組成的,因此在不夠精準(zhǔn)的勘測(cè)結(jié)果面前,人們只能多鉆井進(jìn)行嘗試,而且只有將油井鉆到一個(gè)儲(chǔ)有石油的“葡萄”頂部,才算是大功告成。然而,鉆井的費(fèi)用是非常高昂的,每打一口油井,其花費(fèi)往往都會(huì)達(dá)到上千萬甚至是上億元,為提高石油勘探的能力和效率并降低其成本,石油企業(yè)很快就開始在勘探中采用了更為先進(jìn)的地球物理方法,尤其是地震波法。
所謂地震波法,簡(jiǎn)而言之就是用炸藥在地面激起人工地震波,這種地震波可傳入地下深處,并在碰到不同形態(tài)的地質(zhì)構(gòu)成時(shí)形成不同的反射波,這些反射波經(jīng)地面的檢波器收集、轉(zhuǎn)變成電子信號(hào)后可存儲(chǔ)為數(shù)據(jù),通過對(duì)這些數(shù)據(jù)進(jìn)行計(jì)算處理,人們就能清晰地摸擬還原出勘測(cè)區(qū)域的地下地質(zhì)構(gòu)造,并找到那些存有石油或天然氣的巖層的精確位置。由于地震波法勘探收集的數(shù)據(jù)通常都以TB計(jì),甚至在近年來海洋油氣勘探所采集的數(shù)據(jù)都已開始向PB的規(guī)模發(fā)展,這些海量數(shù)據(jù)的處理只有借助高性能計(jì)算機(jī),才能在最短的時(shí)間內(nèi)完成,以實(shí)現(xiàn)最佳的勘探效益。
擴(kuò)展閱讀2:石油勘探領(lǐng)域的核心高性能計(jì)算應(yīng)用
目前與地震波法石油勘探相關(guān)的高性能計(jì)算應(yīng)用軟件,按計(jì)算性質(zhì)可分為地震資料處理(seismic processing)和油藏模擬(reservoir simulation)兩大類,另外業(yè)內(nèi)人士還將計(jì)算可視化(computation visualization)作為單獨(dú)的一類工作站應(yīng)用加以歸類。
目前石油企業(yè)在勘探業(yè)務(wù)中使用的高性能計(jì)算應(yīng)用軟件
為石油行業(yè)客戶廣泛應(yīng)用的商用地震資料處理軟件,現(xiàn)階段主要有Paradigm的Geodepth和Focus、Western Geco的Omega、CGG的GeoCluster,這些應(yīng)用均為支持大規(guī)模集群運(yùn)算的并行版本。目前國(guó)內(nèi)自主開發(fā)的這一類軟件主要是采用PSTM疊前時(shí)間偏移和PSDM疊前深度偏移的算法,如中國(guó)石油東方地球物理公司(BGP)自主開發(fā)的GeoEast、中國(guó)石化南京石油物探研究所開發(fā)的iCluster等。
在油藏模擬類的應(yīng)用軟件方面,目前在全球范圍內(nèi)較為知名的有Landmark的VIP/Nexus和Schlumberger的Eclipse,國(guó)內(nèi)自主開發(fā)的相關(guān)產(chǎn)品主要有大慶研究院的PRBS并行黑油模擬。
利用高性能計(jì)算摸擬油藏分布圖
從應(yīng)用的特點(diǎn)上來看,地震資料處理是典型的浮點(diǎn)計(jì)算密集型應(yīng)用,以求解數(shù)據(jù)密集的波動(dòng)方程為主要計(jì)算模式,因此對(duì)浮點(diǎn)計(jì)算能力要求較高,對(duì)內(nèi)存帶寬的占用中等,對(duì)大量炮集的處理需要良好的多核擴(kuò)展性。不同于在算法上以頻譜計(jì)算為核心的地震資料處理軟件,油藏模擬對(duì)計(jì)算平臺(tái)的要求是需要支持稀疏矩陣方程的迭代求解,對(duì)內(nèi)存帶寬的要求非常高,并需要大緩存支持,因此這類軟件可歸為對(duì)內(nèi)存帶寬高度敏感的計(jì)算密集應(yīng)用。
擴(kuò)展閱讀3:英特爾的百億億級(jí)高性能計(jì)算愿景
2011年6月20日,在當(dāng)時(shí)舉辦的國(guó)際超級(jí)計(jì)算大會(huì)(ISC)上,時(shí)任英特爾公司副總裁兼數(shù)據(jù)中心事業(yè)部總經(jīng)理的施浩德(Kirk Skaugen)向與會(huì)者分享了英特爾計(jì)劃在2011-2020這個(gè)十年期的末期實(shí)現(xiàn)每秒百億億次浮點(diǎn)計(jì)算性能(ExaFLOP/S)的宏偉愿景。
施浩德在詳解該愿景時(shí)指出,高性能計(jì)算( #p#page_title#e#HPC)市場(chǎng)增長(zhǎng)潛力巨大。在二十世紀(jì)80年代,高性能計(jì)算機(jī)的性能為GigaFLOP/s(每秒十億次浮點(diǎn)運(yùn)算),而今天最快的高性能計(jì)算機(jī)的性能已經(jīng)是它的數(shù)百萬倍了。反過來,這也增加了市場(chǎng)對(duì)用于高性能計(jì)算領(lǐng)域的處理器的要求。據(jù)英特爾預(yù)測(cè):到2013年,全球性能最強(qiáng)的前100套高性能計(jì)算機(jī)將使用總計(jì)100萬顆處理器。到2015年,這個(gè)數(shù)字有望再翻一番;到2011-2020這個(gè)十年期的末期,預(yù)計(jì)這一數(shù)字將達(dá)到800萬顆。英特爾還預(yù)測(cè):2015年時(shí),全球高性能計(jì)算機(jī)500強(qiáng)(TOP500)排行榜上排名第一的系統(tǒng)在性能上將有望達(dá)到每秒十億億次浮點(diǎn)計(jì)算,2018年時(shí),它將越過每秒百億億次浮點(diǎn)計(jì)算的標(biāo)桿,而到2011-2020這個(gè)十年期的末期時(shí),地球上最快的計(jì)算機(jī)的性能則有望超過每秒4百億億次浮點(diǎn)計(jì)算。
施浩德表示,要實(shí)現(xiàn)這一愿景,不僅需要行業(yè)與政府的通力協(xié)作,還需要采用英特爾® 集成眾核(Intel® Many Integrated Core,Intel® MIC)架構(gòu)所開創(chuàng)的新方法。管理互聯(lián)網(wǎng)共享數(shù)據(jù)的爆炸性增長(zhǎng)、尋求應(yīng)對(duì)氣候變化的解決方案、管理不斷增加的自然資源(如石油和天然氣)開采成本以及應(yīng)對(duì)各種各樣的其他挑戰(zhàn),都需要更多的計(jì)算資源,而這些資源只能依靠越來越多的高性能超級(jí)計(jì)算機(jī)來提供。
擴(kuò)展閱讀4:認(rèn)識(shí)英特爾的平衡計(jì)算理念及相關(guān)創(chuàng)新
英特爾公司認(rèn)為,要推動(dòng)高性能計(jì)算的快速可持續(xù)發(fā)展,除要提供專為高度并行化應(yīng)用優(yōu)化的集成眾核架構(gòu)產(chǎn)品外,還需要平衡計(jì)算理念及相應(yīng)產(chǎn)品技術(shù)創(chuàng)新的支持。而所謂平衡計(jì)算理念,就是指整個(gè)數(shù)據(jù)中心的IT設(shè)備(包含服務(wù)器、存儲(chǔ)設(shè)備、網(wǎng)絡(luò)設(shè)備)就相當(dāng)于一個(gè)智能的大腦,擔(dān)負(fù)計(jì)算任務(wù)的服務(wù)器就如同其專門判斷和處理信息的神經(jīng)元;存儲(chǔ)設(shè)備則是可以收納海量信息,并隨時(shí)準(zhǔn)備接受訪問和更新的記憶細(xì)胞,而網(wǎng)絡(luò)就是連通所有這些神經(jīng)元和記憶細(xì)胞的神經(jīng)連接,惟有三者在性能和功能上盡量實(shí)現(xiàn)平衡,才能實(shí)現(xiàn)最無縫的配合,以及1+1+1>3的應(yīng)用效果。
目前英特爾平衡計(jì)算理念的最佳實(shí)踐載體,就是于今年三月上市的英特爾至強(qiáng)處理器E5產(chǎn)品家族。針對(duì)財(cái)務(wù)分析、媒體內(nèi)容制作和高性能計(jì)算等計(jì)算密集型應(yīng)用,該產(chǎn)品家族不但通過創(chuàng)新的微架構(gòu)設(shè)計(jì),例如對(duì)英特爾® 高級(jí)矢量擴(kuò)展指令集 (Intel® AVX)實(shí)現(xiàn)了比上一代至強(qiáng)處理器5600產(chǎn)品家族提升高達(dá)兩倍的性能,而且由于在業(yè)內(nèi)率先在處理器中集成支持PCI Express* 3.0標(biāo)準(zhǔn)的I/O控制器,以及在處理器中內(nèi)置了英特爾® 集成I/O(英特爾® IIO)和英特爾®數(shù)據(jù)直接I/O(英特爾® DDIO)技術(shù),以及在平臺(tái)層面以英特爾® 萬兆位以太網(wǎng)控制器X540來提供低成本、低功耗的板載局域網(wǎng)(LOM)功能,至強(qiáng)處理器E5平臺(tái)還為開放架構(gòu)存儲(chǔ)設(shè)備和網(wǎng)絡(luò)設(shè)備的性能的提升及功能的豐富化奠定了堅(jiān)實(shí)基礎(chǔ),為產(chǎn)業(yè)界推出下一代存儲(chǔ)和通信系統(tǒng),與先進(jìn)的服務(wù)器搭配以邁向平衡計(jì)算帶來了更強(qiáng)的助力。
擴(kuò)展閱讀5:高性能計(jì)算與云計(jì)算
業(yè)界對(duì)于高性能計(jì)算未來是否會(huì)與云計(jì)算融合,或者高性能計(jì)算應(yīng)用負(fù)載是否會(huì)遷移到云計(jì)算平臺(tái)的探討早已開始。但很多的高性能計(jì)算用戶對(duì)于打造高性能云的設(shè)想?yún)s一直存有疑慮,其原因就在于云計(jì)算平臺(tái)雖然擴(kuò)展更為方便,管理更為簡(jiǎn)單,資源分配更為靈活,但用于實(shí)現(xiàn)這些優(yōu)勢(shì)的基石——虛擬化技術(shù),卻不免會(huì)帶來額外的性能開銷,并可能形成新的性能瓶頸,這對(duì)于渴求更高性能,并將這些性能全部用于加速自身高性能應(yīng)用負(fù)載執(zhí)行效率的用戶來說,是難以接受的。
然而,有助于推進(jìn)平衡計(jì)算理念和實(shí)踐的英特爾至強(qiáng)E5平臺(tái)卻在這個(gè)阻隔高性能計(jì)算與云計(jì)算的障礙上打開了一個(gè)缺口,帶來了一個(gè)契機(jī)——得益于更強(qiáng)的計(jì)算性能、更強(qiáng)的系統(tǒng)內(nèi)部及對(duì)外I/O能力,對(duì)于萬兆位以太網(wǎng)的支持以及在硬件輔助虛擬化技術(shù)上的革新和升級(jí),基于至強(qiáng)處理器E5產(chǎn)品家族的服務(wù)器系統(tǒng)已能夠顯著降低虛擬化技術(shù)產(chǎn)生的性能開銷,例如整個(gè)數(shù)據(jù)中心或某個(gè)集群系統(tǒng)實(shí)現(xiàn)網(wǎng)絡(luò)的虛擬化后,對(duì)其網(wǎng)絡(luò)帶寬和延遲帶來的不利影響。 #p#page_title#e#
來自美國(guó)國(guó)家航空航天局(NASA)的“試驗(yàn)”就見證了這一趨勢(shì)的可行性。它針對(duì)傳統(tǒng)高性能計(jì)算集群系統(tǒng)實(shí)現(xiàn)擴(kuò)展時(shí)面臨的復(fù)雜性和成本過高,以及在作業(yè)安排上不夠靈活的問題,專門推進(jìn)了名為Nebula的,基于云的基礎(chǔ)設(shè)施即服務(wù)(IaaS)環(huán)境,來尋求源于云計(jì)算技術(shù)的解決方案。這個(gè)環(huán)境的核心技術(shù)基石,就是英特爾架構(gòu)服務(wù)器、萬兆位以太網(wǎng)技術(shù)以及OpenStack開源軟件項(xiàng)目。
英特爾積極參與了這個(gè)項(xiàng)目,與NASA的性能工程師密切配合,致力于充分發(fā)揮英特爾架構(gòu)平臺(tái)上的虛擬化技術(shù)的性能潛力,以驗(yàn)證架構(gòu)在云上、基于虛擬化環(huán)境的高性能計(jì)算系統(tǒng)與傳統(tǒng)“裸機(jī)”形態(tài)(即非虛擬化)的高性能計(jì)算系統(tǒng)相比,是否會(huì)產(chǎn)生性能開銷或其他干擾性能的因素。而測(cè)試的結(jié)果則表明,在英特爾架構(gòu)平臺(tái)所提供的單根I/O虛擬化技術(shù)和所支持的萬兆位以太網(wǎng)技術(shù)的助力下,Nebula環(huán)境在MPI性能基準(zhǔn)測(cè)試中給出的網(wǎng)絡(luò)傳輸吞吐率和延遲測(cè)試成績(jī),已經(jīng)超過了“裸機(jī)”方案。這初步證明高性能計(jì)算應(yīng)用走向開放架構(gòu)的云計(jì)算平臺(tái)或環(huán)境是可行的,雖然還有一些技術(shù)問題有待解決,但采納應(yīng)用平衡的計(jì)算平臺(tái),無疑將是此后相關(guān)驗(yàn)證或嘗試工作繼續(xù)前行的重要支柱。
擴(kuò)展閱讀6:英特爾集成眾核架構(gòu)及英特爾至強(qiáng)融核產(chǎn)品線預(yù)覽
2012年6月18日,英特爾公司正式宣布未來所有基于英特爾® 集成眾核架構(gòu)(英特爾® MIC 架構(gòu))的產(chǎn)品將采用全新品牌——英特爾® 至強(qiáng) 融核™。第一代英特爾至強(qiáng)融核產(chǎn)品家族(代號(hào)為“ Knights Corner”的協(xié)處理器)將于 2012 年年底推出,屆時(shí)它將成為英特爾至強(qiáng)處理器 E5-2600/4600 產(chǎn)品家族的重要補(bǔ)充,并為高度并行的工作負(fù)載帶來全新性能。其第一代產(chǎn)品將主要用于高性能計(jì)算( HPC)市場(chǎng),而未來的英特爾至強(qiáng)融核產(chǎn)品還將滿足企業(yè)數(shù)據(jù)中心和工作站的需求。
英特爾至強(qiáng)融核協(xié)處理器的主要優(yōu)勢(shì)在于具備出色的易用性,能夠充分利用在英特爾架構(gòu)上使用的常見編程模式、技術(shù)和開發(fā)者工具。由于它能夠更充分地利用并行 CPU 代碼,軟件公司和 IT 部門將無需重新為其開發(fā)人員提供與加速器有關(guān)的專用編程模型的培訓(xùn)。
除了兼容 x86 編程模式外,英特爾至強(qiáng)融核協(xié)處理器還能夠適用于專為高性能計(jì)算優(yōu)化且高度并行的獨(dú)立計(jì)算節(jié)點(diǎn)。它可以獨(dú)立于主機(jī)操作系統(tǒng)來運(yùn)行自己的基于Linux的操作系統(tǒng)。這一特性將可以為實(shí)施無法采用其它 GPU 技術(shù)的集群解決方案帶來更大的靈活性。
英特爾至強(qiáng)融核協(xié)處理器將采用創(chuàng)新的22 納米 3-D 三柵極晶體管制程技術(shù),可在 PCI-e插卡形態(tài)下集成超過 50 顆內(nèi)核和支持最低 8GB容量的GDDR5 內(nèi)存。此外,它還具備支持512b SIMD 指令的特點(diǎn),可在單個(gè)指令控制下同時(shí)處理多個(gè)數(shù)據(jù)元素,從而能顯著提升性能。在去年使用 DGEMM 進(jìn)行的協(xié)處理器現(xiàn)場(chǎng)演示中,英特爾進(jìn)行了使用單顆“ Knights Corner”協(xié)處理器提供超過 1 TeraFLOPs(每秒 1 萬億次浮點(diǎn)計(jì)算)雙精度實(shí)際性能的展示。而在 2012 年國(guó)際超級(jí)計(jì)算大會(huì)上,英特爾使用行業(yè)基準(zhǔn)測(cè)試工具Linpack (Rmax) 1展示了同樣超過 1 TeraFLOPs 的卓越性能。相比之下,在 1997 年,ASCII RED* 高性能計(jì)算機(jī)采用超過 9,000 顆英特爾® 奔騰® 處理器才突破 了1 TeraFLOPs 性能大關(guān)。
雖然英特爾至強(qiáng)融核協(xié)處理器計(jì)劃于 2012 年下半年推出,但英特爾宣布首個(gè)基于英特爾至強(qiáng)融核協(xié)處理器的集群已經(jīng)投入使用,并在2012年6月發(fā)布的最新的第39屆全球高性能計(jì)算機(jī)500 強(qiáng)排行榜上位列第150位,具備了每秒118萬億次浮點(diǎn)計(jì)算的卓越性能。 #p#page_title#e#
英特爾至強(qiáng)融核協(xié)處理器已獲得了廣泛的行業(yè)支持,包括 Bull*、Cray*、戴爾*、惠普*、IBM*、浪潮*和 NEC* 在內(nèi)的 44 家制造商已承諾將推出采用該款協(xié)處理器的系統(tǒng)。
擴(kuò)展閱讀7:英特爾軟件工具助力真實(shí)應(yīng)用負(fù)載性能調(diào)優(yōu)
不論是旨在推進(jìn)平衡計(jì)算的至強(qiáng)處理器E5,還是專為高度并行化應(yīng)用負(fù)載開發(fā)的至強(qiáng)融核新品,其性能的充分發(fā)掘和釋放都離不開英特爾一系列軟件開發(fā)與優(yōu)化工具的支持,這些工具,也是英特爾在高性能計(jì)算市場(chǎng)上強(qiáng)大競(jìng)爭(zhēng)力的重要組成部分。
這些工具包括了VTune™性能分析器、英特爾®編譯器(Intel® Compilers)、Intel® Thread Checker、Intel® Performance Libraries、Intel® Threading Tools、Intel® Cluster Tools等,它們可以幫助高性能計(jì)算應(yīng)用軟件開發(fā)商或最終用戶分析自己的高性能計(jì)算系統(tǒng)及應(yīng)用軟件特性,并最大限度優(yōu)化其高性能計(jì)算機(jī)軟硬件系統(tǒng),發(fā)掘其最大性能潛力。世界領(lǐng)先的石油服務(wù)公司斯倫貝謝(Schlumberger)技術(shù)服務(wù)副總裁Jim Brady指出,“通過與英特爾的緊密合作和其行業(yè)領(lǐng)先的軟件使用工具,我們很好地優(yōu)化了我們的軟件的擴(kuò)展能力的性能。因此,我們的石油和天然氣客戶可以更好地理解液體流動(dòng)和地質(zhì)因素,更迅速,更確性,高效地推動(dòng)能源勘探的發(fā)展。”
以這些工具為基礎(chǔ),英特爾公司還推出了“真實(shí)應(yīng)用負(fù)載計(jì)劃”,來幫助用戶針對(duì)其真實(shí)的應(yīng)用負(fù)載,而非通用的基準(zhǔn)測(cè)試軟件來進(jìn)行調(diào)優(yōu),從而幫助他們從自己的系統(tǒng)上獲取最大化的收益。截止目前,英特爾中國(guó)高性能計(jì)算團(tuán)隊(duì)已經(jīng)和一些國(guó)內(nèi)用戶合作優(yōu)化和測(cè)試了一系列真實(shí)應(yīng)用負(fù)責(zé),包括復(fù)旦大學(xué)(VASP應(yīng)用),中國(guó)海洋大學(xué)(WRF-ROMS應(yīng)用),中科院生物物理所(EMAN,I3和NAMD應(yīng)用),上海交通大學(xué)(KLAPS和CFD程序)等。目前該團(tuán)隊(duì)還提供了由16個(gè)節(jié)點(diǎn)至強(qiáng)E5服務(wù)器構(gòu)成的,用于真實(shí)應(yīng)用負(fù)載測(cè)試的基準(zhǔn)集群環(huán)境。
擴(kuò)展閱讀8:英特爾架構(gòu)系統(tǒng)在最新全球高性能計(jì)算機(jī)500強(qiáng)排行榜上的出色表現(xiàn)
在今年6月發(fā)布的第39屆全球高性能計(jì)算機(jī)500強(qiáng)排行榜上,有74%的上榜系統(tǒng)采用英特爾架構(gòu),同時(shí)新晉該榜單的系統(tǒng)中有78%是基于英特爾架構(gòu)。其中有多達(dá)45套系統(tǒng)是基于最近推出的英特爾® 至強(qiáng)® 處理器 E5 產(chǎn)品家族,這45套系統(tǒng)中又包括了3套擁有每秒千萬億浮點(diǎn)計(jì)算能力的系統(tǒng)。位于萊布尼茨超級(jí)計(jì)算中心(LRZ)的“SuperMUC”是其中最大的高性能計(jì)算機(jī),具備每秒2900萬億次浮點(diǎn)計(jì)算能力(2.9 Petaflops),是歐洲計(jì)算能力最強(qiáng)的高性能計(jì)算機(jī),也是基于x86架構(gòu)的計(jì)算能力最強(qiáng)勁的高性能計(jì)算機(jī)。
從該榜單前10位的排名來看,共有4套基于英特爾架構(gòu)平臺(tái)的系統(tǒng)入圍,其中2套采用了至強(qiáng)處理器E5產(chǎn)品家族。從應(yīng)用領(lǐng)域來看,榜上所有的14套與石油勘探或地球物理應(yīng)用相關(guān)的系統(tǒng),都是基于英特爾平臺(tái)構(gòu)建。