高性能計(jì)算技術(shù)在地球物理中的應(yīng)用
我來自中國石油集團(tuán)咨詢中心工程技術(shù)組。
我主要講三點(diǎn),第一點(diǎn)是介紹一下地球物理勘探與高性能計(jì)算的關(guān)系。
第二點(diǎn)說說地球物理高性能計(jì)算面臨的問題。
地球物理勘探是地球上計(jì)算量和數(shù)據(jù)量最大的業(yè)務(wù)之一。一個圖表示海上地球物理勘探的示意圖。這個是陸地上的,是由于炸藥導(dǎo)致的地震波,然后傳到地下,有地面的接受器接收著。
這些采集的數(shù)據(jù)要經(jīng)計(jì)算機(jī)進(jìn)行處理,處理的計(jì)算量和數(shù)據(jù)量非常大,需要高性能計(jì)算機(jī)。我介紹一下東方地球地理公司,主要做地震勘探的。公司陸地地震勘探市場占全球陸地勘探市場的44%,居全球第一。綜合實(shí)力位居全球物探行業(yè)前三位。公司研究院已經(jīng)擁有的PC集群計(jì)算機(jī)計(jì)1.2萬個CPU,2.2萬核芯,另外還有7套大中型虛擬現(xiàn)實(shí)系統(tǒng),320臺各類工作站等先進(jìn)設(shè)備,計(jì)算能力每秒200萬億次。1973-2008年,35年間計(jì)算能力提高了2億倍。
在TOP500中的地球物理應(yīng)用。這是2007年11月13日公布TOP500,按照應(yīng)用領(lǐng)域分布排序,地球物理位于第二。我們在地球物理勘探的領(lǐng)域,在整個國際上的PC應(yīng)用上還是占有一定的地位。
地震數(shù)據(jù)處理算法,有最小資源算法等等。我就不細(xì)說了。
有一個地球物理教授說,地球物理的歷史和計(jì)算技術(shù)的歷史不可分割的。
第一個問題我簡單地介紹到這里。
第二個問題我簡單說一下,地球物理高性能計(jì)算面臨的一些問題。那么現(xiàn)在地球物理數(shù)據(jù)處理,都是用的cluster計(jì)算機(jī)提供的RAP是PAP的10%-15%。
下一代地震成像,RTM需要比較今天使用的計(jì)算機(jī)高出30倍的計(jì)算能力。地震解釋工作歷來主要應(yīng)用工作站,近來有地球物理公司提出了高性能地學(xué)解釋方案。據(jù)稱高性能地學(xué)解釋有幾個好處:適應(yīng)疊前解釋和反演需要等等。
第三個挑戰(zhàn)現(xiàn)在很多解釋方法,包括像反演的方法。反演方法是將地震資料得到一些定量的參數(shù),用來描述地下儲層的巖性、物性和含油氣性等的一項(xiàng)新技術(shù)。隨機(jī)反映計(jì)算量巨大。
虛擬現(xiàn)實(shí)與解釋自動化。在虛擬現(xiàn)實(shí)環(huán)境,從層位為基礎(chǔ)的解釋轉(zhuǎn)向以體為基礎(chǔ)。
最后我簡單說一下國內(nèi)外地球物理高性能計(jì)算應(yīng)用研究動態(tài)。
第一是超級集群。
第二是高性能處理器的應(yīng)用。
第三是并行文件系統(tǒng)。
超級集群的概念跟網(wǎng)格計(jì)算的概念緊密聯(lián)系。超級集群是集群的集群。超級集群是基于網(wǎng)格計(jì)算的概念。超級集群要解決作業(yè)調(diào)度、集群間的問題。
還有多cluster環(huán)境PSDM并行化。這是以后的網(wǎng)格計(jì)算的發(fā)展框架。地震數(shù)據(jù)采集以后經(jīng)過預(yù)處理,可能放在數(shù)據(jù)銀行里面,經(jīng)過幾個cluster的地震成像,然后進(jìn)行解釋。這樣可以對我們進(jìn)行指導(dǎo)。
高性能處理器的應(yīng)用,國內(nèi)外地球物理界關(guān)注的幾種新型的處理器,GPGPU通用圖形處理器,GPU也叫顯卡,原用于圖形渲染,可用于提升數(shù)值計(jì)算能力。例如,頻率域有限差分算法核心實(shí)現(xiàn)了比較CPU的8到16倍的加速。但也存在一些問題,編程較為困難,GPU初始化以及傳送信息比較慢,還有當(dāng)前的GPU存儲器有限。
第二就是說Larrabee,“許多核”處理器架構(gòu),混合CPU和GPU?;贗A(Intel架構(gòu)),當(dāng)然有一些新的指令,比如說向量存儲操作。這個還沒有正式推出來。
第三是Cell處理器(IBM單元處理器),這對于地球物理程序員是一個全新的架構(gòu),每個單元由一個CPU和八個SPU協(xié)同處理器高速計(jì)算核組成。Cell處理器峰值性能十分吸引人。supercomputer-on-a-chip。國外正在探索逆時偏移利用Cell處理器。 #p#page_title#e#
第四種是FPGA RC(可重新配置),F(xiàn)PGA是現(xiàn)場可編程門陣列的簡稱,可比常規(guī)的CPU提高性能一個數(shù)量級。
德克薩斯A&M大學(xué),利用FPGA建立了可重新配置的協(xié)處理器平臺,稱為SPACE(具有重配置引擎的地震處理加速器)。在單一FPGA中集成全流水線并行模塊。
那么這四種處理器的應(yīng)用前景,我覺得比較重要的要看到一個是持續(xù)速度能夠達(dá)到多少。而且特別是跟以后的普遍使用的芯片比較怎么樣。還有是不是容易編程,包括數(shù)據(jù)移動是不是比較方便。如果這個設(shè)備太特殊了,會不會有一些特殊的硬件風(fēng)險問題。
最后我說一下并行文件系統(tǒng),以后地球物理計(jì)算既是計(jì)算密集型,又是數(shù)據(jù)密集型。利用并行文件系統(tǒng)提升IO性能。一個是Lustre,還有一個PVFS2,GFS。利用高性能存儲技術(shù)解決IO瓶頸問題。
預(yù)測計(jì)算機(jī)技術(shù)的未來是危險的,但是,無論將來科學(xué)計(jì)算的方向是網(wǎng)格計(jì)算,還是把圖形渲染硬件應(yīng)用于數(shù)值計(jì)算,地震成像將是這些技術(shù)的大用戶。這是Stanford大學(xué)地球物理教授說的話。
但是現(xiàn)在面臨一些挑戰(zhàn),地球物理計(jì)算機(jī)應(yīng)用面臨挑戰(zhàn),研發(fā)開發(fā)地震數(shù)據(jù)并行處理平臺,充分利用高性能計(jì)算新技術(shù),滿足油氣勘探需要。