CAE軟件運(yùn)行與多核配置特點(diǎn)分析
從上世紀(jì)60年代計(jì)算機(jī)問(wèn)世以來(lái),計(jì)算機(jī)技術(shù)歷經(jīng)了半個(gè)世紀(jì)的緩慢發(fā)展。直到2000年前后,這場(chǎng)以計(jì)算機(jī)互聯(lián)和資源共享的第三次工業(yè)革命才發(fā)展至高潮,新興信息技術(shù)如雨后春筍般涌現(xiàn)。
進(jìn)入21世紀(jì)之后,硬件技術(shù)的發(fā)展與軟件技術(shù)發(fā)展呈現(xiàn)了不一樣的趨勢(shì),硬件技術(shù)的更新似乎總領(lǐng)先于軟件版本的更新。而企業(yè)購(gòu)買硬件產(chǎn)品,歸根到底是為了更好的應(yīng)用軟件,具體到制造企業(yè)就是更好的應(yīng)用CAD、CAE等涉及到大量運(yùn)算、對(duì)CPU和內(nèi)存要求較高的軟件產(chǎn)品。
為了探尋日前多核CPU對(duì)3D CADCAE運(yùn)算效率的提升,e-works近期策劃了主題為“四核CPU,超前消費(fèi)還是量入為出”的專題研討,采訪了活躍在中國(guó)市場(chǎng)的主流3D CAD和CAE主流廠商,了解它們提供的3D CADCAE軟件對(duì)于多核技術(shù)的支持,并調(diào)研了部分企業(yè)的應(yīng)用情況。在仔細(xì)分析大量觀點(diǎn)、查閱相關(guān)資料的基礎(chǔ)上,形成本報(bào)告,力求從中正、客觀、全面的角度反映“四核CPU對(duì)3D CADCAE運(yùn)算效率”的關(guān)系。
第一部分:四核CPU普及正當(dāng)時(shí)?
一 供應(yīng)商協(xié)力推廣多核CPU技術(shù)
Intel的首席技術(shù)執(zhí)行官不止一次指出,軟件的開(kāi)發(fā)和生產(chǎn)跟不上不斷提高的計(jì)算機(jī)硬件水平。也確是如此,隨著計(jì)算機(jī)硬件技術(shù)的發(fā)展,CPU業(yè)界于2005年發(fā)生了一次里程碑意義的革新,從2005年第一款雙核處理器面世起,市場(chǎng)得到了迅速響應(yīng),并以雙核最終取代了單核,得到了全面普及。核心數(shù)量決定了CPU在單位時(shí)間內(nèi)處理多個(gè)任務(wù)的速度,自從有了核心數(shù)量這個(gè)概念,就一直受到了用戶們的關(guān)注。自雙核出現(xiàn)以來(lái),CPU進(jìn)入了一個(gè)嶄新的時(shí)代,CPU處理速度大大提升是用戶們深有體會(huì)的。
而2005年以后,隨著雙核CPU越來(lái)越多地走進(jìn)人們視野,多核處理器技術(shù)也得到迅速發(fā)展。進(jìn)入2009年,CPU技術(shù)不斷發(fā)展,伴隨著價(jià)格的走低,多核處理器日漸發(fā)展成熟并趨于主流。四核CPU應(yīng)用也頻繁映入消費(fèi)者眼簾,在不經(jīng)意間,多核已經(jīng)來(lái)到了現(xiàn)實(shí)生活中。
在CPU生態(tài)系統(tǒng)中,處于不同生態(tài)環(huán)節(jié)的商家有著不同的觀點(diǎn),但總之,他們普遍認(rèn)為:四核CPU技術(shù)在今后一兩年為成為主流,并朝著多核的方向持續(xù)發(fā)展。
表1 供應(yīng)商對(duì)多核技術(shù)發(fā)展的觀點(diǎn)
英特爾中國(guó)服務(wù)器產(chǎn)品事業(yè)部產(chǎn)品經(jīng)理顧凡曾多次堅(jiān)持“多核CPU技術(shù)只是提供了硬件支持,企業(yè)的高性能計(jì)算或者超級(jí)計(jì)算應(yīng)當(dāng)回歸應(yīng)用本身”的觀點(diǎn),“雖然現(xiàn)在機(jī)器已經(jīng)達(dá)到千萬(wàn)億次,但是要找到這么‘大’的應(yīng)用比制造機(jī)器更難。”
英特爾亞太客戶響應(yīng)團(tuán)隊(duì)技術(shù)經(jīng)理何萬(wàn)青博士認(rèn)為,高性能計(jì)算的應(yīng)用主要是建立在軟件上,在3D CADCAE這塊中國(guó)幾乎是空白,軟件商的開(kāi)發(fā)成本非常高,同時(shí)大型的CAE軟件經(jīng)過(guò)一代一代的演進(jìn)才很完善,中國(guó)要從頭開(kāi)始,必須從零做起,還要去學(xué)會(huì)怎么保護(hù)知識(shí)產(chǎn)權(quán)。但毋庸置疑的是,英特爾會(huì)從源頭上提供技術(shù)支持,來(lái)滿足多核CPU技術(shù)所對(duì)應(yīng)的企業(yè)應(yīng)用。
而AMD大中華區(qū)計(jì)算產(chǎn)品部產(chǎn)品市場(chǎng)總監(jiān)唐志德則表示:“綜合來(lái)看,四核比雙核有60%以上性能的增加,在面對(duì)企業(yè)應(yīng)用等科學(xué)計(jì)算領(lǐng)域,四核有一個(gè)很好的提升。從我們美國(guó)首席技術(shù)官做的一個(gè)測(cè)評(píng)里看到,在仿真、模擬的應(yīng)用上,應(yīng)用四核CPU大概比單核節(jié)省70%的時(shí)間。”
用戶在逐漸認(rèn)可了雙核產(chǎn)品后,逐漸對(duì)核心有了明確的認(rèn)識(shí),知道其作用與價(jià)值。得到認(rèn)可的廠商也開(kāi)始認(rèn)識(shí)到巨大的市場(chǎng)正等待其占領(lǐng),于是不斷的推出高主頻、多核心的CPU產(chǎn)品,一次又一次的將CPU性能推到頂峰,從雙核到四核,CPU核心也經(jīng)歷了由有到多,由多到精的過(guò)程。
圖1 多核CPU下的異構(gòu)計(jì)算環(huán)境#p#page_title#e#
二 四核CPU漸入人心,已具備普及先決條件
據(jù)天極Datacenter八月份統(tǒng)計(jì)表明:8月四核CPU關(guān)注比例已經(jīng)超越雙核產(chǎn)品,關(guān)注比例為55.18%。而雙核產(chǎn)品本月成績(jī)?yōu)?6.13%。而三核CPU依然未能引起足夠關(guān)注,成績(jī)?yōu)?.69%。由此看出,用戶在8月開(kāi)始更加留意四核CPU產(chǎn)品。四核產(chǎn)品對(duì)比雙核產(chǎn)品價(jià)格上當(dāng)然會(huì)昂貴許多,但正是因?yàn)槿绱?,更加證明了經(jīng)濟(jì)形勢(shì)有所好轉(zhuǎn),四核CPU的關(guān)注度和市場(chǎng)影響力逐漸提升。
圖2 2009年8月CPU核心數(shù)量關(guān)注比例
圖3 2009年8月CPU四核產(chǎn)品TOP10排行
四核CPU的速度是十分顯著的,一款高端四核CPU可以輕松的做到卡巴與360同時(shí)查殺,并在短時(shí)間內(nèi)完成任務(wù),其間用戶甚至可以一邊看電影或打游戲,聽(tīng)歌等等,絕對(duì)不會(huì)出現(xiàn)滯留感。這就是多核心的獨(dú)特魅力。想象一下如果沒(méi)有這么多的CPU核心,用戶只能將上述任務(wù)分別進(jìn)行,那種等候的感覺(jué),是十分令人焦躁的,既浪費(fèi)了時(shí)間,又讓心情跌至谷底。因此,四核CPU作為高端產(chǎn)品雖然價(jià)格昂貴,卻真正的使用戶體會(huì)到了暢快淋漓的速度。
總之,對(duì)于四核CPU的潛在市場(chǎng)需求,具有可觀的前景。也正如Intel所說(shuō):用戶需要的不是單一產(chǎn)品,而是整體解決方案,因此系統(tǒng)集成商有許多工作需要做。這期間包括了3D CAD和CAE軟件提供商,在它們的軟件開(kāi)發(fā)和更新過(guò)程中,結(jié)合多核CPU技術(shù)的發(fā)展,為企業(yè)用戶更高效地應(yīng)用這些軟件打下基礎(chǔ)。#p#page_title#e#
第二部分:四核CPU在3D CAD、CAE中的應(yīng)用分析
作為主要為企業(yè)級(jí)應(yīng)用服務(wù)的3D CAD和CAE軟件產(chǎn)品,究竟會(huì)隨著多核CPU的革新帶來(lái)多大的效率提升,很多企業(yè)對(duì)此還比較未知。
企業(yè)購(gòu)買強(qiáng)大的硬件產(chǎn)品,歸根到底是為了更好的應(yīng)用軟件。具體到制造企業(yè)就是更好的應(yīng)用CAD、CAE等涉及到大量運(yùn)算、對(duì)CPU和內(nèi)存要求較高的軟件產(chǎn)品。而事實(shí)上一款軟件能否充分發(fā)揮出硬件性能,中間涉及到很多因素,諸如:
- 3D CAD、CAE軟件的運(yùn)行效率與CPU、內(nèi)存、顯卡以及操作系統(tǒng)的關(guān)系;
- 3D CAD、CAE軟件本身是否進(jìn)行了針對(duì)四核CPU的優(yōu)化?都能在支持四核CPU的操作系統(tǒng)上運(yùn)行?
正如好馬還需配好鞍,對(duì)于希望通過(guò)添置四核工作站來(lái)提升CAD、CAE軟件的應(yīng)用效率的制造業(yè)企業(yè)來(lái)說(shuō),亟需解決上述幾個(gè)問(wèn)題。而帶著這樣的問(wèn)題,e-works充分采訪調(diào)研了目前市場(chǎng)主流的3D CAD和CAE軟件供應(yīng)商,從各種軟件本身來(lái)探討對(duì)于多核CPU技術(shù)的支持。
圖5 Windows平臺(tái)下16核CPU同時(shí)工作的任務(wù)管理器狀態(tài)
一 四核CPU在3D CAD中的應(yīng)用普及為時(shí)尚遠(yuǎn)
對(duì)于企業(yè)級(jí)用戶來(lái)說(shuō),用3D CAD進(jìn)行產(chǎn)品設(shè)計(jì),多核CPU還處于推介普及階段,目前的大多數(shù)企業(yè)在進(jìn)行三維設(shè)計(jì)時(shí),還在使用雙核處理器的圖形工作站,甚至配置更低的PC。
1 多數(shù)3D CAD軟件已兼容多核CPU技術(shù)
2005年后,雙核CPU的逐漸普及,眾多的3D CAD供應(yīng)商在進(jìn)行新版本研發(fā)時(shí),就已經(jīng)開(kāi)始優(yōu)化軟件架構(gòu),以兼容多核CPU技術(shù),更大程度的提升軟件運(yùn)行效率。從調(diào)研的主流3D CAD軟件廠商來(lái)看,絕大多數(shù)已經(jīng)支持四核CPU技術(shù)。
表2 主流3D CAD對(duì)四核CPU的支持情況
對(duì)于國(guó)際市場(chǎng)主流的3D CAD產(chǎn)品,譬如Solidworks,從Solidworks2008版本開(kāi)始就支持四核CPU技術(shù)了。SolidWorks一級(jí)代理商北京盛維工程師介紹說(shuō):基于Windows平臺(tái)開(kāi)發(fā)的Solidworks,完全融入了Windows的操作習(xí)慣,從面向桌面的搜索,到基于VBC++語(yǔ)言的二次開(kāi)發(fā),甚至連CTRL+C、CTRL+V的習(xí)慣都延用下來(lái)了。所以在SolidWorks2008版本以后的軟件,也完全可以基于四核CPU來(lái)進(jìn)行運(yùn)行,特別是對(duì)于大裝配體的設(shè)計(jì),效率提升非常明顯。
SolidEdge產(chǎn)品經(jīng)理雷俊雄說(shuō):如果只是進(jìn)行簡(jiǎn)單的設(shè)計(jì)工作, 幾乎所有的3D CAD軟件對(duì)硬件的要求都不高(如圖6所示)。但要想三維設(shè)計(jì)時(shí)計(jì)算機(jī)運(yùn)行地足夠流暢,就得使用盡量高配的計(jì)算機(jī)。
圖6 3D CAD、CAE軟件最低推薦配置
對(duì)于PROE來(lái)說(shuō),盡管也支持多核CPU,但在進(jìn)行三維繪圖和工業(yè)設(shè)計(jì)的過(guò)程中,多數(shù)企業(yè)還是使用雙核CPU的PC,如要要用到PROE里的Mechanica分析模塊,才有可能用高配置的計(jì)算機(jī),調(diào)用多CPU進(jìn)行運(yùn)算。
圖7 PROE硬件配置需求單
2 企業(yè)硬件更新落后于硬件技術(shù)發(fā)展
盡管目前主流的3D CAD軟件基本上支持4核CPU技術(shù),企業(yè)的設(shè)計(jì)工程師們也認(rèn)識(shí)到多核CPU技術(shù)可以很大程度地提高設(shè)計(jì)效率,但4核CPU在企業(yè)的普及使用程度卻并不樂(lè)觀。
四機(jī)塞瓦的CAD工程師熊剛說(shuō):“硬件技術(shù)更新太快,現(xiàn)在換了更好的計(jì)算機(jī),過(guò)了半年或者一年還是淘汰了。而目前的計(jì)算機(jī)也能運(yùn)行基本的操作,盡管效率上有待提升,但企業(yè)本著控制成本的原則,對(duì)升級(jí)硬件還是持觀望態(tài)度”。熊剛的這種解釋基本也代表了目前制造業(yè)企業(yè)里普遍存在這樣一種觀點(diǎn)。
另外,如NX、CATIA、SolidEdge、Inventor等主流3D CAD,也都處于這樣的狀況。另一位制造企業(yè)的工程師則這樣評(píng)述CPU、內(nèi)存和顯卡之間的關(guān)系:“在進(jìn)行三維設(shè)計(jì)時(shí),cpu決定了處理速度,內(nèi)存決定了運(yùn)行速度,顯卡決定了顯示效果,顯示流暢才是真的流暢。”
蘇州江南嘉捷電梯股份有限公司的設(shè)計(jì)工程師丁建新介紹:在日常的設(shè)計(jì)工作中,工程師們都用常規(guī)的臺(tái)式機(jī),涉及到較為復(fù)雜的裝配,設(shè)計(jì)部門(mén)有一臺(tái)專用的四核圖形工作站,以備用。#p#page_title#e#
二 多核CPU在CAE的應(yīng)用呈兩極分化趨勢(shì)
對(duì)于企業(yè)的CAE用戶來(lái)說(shuō),目前處于兩級(jí)分化狀態(tài):一方面,對(duì)于簡(jiǎn)單的分析工作,用圖形工作站也勉強(qiáng)可以運(yùn)行,即使效率并不高,但大多數(shù)企業(yè)認(rèn)為只要能夠得出結(jié)果,就可以接受;另一方面,真正涉及到復(fù)雜的分析、仿真工作,對(duì)于具有獨(dú)立CAE研究院所或者CAE中心的企業(yè)來(lái)說(shuō),僅僅用四核CPU來(lái)運(yùn)算,仍顯不夠,他們往往采用集群式HPC來(lái)完成。所以,四核CPU在CAE用戶中的普及程度,依然不夠廣泛。
1 簡(jiǎn)單分析工作仍使用圖形工作站
伴隨著硬件技術(shù)的發(fā)展,CAE軟件要不停的開(kāi)發(fā)和更新,滿足特定的功能指標(biāo),進(jìn)行相應(yīng)的優(yōu)化設(shè)置,才能充分發(fā)揮硬件的能力。例如,一個(gè)軟件不能支持并行計(jì)算(SMP or MPP),就無(wú)法同時(shí)使用多核并行求解,也就無(wú)法充分發(fā)揮多核心多CPU的作用。
與3D CAD軟件不同的是,市場(chǎng)上主流的CAE軟件基本都具備并行版本,因此對(duì)多核處理器的支持也更加的順其自然。
表3 主流CAE軟件對(duì)多核CPU的支持情況
經(jīng)緯紡機(jī)的CAE室主任(原CAD室主任)張心忠在介紹他們企業(yè)的情況時(shí)說(shuō):CAD室主要用的是PROE和SolidWorks,CAE用的是PROE的Mechanica模塊和MSC.ADAMS。因?yàn)槭欠珠_(kāi)配置的電腦,所以配置并不相同。對(duì)于PROE來(lái)說(shuō),對(duì)硬件的配置比較高。需要用到2G以上的雙核CPU。而Solidworks對(duì)硬件要求相對(duì)較低。在進(jìn)行多體動(dòng)力學(xué)仿真時(shí),往往將PROE的模型導(dǎo)入至Adams中,這時(shí)候往往導(dǎo)入簡(jiǎn)化模型,反而沒(méi)有在PROE中的模型大,所以對(duì)硬件的配置反而較低。
對(duì)于諸如經(jīng)緯紡機(jī)、嘉捷電梯此類的企業(yè)來(lái)說(shuō),分析工作較為簡(jiǎn)單,雖說(shuō)可以使用四核CPU技術(shù)來(lái)提升仿真分析效率,但普通的工作站也基本能勝任。因此也呈現(xiàn)了諸多企業(yè)在做簡(jiǎn)單分析工作仍由圖形工作站的現(xiàn)狀。
2 專業(yè)CAE分析采用高性能計(jì)算機(jī)集群
而另一方面,對(duì)于大型的有限元、前后處理、優(yōu)化等專業(yè)計(jì)算,我國(guó)制造業(yè)表現(xiàn)得并不落后,在很多整車、整機(jī)廠,都配有獨(dú)立的CAE研究所或CAE研究中心,采用高性能計(jì)算機(jī)集群進(jìn)行計(jì)算工作。
正因?yàn)槿绱?,多核CPU技術(shù)在這些計(jì)算機(jī)集群中就利用地淋漓盡致。從4核到64核,所得到的效率提升也非常明顯。
西安超算所的一位工程師介紹說(shuō):有限元作為一種分析方法,可以用在力學(xué)、流體等多種物理量的分析。在常用CAE軟件中,做網(wǎng)格劃分一般都是串行任務(wù),使用CAE的串行版就足夠,因此只需要用單核CPU。而對(duì)于優(yōu)化、前后處理等環(huán)節(jié),使用并行版CAE軟件,可以極大提升效率。
圖8 Abaqus計(jì)算相同自由度模型64核CPU比4核CPU效率提升92%
達(dá)索系統(tǒng)Simulia工程師孟龍博士在介紹Abaqus在應(yīng)用多核CPU說(shuō):“目前Abaqus的并行版最多已經(jīng)可以支撐512個(gè)計(jì)算核心。每增加一倍的CPU核數(shù),運(yùn)行效率就得到一定的提升,但因?yàn)樯婕熬€程的沖突、多任務(wù)的排隊(duì)等待,造成并不是成倍數(shù)的增加。比如說(shuō)四核CPU的運(yùn)算效率是單核的三倍多,64核CPU的運(yùn)算效率只是4核CPU10倍多。另外,采用多核CPU與模型的自由度也有很大關(guān)系。”
圖9 在Windows Server2003下運(yùn)行Simulia,不同核數(shù)CPU對(duì)應(yīng)的時(shí)間關(guān)系
賽特達(dá)的賴宇陽(yáng)先生說(shuō):譬如優(yōu)化計(jì)算和數(shù)據(jù)處理軟件Isight,它在優(yōu)化計(jì)算和數(shù)據(jù)處理方面對(duì)內(nèi)存、CPU有較高要求但是跟CAD/CAE軟件相比,顯卡資源占用不高。Isight對(duì)雙核CPU, 64bit操作系統(tǒng)進(jìn)行過(guò)優(yōu)化,提高數(shù)據(jù)處理性能和并行計(jì)算能力。主要是針對(duì)并行計(jì)算、網(wǎng)格計(jì)算方面,發(fā)揮硬件的計(jì)算潛力。
而作為平臺(tái)級(jí)仿真解決方案的軟件來(lái)說(shuō),譬如比利時(shí)LMS公司的工程師唐昊介紹說(shuō):Virtual.lab 和Imagine.lab 本身對(duì)硬件沒(méi)有什么要求。由于使用virtual.lab往往涉及到大型有限元的計(jì)算,內(nèi)存大小和cpu處理速度往往決定了求解的速度。特別值得一提的是:有限元分析軟件的計(jì)算速度提升非常依賴大內(nèi)存的支持,只有內(nèi)存足夠大,才能把所有數(shù)據(jù)一次放進(jìn)內(nèi)存,才能最快對(duì)數(shù)據(jù)計(jì)算和得到結(jié)果,否則當(dāng)物理內(nèi)存不足的時(shí)候,系統(tǒng)就會(huì)使用虛擬內(nèi)存(磁盤(pán)部分作為虛擬內(nèi)存),這樣降大大降低性能。CAE計(jì)算在初始化、中間結(jié)果保存和計(jì)算結(jié)果輸出時(shí)都會(huì)有密集的數(shù)據(jù)IO操作,而且目前并行計(jì)算程序的IO操作大多還是串行進(jìn)行的,因此IO的性能經(jīng)常是并行計(jì)算程序的瓶頸所在。通過(guò)RAID進(jìn)一步提升讀取速度,通過(guò)多塊磁盤(pán)RAID,磁盤(pán)的IO速度可以成倍提高。
根據(jù)問(wèn)題不同而定。Virtual.lab和imagine.lab均支持多種并行方式,并且支持64位系統(tǒng)和硬件。理論上可以調(diào)用任意多的內(nèi)存和cpu以加快計(jì)算速度。Virtual.Lab完全支持四核CPU,并能實(shí)現(xiàn)多種并行方式(分域并行,分頻并行)。
3 運(yùn)用多核CPU進(jìn)行CAE分析的挑戰(zhàn)
Altair的技術(shù)支持經(jīng)理洪清泉先生在解釋Hyperworks進(jìn)行多核CPU運(yùn)算時(shí)介紹:HyperWorks圖形界面類模塊的性能主要跟顯卡有關(guān),處理大模型(100萬(wàn)單元以上)和超大模型(1000萬(wàn)單元以上)時(shí),為了獲得流暢的顯示效果,需要性能良好的顯卡,經(jīng)過(guò)大量的測(cè)試和優(yōu)化,可以為客戶提供顯卡推薦配置。對(duì)于求解器類模塊,主要是進(jìn)行數(shù)值計(jì)算,不涉及到實(shí)時(shí)的圖形顯示與處理,所以并不需要有專業(yè)的顯卡,而主要對(duì)CPU速度、多核數(shù)目、內(nèi)存帶寬、硬盤(pán)速度等有關(guān)系。
另外,洪清泉也表示:同一CAE軟件下的不同功能模塊,對(duì)硬件的要求也不一致,譬如以HyperWorks中的HyperMesh,Radioss和OptiStruct為例:HyperMesh具有極好的圖形驅(qū)動(dòng)和利用能力,200萬(wàn)單元的模型在普通顯卡如Quadro FX 570(512M顯存)上即可以非常流暢的操作和顯示;Radioss顯式并行計(jì)算具有業(yè)界最佳的多核加速比,計(jì)算速度與CPU核數(shù)呈良好的線性關(guān)系;OptiStruct優(yōu)化計(jì)算具有極佳的內(nèi)存利用效率,在普通2G內(nèi)存的機(jī)器上即可求解超過(guò)20萬(wàn)個(gè)變量的多約束多工況優(yōu)化問(wèn)題,4G內(nèi)存以上的機(jī)器可以處理超過(guò)50萬(wàn)個(gè)變量的優(yōu)化問(wèn)題。
而CDAJ的工程師則說(shuō):對(duì)于一維分析軟件GT-SUITE因?yàn)橛?jì)算量不是很大,對(duì)計(jì)算機(jī)的要求不是很高。
而對(duì)于計(jì)算流體動(dòng)力學(xué)(CFD)分析來(lái)說(shuō),隨著計(jì)算模型的復(fù)雜程度,所需要的硬件配置肯定也會(huì)有所提高。以一個(gè)工程應(yīng)用中常見(jiàn)的規(guī)模在100~200萬(wàn)Polyhedral(多面體)網(wǎng)格的計(jì)算模型來(lái)說(shuō),推薦至少配備4GB的物理內(nèi)存,顯存128MB的Nvidia Quadro FX系列顯卡,主頻在2GHz以上的Intel酷睿系列或至強(qiáng)Xeon處理器。其中,對(duì)內(nèi)存和顯存的要求比較嚴(yán)格,如果物理內(nèi)存不足,在網(wǎng)格生成或者求解計(jì)算時(shí)需要調(diào)用虛擬內(nèi)存的話,工作效率就會(huì)大大降低;而顯存不足會(huì)影響到計(jì)算模型的網(wǎng)格顯示及結(jié)果后處理,易造成顯示速度慢、模型無(wú)法拖動(dòng)查看等問(wèn)題。而CPU的內(nèi)核數(shù)、主頻、二級(jí)緩存等因素主要影響到計(jì)算速度的快慢,這就依據(jù)實(shí)際項(xiàng)目可以承受的計(jì)算時(shí)間而定。
以CFD軟件STAR-CD為例,下圖是一個(gè)并行計(jì)算的測(cè)試圖,測(cè)試模型是一個(gè)網(wǎng)格數(shù)目為600萬(wàn)的汽車外流分析。使用4個(gè)node,單個(gè)node的配置都是2個(gè)4核的CPU。所對(duì)比的并行測(cè)試網(wǎng)絡(luò)環(huán)境分別為千兆以太網(wǎng)和InfiniBand。從測(cè)試圖中的計(jì)算時(shí)間來(lái)看,使用4核CPU工作時(shí),其計(jì)算效率約是使用雙核CPU時(shí)的1.8倍,是使用單核CPU時(shí)的3.5倍。
此外,從測(cè)試圖中還可以看到,不同的網(wǎng)絡(luò)環(huán)境對(duì)并行計(jì)算效率的提升也有著很大的影響。
圖10 STAR-CD V4并行性能比較
在眾多的CAE軟件新版本中,對(duì)多核技術(shù)進(jìn)行優(yōu)化的也不在少數(shù)。譬如在最新的HyperWorks10.0中的求解器類應(yīng)用程序?qū)iT(mén)針對(duì)多核進(jìn)行優(yōu)化,例如:RADIOSS顯式并行求解會(huì)盡量將相鄰的domains(Radioss獨(dú)有的對(duì)大模型進(jìn)行分區(qū)并指定不同求解設(shè)置的技術(shù))分配到同一個(gè)CPU上,減少機(jī)器和機(jī)器之間的通訊量,充分利用本機(jī)上的多核資源;Radioss隱式線性多工況求解速度在多核機(jī)器上大幅度提高,對(duì)于四核機(jī)器,速度比單核最快可提高達(dá)3.8倍,對(duì)于8核機(jī)器,速度比單核最快可提高達(dá)7倍。此外,OptiStruc優(yōu)化求解過(guò)程中的靈敏度計(jì)算也針對(duì)多核機(jī)器進(jìn)行了優(yōu)化。
對(duì)于圖形類應(yīng)用,用戶從多核心技術(shù)上得到好處相對(duì)有限,主要是因?yàn)闃I(yè)界主流的圖形引擎OpenGL尚未完全對(duì)多核進(jìn)行改寫(xiě)。當(dāng)然,用戶還是可以從多核技術(shù)上得到好處,例如可以同時(shí)開(kāi)啟多個(gè)HyperMesh而不會(huì)出現(xiàn)單核心時(shí)機(jī)器響應(yīng)速度慢的問(wèn)題。#p#page_title#e#
1 顯卡與運(yùn)算效率的關(guān)系
無(wú)容置疑,在相同核數(shù)CPU的前提下,顯卡對(duì)各種3D CADCAE軟件的效率起著非常重要的作用。那么,顯卡對(duì)多核CPU運(yùn)算效率起著怎么樣的影響呢?
首先,在3D CAD軟件中,以Inventor為例,模型的渲染與顯卡有著密不可分的關(guān)系。專業(yè)和非專業(yè)顯卡的區(qū)別在于在制作模型的視圖中賦予物體反射或折射等的材質(zhì)后可以在平滑+高光的情況下看出一些簡(jiǎn)單的反射折射效果。
而在PROE和Solidworks中,相對(duì)顯卡的依賴要小,而以曲面功能見(jiàn)長(zhǎng)的CATIA和NX,在進(jìn)行大裝配體操作和渲染工作的時(shí)候,也表現(xiàn)出來(lái)了對(duì)專業(yè)顯卡的依賴。
圖11 專業(yè)和非專業(yè)顯卡渲染的發(fā)動(dòng)機(jī)效果
在專業(yè)圖形顯示領(lǐng)域,NVIDIA提出了GPU(圖形處理器)的概念,以專門(mén)的圖形處理芯片完成圖形顯示部分,從而減小對(duì)CPU的依賴。雖然NVIDIA公司在1999年發(fā)布GeForce 256圖形處理芯片時(shí)就提出GPU的概念,但很長(zhǎng)一段時(shí)間用在游戲、傳媒娛樂(lè)業(yè),關(guān)于GPU在3D CADCAE等數(shù)值計(jì)算中的運(yùn)用,其發(fā)展比多核心CPU技術(shù)更晚,目前還是起步階段。
CPU比較擅長(zhǎng)數(shù)值計(jì)算,而GPU擅長(zhǎng)浮點(diǎn)計(jì)算。 盡管有一些特定用途的軟件已經(jīng)可以利用GPU進(jìn)行數(shù)值計(jì)算,而且也達(dá)到相當(dāng)好的速度提升,但是CAE軟件并不是完全純數(shù)值計(jì)算,還有相當(dāng)部分的邏輯判斷,而這并不是GPU的強(qiáng)項(xiàng)。如果是對(duì)浮點(diǎn)運(yùn)算要求較高的計(jì)算項(xiàng)目,GPU則可以發(fā)揮其最大的作用,提高計(jì)算效率。此外,CAE軟件還需要針對(duì)不同平臺(tái),如Linux,IBM AIX,HP UX等進(jìn)行專門(mén)的性能優(yōu)化,對(duì)內(nèi)存和硬盤(pán)的帶寬進(jìn)行有效的利用,才能充分發(fā)揮計(jì)算機(jī)硬件的能力。
2 軟件版本與運(yùn)算效率的關(guān)系
此外,在不同核數(shù)CPU下,軟件版本的高低也對(duì)運(yùn)算效率有所影響。以Fluent為例,在相同的操作系統(tǒng)下,分別采用不同CPU核數(shù)進(jìn)行運(yùn)算,最終的結(jié)果顯示,較新的軟件版本比舊版本的運(yùn)算效率高。(如圖12所示)
圖12 版本軟件在不同CPU核數(shù)下對(duì)運(yùn)算效率的影響
3 操作系統(tǒng)與運(yùn)算效率的關(guān)系
在采用不同核數(shù)的CPU進(jìn)行CAE大型運(yùn)算時(shí),除了上述因素之外,操作系統(tǒng)對(duì)CAE運(yùn)算效率也有著細(xì)微的影響。對(duì)于超大規(guī)模的集群式CAE運(yùn)算來(lái)說(shuō),因?yàn)長(zhǎng)inux操作系統(tǒng)的低成本、低系統(tǒng)資源占有率和高可擴(kuò)展性,讓大多數(shù)CAE用戶都沿用了Linux操作系統(tǒng),盡管從雙核一直到64核,Windows操作系統(tǒng)相比Linux操作系統(tǒng)的效率有著微小的差距,但隨著核數(shù)的增加,這種差距越來(lái)越小,而更多地與軟件模型、自由度以及硬件配置相關(guān)。在某種特殊的測(cè)試場(chǎng)合,在Fluent中通過(guò)64核進(jìn)行計(jì)算,甚至Windows操作系統(tǒng)效率要高于Linux操作系統(tǒng)。
圖13 操作系統(tǒng)在不同CPU核數(shù)下對(duì)運(yùn)算效率的影響
另外,隨著操作系統(tǒng)的升級(jí),本身也會(huì)帶來(lái)運(yùn)算效率的提升。譬如微軟的Windows Compute Cluster Server 2003在運(yùn)行Fluent時(shí),通過(guò)增加CPU核數(shù)提升的效率(黃線所示)是一條斜率逐漸減少的線,而Fluent在Windows HPC Server 2008上運(yùn)行的時(shí)候,通過(guò)增加CPU核數(shù)提升的效率(紅線所示)則接近一條斜率一致的直線。由此可見(jiàn),通過(guò)增加CPU核數(shù)提升計(jì)算效率也受到操作系統(tǒng)的影響。
圖14 不同操作系統(tǒng)版本對(duì)運(yùn)算效率的影響
但總的來(lái)說(shuō),操作系統(tǒng)與CAE運(yùn)算效率的關(guān)系比較小,更多的取決于軟件模型、自由度、硬件配置等。#p#page_title#e#
第三部分 四核CPU技術(shù)在制造企業(yè)的拓展應(yīng)用
因?yàn)榉N種原因,四核CPU技術(shù)在現(xiàn)階段并沒(méi)有如同雙核誕生之時(shí)那般地發(fā)展迅速,對(duì)于看重實(shí)際效用的制造企業(yè)來(lái)說(shuō),只有物超所值的時(shí)候,他們才會(huì)購(gòu)買。但其實(shí),除了真正意思上購(gòu)買多核CPU來(lái)升級(jí)企業(yè)的硬件,還有許多其他的應(yīng)用模式,同樣可以為企業(yè)帶來(lái)價(jià)值。
在此也探討一下多核CPU技術(shù)在制造企業(yè)的拓展應(yīng)用。
1 多圖形工作站搭建“HPC集群”
首先,對(duì)于具備CAD設(shè)計(jì)室或CAE研究室的企業(yè)來(lái)說(shuō),通常會(huì)有數(shù)臺(tái)圖形工作站或者一般性能的PC。對(duì)于這些工作組級(jí)的PC,微軟新推出的Windows HPC 2008操作系統(tǒng),提供了一種將它們并行起來(lái)的方式:白天,不同的工程師們?nèi)匀豢梢园凑諔T例使用自己的電腦進(jìn)行各自設(shè)計(jì)、分析工作;晚上,通過(guò)圖形工作站上的Windows HPC 2008操作系統(tǒng)實(shí)現(xiàn)鏈接,組成一個(gè)小型的拓?fù)渚W(wǎng)絡(luò),計(jì)算某些需要高性能服務(wù)器才能完成的工作。(如圖15所示)
圖15 多圖形工作站構(gòu)建的HPC集群
簡(jiǎn)單來(lái)說(shuō),這是一種整合有限的計(jì)算資源、讓其發(fā)揮更大效用的一種方式,也是一種變相地實(shí)現(xiàn)多CPU運(yùn)算的方式。對(duì)于一些承擔(dān)不起高性能HPC集群或者并不常用到大型計(jì)算的企業(yè)來(lái)說(shuō),不失為一種省錢卻能解決問(wèn)題的有效途徑。
如今,工程仿真問(wèn)題可能涉及整個(gè)系統(tǒng),這意味著產(chǎn)品開(kāi)發(fā)團(tuán)隊(duì)獲得更加詳細(xì)的幾何結(jié)構(gòu)和考慮所有CAD組件的時(shí)候,建立的模型會(huì)越來(lái)越大。此外,對(duì)復(fù)雜物理現(xiàn)象高保真再現(xiàn)——包括對(duì)湍流、空氣聲學(xué)、振動(dòng)和多物理場(chǎng)的處理——也顯著提高了對(duì)工程仿真計(jì)算能力的要求。因此,HPC系統(tǒng)就顯得至關(guān)重要,它能夠提供建立大型模型時(shí)所需的能力,滿足工程決策時(shí)對(duì)開(kāi)發(fā)時(shí)間提出的要求,在幾天甚至幾小時(shí)內(nèi)就能完成以前需數(shù)周甚至數(shù)月才能完成的任務(wù)。
當(dāng)然,通過(guò)多圖形工作站搭建的HPC集群,需要一種專用的高速低延遲網(wǎng)絡(luò),才能保證數(shù)臺(tái)計(jì)算機(jī)之間的數(shù)據(jù)暢通。這也是搭建HPC集群唯一也是較大的瓶頸。
2 發(fā)展中低端超算中心
除了搭建企業(yè)自己的HPC集群這種模式,很多中小型企業(yè)也可以通過(guò)租用計(jì)算平臺(tái)的方式來(lái)完成計(jì)算任務(wù),盡管企業(yè)自身沒(méi)有多核CPU平臺(tái),卻可以享用到多核CPU帶來(lái)的效率提升。
比較典型的有上海超算中心,即使對(duì)于有獨(dú)立HPC服務(wù)器的大型企業(yè)來(lái)說(shuō),如果要完成超出企業(yè)自己HPC服務(wù)器所能及的工作任務(wù)時(shí),就必須租用功能更加強(qiáng)大的超算中心來(lái)完成了。但是,上海超算中心峰值速度超過(guò)10萬(wàn)億次/秒的“曙光4000A”高性能計(jì)算機(jī),對(duì)于絕大多數(shù)的企業(yè)來(lái)說(shuō),并無(wú)用武之地,也著實(shí)不需要。所以,發(fā)展更多的中低端超算中心,提供給企業(yè)、研究所來(lái)處理大型計(jì)算工作,也不失為一種可行的方式。
其實(shí),在國(guó)內(nèi)已經(jīng)有類似先例,譬如西安超算所,作為西北地區(qū)一家專門(mén)從事高性能計(jì)算的單位,就提供TYAN的刀片集群及各種專業(yè)工作站、服務(wù)器,相比大型超算中心而言,TYAN的配置并不足以令人瞠目結(jié)舌,卻能運(yùn)行大多數(shù)計(jì)算項(xiàng)目。
據(jù)西安超算所的一個(gè)工程師介紹,他們?cè)赥YAN上配置了目前的絕大多數(shù)企業(yè)級(jí)大型通用有限元商業(yè)軟件,如:NASTRAN,ASKA,SAP,ANSYS,MARC,ABAQUS,JIFEX等等。這些軟件遍布機(jī)械制造、材料加工、航空航天、汽車、土木建筑、電子電器、國(guó)防軍工、船舶、鐵道、石化、能源等各個(gè)行業(yè)的應(yīng)用,因此也可以幫助企業(yè)完成一些大型的計(jì)算項(xiàng)目。
表4 TYAN FX71 刀片配置
3 構(gòu)建企業(yè)的“云計(jì)算”
從云計(jì)算概念推廣以來(lái),雖然在其發(fā)展過(guò)程中有非常多的瓶頸和障礙,但不可否認(rèn)給企業(yè)級(jí)應(yīng)用提供了很多借鑒的方向。譬如,搭建大型集團(tuán)企業(yè)的“私有云”和工業(yè)園區(qū)的“公共云”。
中國(guó)很多軍工、航天航空、船舶制造業(yè),都以“集團(tuán)”的形式呈現(xiàn)。同一集團(tuán)的不同研究部門(mén)、研究院所,往往分開(kāi)升級(jí)硬件配置或分別購(gòu)買軟件產(chǎn)品,對(duì)于高端的軟硬件設(shè)備,實(shí)際的利用率并不高,這就造成了一定程度的資源浪費(fèi)。在云計(jì)算技術(shù)逐漸成熟的前提下,如果可以構(gòu)建集團(tuán)的“私有云”,在集團(tuán)范圍內(nèi)共享計(jì)算資源,不僅節(jié)省了資源,還可以在同等支出的情況下,購(gòu)買更加高配置的硬件和軟件產(chǎn)品,滿足更多計(jì)算項(xiàng)目的需求。
另外,對(duì)于在中國(guó)不斷發(fā)展起來(lái)的工業(yè)園區(qū)(譬如:蘇州工業(yè)園、重慶永川工業(yè)園區(qū)、浙江嘉善姚莊工業(yè)園區(qū)、上海南匯工業(yè)園區(qū)等等),也可以建立園區(qū)內(nèi)的“公共云”,結(jié)合園區(qū)內(nèi)企業(yè)特點(diǎn),提供相應(yīng)的大型“云計(jì)算”平臺(tái)。
今年,安世亞太推出的“研發(fā)云計(jì)算”正是借鑒于此,目前已經(jīng)與合作伙伴策劃和搭建了有益于企業(yè)大型計(jì)算任務(wù)的“云計(jì)算”平臺(tái)。盡管這種模式只是一種狹義的“云計(jì)算”,卻為企業(yè)提供了一種應(yīng)用多核CPU技術(shù)的延伸模式。
諸如集團(tuán)企業(yè)的“私有云”和工業(yè)園區(qū)的“公共云”,還可以按行業(yè)劃分實(shí)現(xiàn)具有行業(yè)特色的“行業(yè)云”等等。
結(jié)語(yǔ)
綜合上述分析:企業(yè)一方面面對(duì)日趨復(fù)雜的產(chǎn)品設(shè)計(jì)及業(yè)務(wù)量的提升,導(dǎo)致數(shù)據(jù)量的處理日益龐大;另一方面軟件功能不斷升級(jí),這就要求更高配的硬件平臺(tái)來(lái)支撐更加強(qiáng)大的功能;第三方面,四核CPU的價(jià)格逐漸走低,用戶的接納程度越來(lái)越高。
目前四核CPU的普及正經(jīng)歷著幾年前雙核CPU所走的路,盡管四核CPU在制造業(yè)企業(yè)3D CADCAE應(yīng)用中的普及過(guò)程更為緩慢,但毋庸置疑的是,四核CPU的應(yīng)用會(huì)隨著企業(yè)需求、價(jià)格拐點(diǎn)等因素逐漸普及。
作為不同解決方案的提供商來(lái)說(shuō),Intel也好、AMD也好,3D CADCAE軟件供應(yīng)商也好,要不斷地更新和豐富自身的技術(shù),以提供更加快速、高效的利器;而作為企業(yè)來(lái)說(shuō),更重要的是認(rèn)清這些技術(shù)給自己帶來(lái)的價(jià)值,當(dāng)這些技術(shù)的確可以為企業(yè)帶來(lái)物超所值的價(jià)值時(shí),企業(yè)就可以考慮“量入為出”的投入了,而不再是“超前消費(fèi)”。