影響CAE高性能計算的硬件配置解析
進入21世紀之前,CAE的工作者一直很辛苦。只要能模擬真實世界,辛苦的工作、漫長的等待和昂貴的開銷都在所不惜。但是,面對有限發(fā)展的CAE技術和計算機資源,人們并不能如愿。為復雜產(chǎn)品建模時,分析師不得不在假設與近似之間徘徊。模擬真實世界,愿望多于現(xiàn)實。
在假設和近似之間徘徊久了,分析師便建立了一項復雜的學問——仿真分析規(guī)范,指導人們在有限的CAE技術和計算機資源面前,如何進行條件假設和近似處理,才能保證分析結(jié)果最接近真實世界。規(guī)則保證了秩序,卻約束了自由。CAE的工作者一直在必然王國中掙扎,遠沒進入自由王國,直到CAE高性能計算技術得到大力發(fā)展的今天。
高性能計算(HPC:High Performance Computing)是一種可以充分利用最廣泛的計算資源進行大型問題求解的技術,廣泛應用于各行各業(yè)。CAE是高性能計算的重要陣地之一。從上世紀80年代初,ANSYS公司就在HPC研究上投入較大力量。該公司的創(chuàng)始人John Swanson博士準確預測了CAE-HPC的發(fā)展趨勢,提出ANSYS的HPC發(fā)展戰(zhàn)略。2004年,ANSYS創(chuàng)紀錄地進行了一個1億自由度的問題的計算,確立了這個CAE巨人在HPC的領導地位。
CAE-HPC的目標是“用最低的成本模擬真實世界”,即“用最短的時間、最少的人力、最低的資金,進行復雜單場模擬和多場耦合分析”。ANSYS的三把HPC利斧——大內(nèi)存支持、分布式并行計算和變分技術(VT),正在摧毀束縛CAE自由的堅冰。
1. 大內(nèi)存求解大問題
CAE計算需要較多的內(nèi)存已是常識。在過去32位的年代,內(nèi)存再多也用不上?,F(xiàn)在,64位操作系統(tǒng)的內(nèi)存尋址范圍使得CAE應用軟件對內(nèi)存的使用幾乎沒有上限。Windows XP-64操作系統(tǒng)的推出對普通CAE用戶來說是一大喜事,Windows畢竟是普通用戶最熟悉和最經(jīng)濟的操作系統(tǒng)。
對大內(nèi)存的支持讓CAE在前后處理方面獲得自由,使其在大模型的建立、大圖形的處理以及大數(shù)據(jù)庫的操作方面幾乎沒有障礙,用戶可以建立高保真模型。
首先,大內(nèi)存允許我們把模型建立得很精細。CAE的目標之一是找到模型中的熱點,也就是危險點。即使同一模型,對于不同的工況,熱點可能不同。為了準確捕捉熱點,通常的方法是不同工況建立不同的模型,這不但繁瑣,而且不經(jīng)濟。疲勞計算問題更嚴重,如果工況組合比較復雜,熱點的位置幾乎不能預測,即使我們愿意建立多種模型,但仍可能無法捕捉到所有的疲勞熱點。但如果建立了每一處的單元密度都很高的精細模型,我們就不會錯過任何一個熱點。
其次,大內(nèi)存允許我們建立整機裝配模型。過去,由于內(nèi)存限制,我們往往只提取產(chǎn)品中重要的零部件進行分析。這里存在一個問題就是,產(chǎn)品的載荷和約束并不是直接施加在該零部件上,而是由其它零部件傳遞過來。只對單一零部件進行分析時,就不得不做邊界條件假設。如果使用整機模型,這種問題便不存在。但是,建立整機模型卻存在另一個問題:零部件之間的接觸。復雜產(chǎn)品千百個零部件之間的接觸單元定義如果完全靠手工進行,工作量不可想象。ANSYS軟件提供了一個非常實用的功能——自動接觸可以解決這個問題。ANSYS在讀入CAD模型時自動探測裝配關系,并自動建立接觸單元。
再次,大內(nèi)存可提高建模速度。通常,CAE讀入CAD模型的時候需要刪除細小特征(Defeature),以使得CAE單元減少。有時還需要對于薄細結(jié)構(gòu)抽中面和抽中線,用以建立梁或殼單元。大內(nèi)存允許我們可以使用細小的尺寸在CAD模型上直接劃分網(wǎng)格,梁或殼單元可以用實體單元來替代,并不影響精度,而且在結(jié)構(gòu)連接部位的結(jié)果更精確。
最后,在大模型進行計算時,大內(nèi)存允許中間數(shù)據(jù)存儲在內(nèi)存中而不需要和硬盤交換數(shù)據(jù),可以減少I/O頻度,明顯提高速度。有時I/O問題可能是大問題求解得殺手。因此,大內(nèi)存是求解大問題的基礎。 #p#page_title#e#
2. 分布式并行提高計算速度
并行計算是未來計算機的唯一高速公路。過去,計算機提高速度的方法主要靠提高CPU的時鐘速度。而今,CPU的時鐘速度已經(jīng)接近極限,計算機性能提高的唯一通路是發(fā)展多核計算機。雙核及四核處理器已經(jīng)推出,并行計算即將成為人們的每日工作。
集群(Cluster)是并行計算架構(gòu)中成本最低的一種。即使性能不高的計算機構(gòu)成的集群仍然可以獲得良好的并行性能。因此,集群模式的并行算法將是任何并行計算程序的必由之路,而集群只能是分布式的,因此分布式并行計算也自然而然成為ANSYS的選擇。
微軟公司于2006年6月推自己的集群操作系統(tǒng)WCCS2003(Windows Cluster Computing Server 2003),為集群的普及起到推動作用。WCCS2003因其簡化的群集部署和管理功能,降低了HPC的門檻,人們不是必須面對不熟悉的Unix或Linux。而且經(jīng)過我們大量案例的測試證明,WCCS2003的并行效率與Unix和Linux不相上下。可以預見,集群模式的HPC將快速走向普及。在WCCS研制的階段,ANSYS公司就開始與微軟深入合作,共同優(yōu)化ANSYS@WCCS2003的性能。在2005年全球矚目的美國西雅圖超級計算大會上,ANSYS成功地在微軟WCCS2003實現(xiàn)了完整演示。
DANSYS求解器是ANSYS的分布式并行計算的核心。該求解器可以自動將大型問題拆分為多個子域,分發(fā)給集群的不同節(jié)點(CPU)求解,在切割邊界交換信息以得到總體解。而且DANSYS在CAE全過程都采用并行算法,而不僅僅是方程求解過程。矩陣形成和單元結(jié)果回代過程的并行處理可以明顯減少墻鐘時間。同時DANSYS采用了負載均衡技術,即使集群中各節(jié)點的性能不同,也能得到優(yōu)秀的加速比。
分布式并行可以明顯減少計算時間,使得大型問題的求解得以松綁,讓CAE向自由王國邁進了一大步。在一個經(jīng)典案例中,在單CPU上求解2000萬自由度需要12個小時,但采用8個CPU分布式并行計算只需要3個小時。12個小時意味著即使一上班就投入計算,你仍然在當天看不到計算結(jié)果。而3個小時意味著你在一天內(nèi)可以進行2~3次計算,這對產(chǎn)品研發(fā)速度的提高很有價值。
3. 變分技術減少迭代次數(shù)
變分技術(VT: Variational Technology)是ANSYS的專利技術。過去,人們進行What-if研究時,需要對大量樣本進行計算,形成整個設計空間的響應面。而采用VT技術,只需“一次求解”就可以得到整個設計空間的響應面。而且不論設計變量有多少,這“一次求解”的時間都是普通有限元求解的5倍左右。所以,設計變量越多,VT技術的優(yōu)勢越明顯。
VT技術實際上是深入到CAE程序內(nèi)核,將CAE矩陣(剛度陣、質(zhì)量陣等)的各元素改造成設計變量的函數(shù)(經(jīng)典CAE中各矩陣的元素是數(shù)值),把CAE分析過程從“數(shù)值計算”改造成“函數(shù)計算”,計算結(jié)果也自然是設計變量的函數(shù)。因此,只需“一次求解”就可以得到整個設計空間的響應面。
VT技術在ANSYS公司的許多模塊都有應用。最早應用在優(yōu)化計算中,一次求解可獲得最優(yōu)設計,而不像其他的優(yōu)化程序,需要進行千百次的迭代。在電磁模塊中進行S參數(shù)求解時需要掃頻計算,利用VT技術只需一次計算即可完成整個頻段的上百個頻點的S參數(shù)計算。在Mechanical的非線性迭代或動力學多載荷步計算中,通過歷史迭代信息形成下步迭代最佳預測,可使總迭代數(shù)最少。更為高效的是,當計算過一種設計方案后,如果設計參數(shù)、材料參數(shù)或工況參數(shù)變更,重新計算一次所需要的迭代數(shù)更少。在一個典型的非線性計算案例中,如不采用VT技術,迭代150次收斂,耗時2750秒。采用VT技術,只需30次即可收斂,耗時775秒。改變設計參數(shù)后重新計算,只需9次即可收斂,耗時240秒。 #p#page_title#e#
如果說并行計算技術加快了單次計算速度,那么VT技術則減少了迭代次數(shù)。復雜物理現(xiàn)象的仿真需要非線性、動力學、流體力學甚至他們之間的耦合計算,這類計算總是需要進行大量迭代。VT可以讓這種復雜物理現(xiàn)象的模擬變得快速,使CAE模擬真實世界成為可能。
總之,變分技術進一步釋放了CAE對復雜問題模擬潛能,為CAE最終進入自由王國打開了最后一扇大門。
為自由而戰(zhàn)
ANSYS公司HPC三步戰(zhàn)略:大內(nèi)存求解大問題、分布式并行提高單次計算速度、變分技術減少迭代次數(shù),讓ANSYS的用戶從必然王國進入了自由王國,實現(xiàn)了她對用戶的承諾:Free Your Simulation!
然而,戰(zhàn)斗并沒有就此結(jié)束。世界各國高性能計算機的發(fā)展日新月異,對這些機器的支持是國際CAE軟件面對的另一塊堅冰。中國硬件制造商和高性能計算機的擁有者都把安世亞太作為最佳合作伙伴之一。ANSYS公司總部向安世亞太開放編譯中間文件,使得國產(chǎn)計算機可以很快運行ANSYS軟件。上海超級計算中心擁有海量CPU的國產(chǎn)機器——曙光機,ANSYS公司是其最大的CAE軟件提供商。
其實,這個戰(zhàn)斗永遠也不會結(jié)束,求異是CAE行業(yè)永恒的精神。一個軟件進入自由王國并不代表整個CAE行業(yè)的解放。我們期待這個行業(yè)每一個戰(zhàn)士都武裝起來,為CAE之自由而戰(zhàn)!