高性能仿真計算集群(結(jié)構(gòu)、流體、多物理場耦合)配置推薦2024v1
更新日期:2024年1月5日
更新原因:升級換代,調(diào)整如下:
(1)計算節(jié)點采用xeon第4代可擴展處理器,
(2)并行存儲采用全閃存陣列,
整個集群從計算節(jié)點架構(gòu),網(wǎng)絡低延遲,存儲高性能并發(fā)IO,作業(yè)調(diào)度高頻調(diào)用,無死角、無瓶頸
集群面臨問題
經(jīng)常聽到客戶反饋,某某分布式多機集群、某某云計算平臺,在集群上做計算還不如普通電腦快,高性能計算集群做工程仿真計算效率很低,花了一大筆經(jīng)費,經(jīng)過一年多的方案論證、審批通過、采購、交貨、使用,但集群性能表現(xiàn)很差
看似高性能集群的計算服務器、存儲服務器、管理服務器、infiniband交換機等硬件設備放到機柜上,通過網(wǎng)絡交換機全部連接好,系統(tǒng)、軟件、開發(fā)工具也都安裝調(diào)試正常了,HPC集群就OK了,真這么簡單嗎? 實際情況:
可能1 計算服務器硬件配置選型不合理,
可能2 并行存儲服務器硬件配置有問題
可能3 作業(yè)調(diào)度方法存在問題
可能4 計算方式選擇有問題,通過GPU計算更快,但確用CPU計算方式
可能5 網(wǎng)絡io有問題,永遠是滿負荷
。。。
出現(xiàn)這些問題的原因,集群的配置方案往往是使用者想要一個“最先進、成熟的”集群計算架構(gòu),自己認為的一個方案,或者過度相信“豐富有經(jīng)驗的系統(tǒng)集成商”(大品牌,不用質(zhì)疑),根據(jù)客戶的預算,給出的高性能計算集群方案
使用者大部分是對軟件熟悉,對工作計算任務熟悉,但因工作知識的局限性,可能對硬件配置,最新計算架構(gòu)不是很精通,
集成商,大部分都是賣設備的,關心的是設備能否賣出去,對客戶應用了解很少或不是很深入,因此這樣兩類人,在一起交流討論仿真計算集群硬件配置方案,未來必然存在隱患。
那么一個合理、完美、高效的高性能計算集群方案的關鍵點都有什么?
首先 要根據(jù)客戶的應用要求,跑什么軟件,對這些軟件特點進行分析
其次,根據(jù)掌握了應用情況,結(jié)合最新的硬件規(guī)格,分別給出計算服務器、GPU服務器、并行存儲服務器、管理服務器、網(wǎng)絡低延遲的交換機的對應方案,另外還要配備好一個高效的作業(yè)調(diào)度系統(tǒng),這樣這個集群方案更貼近仿真軟件的計算要求,
關鍵點1 計算服務器用什么規(guī)格CPU、GPU、內(nèi)存、硬盤,性能最大化?
關鍵點2 存儲服務器,作為數(shù)據(jù)交換最密集的地方,最大的瓶頸,是什么?
不能忽略的情況:
如果不知道仿真數(shù)值模擬軟件的不同求解器的特點,很可能計算服務器配置正常,軟件運行正常,速度很慢,怎么回事?
如果不熟悉計算硬件架構(gòu),計算服務器的CPU頻率高低無所謂,內(nèi)存帶寬無所謂,硬盤io無所謂,便宜就行,可能結(jié)果性能表現(xiàn)很差
如果不清楚很多軟件已經(jīng)支持GPU加速,求解過程得到10幾倍的提升(用CPU就可以,或用最貴的GPU,也不快,什么情況?)
如果不清楚作業(yè)調(diào)度正確方式,按核調(diào)用,計算規(guī)模越大,分配更多核,速度就快?
因此,集群配置缺陷,將來必然面臨并行計算效率低,性能表現(xiàn)差的問題,再加上作業(yè)調(diào)度軟件問題或使用問題,集群運算效率自然好不到哪里。
(二)CX660高性能仿真計算集群
西安坤隆計算機公司,經(jīng)過多年實際集群系統(tǒng)的應用軟件運行和監(jiān)測分析,我們可以給出從集群硬件配置和集群架構(gòu)、作業(yè)調(diào)度全方位的滿足不同仿真計算特點,通過采用最新CPU和GPU,以及合理硬件配置和高效作業(yè)調(diào)用,保證了集群的計算效率發(fā)揮到最大。
UltraLAB高性能仿真計算集群充分考慮應用軟件的算法特點,保證整個集群每個環(huán)節(jié),計算服務器或GPU超算服務器,并行存儲服務器等集群配置架構(gòu),無死角、無卡頓、均衡,都能最大限度發(fā)揮各自的性能,
應用軟件并行計算特點
應用種類
主要軟件類
計算特點
計算設備
1
結(jié)構(gòu)靜力/動態(tài)仿真
Ansys
Abaqus
Ly-Dyna
有限元法,純CPU計算
兩個環(huán)節(jié):
1 網(wǎng)格自動剖分—單核計算,高頻才能加速
2 求解器求解—有限多核計算,調(diào)用合理的計算資源,加速
上述過程,反復迭代,直到收斂為止,
高頻服務器
計算服務器
2
流體仿真
Fluent
有限體積法,CPU和GPU結(jié)合
計算服務器
GPU計算服務器
3
多物理場耦合
Comsol Multiphysics..
有限元法,純CPU計算
高頻+有限多核+大內(nèi)存帶寬
高頻服務器
計算服務器
4
電磁仿真
HFSS、CST 、Feko..
頻域類,有限元法,純CPU計算
時域類,時域有限差分,GPU加速
高頻服務器
計算服務器
GPU計算服務器
5
科學計算類
MatLAB
解釋型高級語言工具,主模塊單核計算為主,需要多核并行,要借助【并行計算工具箱】
計算服務器
6
CX660仿真集群系統(tǒng)介紹
CX660是采用intel xeon第四代可擴展處理器組成的集群,代表著目前最新的計算架構(gòu),求解更快、更高效。CX650集群系統(tǒng)是由【高頻服務器】、【計算服務器】、【GPU超算服務器】、【管理與存儲服務器】、【高性能低延遲交換機】、作業(yè)調(diào)度系統(tǒng)組成。
No
關鍵設備
配置規(guī)格
主要任務或功能
1
高頻服務器
Xeon高頻處理器/大容量內(nèi)存/大容量高速固態(tài)盤/100G 高性能網(wǎng)卡
針對有限元仿真計算網(wǎng)格剖分單核cpu計算特點,面對多個計算服務器計算過程的并發(fā)網(wǎng)格剖分,通過配置超高頻CPU,大大縮短同時多個網(wǎng)格剖分計算時間,從而加速整個求解計算
2
計算服務器
2顆xeon+16根內(nèi)存+25G/56G 高性能網(wǎng)卡
針對基于CPU計算的仿真模擬計算的重要計算過程---求解器求解,配備最新2顆intel Xeon4代處理器,48核@高頻+16通道內(nèi)存帶寬+低延遲網(wǎng)卡,打造理想高速計算架構(gòu),每個計算節(jié)點高頻+多核并行計算+內(nèi)存IO帶寬最大化,在核數(shù)與頻率、低延遲響應達到完美均衡。
3
GPU超算服務器
配備最新2顆intel Xeon4代處理器(32核@高頻+16通道內(nèi)存帶寬)25G/56G 高性能網(wǎng)卡,
針對基于CPU和GPU異構(gòu)超算,支持CPU仿真模擬計算,也支持GPU加速計算,
最新GPU(RTX A6000 48GB)單精度浮點算力40Tflops,可用于支持GPU求解計算,性能提升顯著,例如Fluent求解,一塊A6000卡算力(FP32 40Tflops)相當于44顆Xeon 銀牌4316(累計880核)性能,
4
管理與存儲服務器
雙xeon(核數(shù)充足)/高速緩存盤(全閃存陣列)/并行存儲/100G高性能網(wǎng)卡
承擔高速并行計算的海量數(shù)據(jù)密集讀寫,提供最強大的并行讀寫存儲架構(gòu)
承擔集群管理
5
PSS作業(yè)調(diào)度軟件
基于linux環(huán)節(jié)
支持全面任務調(diào)度,支持多種計算架構(gòu),支持混合計算架構(gòu)
一款成熟、高可靠、易管理的作業(yè)調(diào)度軟件,保證多任務計算作業(yè)調(diào)度、監(jiān)控
(三)CX660高性能仿真計算集群配置推薦
方案1 5個計算節(jié)點集群配置方案推薦
總核數(shù):240核@2.8GHz ,
CPU算力 10TFlops
總內(nèi)存容量 2.56TB
NO
貨物名稱
型號
數(shù)量
單價
小計
1
計算服務器
2顆Xeon金牌5418Y(48核2.8Ghz) /512GB DDR5 /1.92TB SSD/2U機架式/56G IB網(wǎng)口
5
62000
310000
2
管理與存儲服務器
2*Xeon 銀4316(40核@2.3GHz)/256GB DDR4/集成顯卡/960GB SSD /23TB緩存盤(全閃存盤陣,讀帶寬20GB/s、寫帶寬11GB/s)/126TB并行存儲/4U機架式/100G IB網(wǎng)口/27"4K圖顯
1
129900
129900
3
計算交換機
Infiniband 12口 56G/100G
1
38000
38000
4
管理交換機
16口千兆以太
1
1600
1600
5
服務器機柜
42U,含PDU機柜插座、托盤
1
6500
6500
6
KVM切換器
16口 VGA
1
1500
1500
7
管理軟件
UltraLAB作業(yè)調(diào)度軟件(5節(jié)點)
1
50000
50000
累計(人民幣):
¥538,500元
總核數(shù):480核@2.8GHz ,
CPU算力 21.5TFlops
總內(nèi)存容量 5.12TB
NO
貨物名稱
型號
數(shù)量
單價
小計
1
高頻服務器
Xeon W7-2475X超頻處理器(20核4.8GHz)/512GB
DDR5 /7.68TB PCIeSSD/2U機架式/100G IB網(wǎng)口
1
77000
77000
2
計算服務器
2顆Xeon金牌5418Y(48核2.8Ghz) /512GB DDR5 /1.92TB SSD/2U機架式/56G IB網(wǎng)口
10
62000
620000
3
管理與存儲服務器
2*Xeon 銀4316(40核@2.3GHz)/256GB DDR4/集成顯卡/960GB SSD /23TB緩存盤(全閃存盤陣,讀帶寬20GB/s、寫帶寬11GB/s)/126TB并行存儲/4U機架式/100G IB網(wǎng)口/27"4K圖顯
1
129900
129900
4
計算交換機
Infiniband 36口 56G/100G
1
85000
85000
5
管理交換機
24口千兆以太
1
2100
2100
6
服務器機柜
42U,含PDU機柜插座、托盤
1
6500
6500
7
KVM切換器
16口 VGA
1
1500
1500
管理軟件
UltraLAB作業(yè)調(diào)度軟件(11節(jié)點)
1
110000
110000
累計(人民幣):
¥1,032,500元
方案3 15個計算節(jié)點集群配置方案推薦
總核數(shù):720核@2.8GHz ,
CPU算力 32.2TFlops
總內(nèi)存容量 8.19TB
NO |
貨物名稱 |
型號 |
數(shù)量 |
單價 |
小計 |
1 |
高頻服務器 |
Xeon W7-2475X超頻處理器(20核4.8GHz)/512GB DDR5 /7.68TB PCIeSSD/2U機架式/100G IB網(wǎng)口 |
1 |
77000 |
77000 |
2 |
計算服務器 |
2顆Xeon金牌5418Y(48核2.8Ghz) /512GB DDR5 /1.92TB SSD/2U機架式/56G IB網(wǎng)口 |
15 |
62000 |
930000 |
3 |
管理與存儲服務器 |
2*Xeon 銀4316(40核@2.3GHz)/256GB DDR4/集成顯卡/960GB SSD /23TB緩存盤(全閃存盤陣,讀帶寬20GB/s、寫帶寬11GB/s)/126TB并行存儲/4U機架式/100G IB網(wǎng)口/27"4K圖顯 |
1 |
129900 |
129900 |
4 |
計算交換機 |
Infiniband 36口 56G/100G |
1 |
85000 |
85000 |
5 |
管理交換機 |
24口千兆以太 |
1 |
2100 |
2100 |
6 |
服務器機柜 |
42U,含PDU機柜插座、托盤 |
2 |
6500 |
13000 |
7 |
KVM切換器 |
16口 VGA |
2 |
1500 |
3000 |
|
管理軟件 |
UltraLAB作業(yè)調(diào)度軟件(16節(jié)點) |
1 |
160000 |
160000 |
|
|
|
|
|
|
累計(人民幣): |
|
|
¥1,400,500元 |
上述所有配置,代表最新硬件架構(gòu),同時保證是最完美,最快,如有不符,可直接退貨
欲咨詢機器處理速度如何、技術(shù)咨詢、索取詳細技術(shù)方案,提供遠程測試,請聯(lián)系
UltraLAB圖形工作站供貨商:
西安坤隆計算機科技有限公司
國內(nèi)知名高端定制圖形工作站廠家
業(yè)務電話:400-705-6800
咨詢微信號: