Alphafold2蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)AI工作站配置推薦24v1
價(jià)格變更日期:2024/01/05(2024年第1季度),
變更原因:GPU部分價(jià)格變化,CPU部分升級(jí)換代
目錄
AlphaFold2計(jì)算特點(diǎn)
蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)AI工作站配置推薦
蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)AI集群配置推薦
蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)是一項(xiàng)計(jì)算量非常巨大的任務(wù),科學(xué)家多年的探索研究,形成了X射線晶體學(xué)法、核磁共振法、冷凍電鏡等
2021年底,谷歌的DeepMind團(tuán)隊(duì)的采用人工智能方法的AlphaFold2算法在生物界引起了極大的轟動(dòng),它能準(zhǔn)確地預(yù)測(cè)蛋白質(zhì)的結(jié)構(gòu),AlphaFold2是當(dāng)今預(yù)測(cè)蛋白質(zhì)3D結(jié)構(gòu)的最強(qiáng)工具。它將被大量用于推動(dòng)世界蛋白質(zhì)研究向前發(fā)展.
AlphaFold2在國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP14)上精確地基于氨基酸序列預(yù)測(cè)蛋白質(zhì)的3D結(jié)構(gòu)。其準(zhǔn)確性可以與使用冷凍電子顯微鏡(CryoEM)、核磁共振或 X 射線晶體學(xué)等實(shí)驗(yàn)技術(shù)解析的3D結(jié)構(gòu)相媲美,
目前情況(大致統(tǒng)計(jì)):
(1)Deepmind開(kāi)源了AlphaFold2的源代碼(推理部分)
(2)華盛頓大學(xué)開(kāi)源了RoseTTRFold的源代碼(推理部分)
(3)深勢(shì)科技復(fù)現(xiàn)了AlphaFold的訓(xùn)練部分,并開(kāi)源代碼(訓(xùn)練和推理)
(4)上海天壤智能科技有限公司復(fù)現(xiàn)了TRfold訓(xùn)練部分和推理部分
(5)上海交大對(duì)AlphaFold2的推理代碼進(jìn)行了優(yōu)化(推理并行版)
(一)AlphaFold2蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)計(jì)算特點(diǎn)
如何配置好硬件,最快速度完成訓(xùn)練、推理計(jì)算,首先分析其計(jì)算過(guò)程以及算法特點(diǎn)
圖1 Alphafold2計(jì)算示意圖
環(huán)節(jié)1 數(shù)據(jù)處理-序列特征生成計(jì)算特點(diǎn)
(圖片2來(lái)源:上海交大alphafold2并行優(yōu)化版)
計(jì)算過(guò)程
總輸入單個(gè)蛋白質(zhì)序列FASTA格式(推理);
通過(guò)搜索工具(jackHMMER/HHblits)分別對(duì)多個(gè)遺傳數(shù)據(jù)庫(kù)--執(zhí)行隱馬爾可夫模型的搜索生成MSA(序列-殘基);見(jiàn)圖1
搜索的結(jié)構(gòu)和序列產(chǎn)生的Pairing信息(殘基-殘基);
通過(guò)HHsearch搜索的Template
計(jì)算與硬件配置分析
數(shù)據(jù)庫(kù)搜索過(guò)程涉及數(shù)據(jù)庫(kù)密集I/O讀寫,數(shù)據(jù)放到高速SSD硬盤上,數(shù)據(jù)量累積超過(guò)2TB,非常耗時(shí),加速手段提升CPU計(jì)算速度。
硬件配置
CPU計(jì)算為主,內(nèi)存要夠大,或配備NVME SSD固態(tài)卡,容量4TB以上
環(huán)節(jié)2 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)計(jì)算特點(diǎn)
(圖片來(lái)源:上海交通大學(xué) https://parafold.sjtu.edu.cn/docs/quick-start/)
計(jì)算過(guò)程
利用多序列比對(duì)(MSA),把蛋白質(zhì)的結(jié)構(gòu)和生物信息整合到深度學(xué)習(xí)算法中,主要包括:神經(jīng)網(wǎng)絡(luò)EvoFormer和結(jié)構(gòu)模塊(Structure module).
在EvoFormer中,主要是將圖網(wǎng)絡(luò)(Graph networks)和多序列比對(duì)(MSA)結(jié)合完成結(jié)構(gòu)預(yù)測(cè),Alphafold2使用Transformer結(jié)構(gòu),不管是MSA還是殘基-殘基對(duì)的信息更新都使用了Attention機(jī)制,結(jié)構(gòu)模塊的更新使用了三角法則,簡(jiǎn)化了計(jì)算的復(fù)雜度,準(zhǔn)確率也提高了不少.
結(jié)構(gòu)模塊(Structure Module)主要工作是將EvoFormer得到的信息轉(zhuǎn)換為蛋白質(zhì)3D結(jié)構(gòu).
整個(gè)模型的Evoformer和Structure module部分都使用了Recycling,即將輸出重新加入到輸入在重復(fù)refinement,進(jìn)行信息的精煉.
計(jì)算特點(diǎn)
上述計(jì)算過(guò)程用GPU更合理,對(duì)GPU要求是高顯存帶寬、大容量顯存、大蛋白質(zhì)計(jì)算通過(guò)將多GPU卡設(shè)置統(tǒng)一內(nèi)存架構(gòu),大的顯存可支持更大的計(jì)算數(shù)據(jù)存放
計(jì)算架構(gòu)分析匯總
No |
主要環(huán)節(jié) |
任務(wù)分類 |
計(jì)算時(shí)間占總求解時(shí)間比例 |
計(jì)算特點(diǎn) |
配置方案 |
1 |
序列特征生成 |
(a)多序列比對(duì) (b)模板搜索 |
計(jì)算時(shí)間占總計(jì)算時(shí)間的大約60% |
CPU計(jì)算 有限多核
|
高頻CPU加速 4TB容量的NVME SSD盤 |
2 |
神經(jīng)網(wǎng)絡(luò)預(yù)測(cè) |
(c)模型預(yù)測(cè) (d)AMBER優(yōu)化 |
計(jì)算時(shí)間占總計(jì)算時(shí)間的大約40% |
單GPU計(jì)算(推理) 多GPU計(jì)算(訓(xùn)練)
|
顯存容量大,支持更長(zhǎng)序列蛋白計(jì)算(最大長(zhǎng)度1500,大于300個(gè)殘基) 多卡統(tǒng)一內(nèi)存模式 |
#p#page_title#e#
(二)蛋白質(zhì)結(jié)構(gòu)預(yù)算AI工作站配置推薦2024v1
西安坤隆計(jì)算機(jī)科技有限公司專注于工作站專業(yè)應(yīng)用,對(duì)每個(gè)應(yīng)用的計(jì)算過(guò)程研究分析,給出精準(zhǔn)高效、高可靠計(jì)算架構(gòu)和專業(yè)系統(tǒng)優(yōu)化,以及穩(wěn)定的技術(shù)支持,保證與應(yīng)用軟件90%以上的匹配吻合,和長(zhǎng)期穩(wěn)定運(yùn)行.
硬件配置具有以下特點(diǎn):
1)配備CPU規(guī)格均以高頻為主,兼顧足夠CPU核數(shù),這樣保證數(shù)據(jù)預(yù)處理(最慢的環(huán)節(jié)),計(jì)算時(shí)間大幅縮短,GPU卡采用單精度指標(biāo)高的、顯存容量大的,保證神經(jīng)預(yù)測(cè)計(jì)算加速,滿足AlphaFold2的理想的配置方案
2)整機(jī)的cpu、gpu、硬盤配置,滿足AlphaFold2推理(包括上海交大并行版)計(jì)算要求,均衡無(wú)死角,性能最大化;
3)為深勢(shì)科技的Uni-Fold訓(xùn)練、推理模塊提供理想配置架構(gòu);
4)每個(gè)配置機(jī)器做到即開(kāi)即用,并提供硬件+優(yōu)化+穩(wěn)定高速運(yùn)行技術(shù)支持服務(wù)
5)支持大規(guī)模的計(jì)算擴(kuò)展應(yīng)用需求
2.1 蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工作站配置參考24v1
NO
品牌與型號(hào)
配置規(guī)格
價(jià)格
1
GA330i 15764-MCT
intel 14代高頻處理器(共計(jì)24核,8核@5.7GHz,16核@4.2GHz /64GB DDR5/ RTX4090 24GB /960GB SSD/3.84TB PCIe.SSD/6TB SATA企業(yè)級(jí)/微塔式(1500w)/24寸-2K顯示器
56000
AF2推理型
2
GA330i 157128-MCE
intel 14代高頻處理器(共計(jì)24核,8核@5.7GHz,16核@4.2GHz /128GB DDR4/A6000 48GB/960GB SSD/3.84TB PCIe.SSD/8TB SATA企業(yè)級(jí)/微塔式(1500w)/24寸-2K顯示器
81000
AF2推理頂配型
3
EX650i 228192-MCT
2*Xeon 銀4316處理器(共計(jì)40核,2.8GHz~3.4GHz) /192GB DDR4 /A6000 48GB/960GB SSD /3.84TB PCIe.SSD/8TB SATA企業(yè)級(jí)/微塔式(1500w)/24寸-2K顯示器
86500
并行優(yōu)化加速型
4
GX650M 228192-MC2T
2*Xeon 銀4316處理器(共計(jì)40核,2.8GHz~3.4GHz) /192GB DDR4 /2*RTX4090 24GB/480GB SSD /3.84TB PCIe.SSD/16TB SATA企業(yè)級(jí)/微塔式(1500w)/24寸-2K顯示器
112000
多任務(wù)高速型
5
GX650M 228256-MC2E
2*Xeon 銀4316處理器(共計(jì)40核,2.8GHz~3.4GHz)/256GB DDR4/2*A6000 48GB/1TB SSD /3.84TB PCIe.SSD/16TB SATA企業(yè)級(jí)/微塔式(1500w)/24寸-2K顯示器
149990
多任務(wù)大規(guī)模計(jì)算型
6
GX650M 228512-MC4T
2*Xeon 銀4316處理器(共計(jì)40核,2.8GHz~3.4GHz)/512GB DDR4 /4*RTX4090 24GB /1TB SSD /7.68TB PCIe.SSD/16TB SATA企業(yè)級(jí)/雙塔式(2000w)/24寸-2K顯示器
197000
多任務(wù)高速加強(qiáng)型
7
GX650M 231384-MC4E
2*Xeon 金6326處理器(共計(jì)32核,3.1GHz )/384GB DDR4/4*A6000 48GB /1TB SSD /7.68TB PCIe.SSD /2*16TB SATA企業(yè)級(jí)/雙塔式(2000w)/24寸-2K顯示器
285000
全能加速型
8
GX650M 231768-MC6E
2顆Xeon 金6342處理器(共計(jì)48核,3.1GHz)/768GB DDR4/6*A6000 48GB /2TB SSD/7.68TB PCIe.SSD /2*18TB SATA企業(yè)級(jí)/雙塔式(2000w)/24寸-2K顯示器
399990
推理/訓(xùn)練多任務(wù)高速型
9
GX650M 2351T-MC8E
2顆Xeon 鉑金8358處理器(共計(jì)64核,3.5GHz)/1TB DDR4/8*A6000 48GB /2TB SSD/15.36TB PCIe.SSD /2*18TB SATA企業(yè)級(jí)/雙塔式(2000w)/24寸-2K顯示器
580000
推理/訓(xùn)練極致型
2.2 AlphaFold訓(xùn)練集群配置參考23v1
集群技術(shù)特點(diǎn)
(1)本集群是由高頻服務(wù)器、GPU計(jì)算服務(wù)器、管理服務(wù)器、并行存儲(chǔ)服務(wù)器組成。
(2)集群硬件配置每個(gè)環(huán)節(jié)都基于人工智能預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)算法最快優(yōu)化設(shè)計(jì)。
(3)【高頻服務(wù)器】采用有限多核高頻CPU、高速NVME SSD用于密集海量序列比計(jì)算,計(jì)算性能和io讀寫性能完美匹配高效,支持多個(gè)單核計(jì)算或2個(gè)以上并行版的比對(duì)軟件同步計(jì)算。
(4)【GPU計(jì)算服務(wù)器】配備最新Xeon3代處理器,32核+8塊RTX A6000 48GB,cpu頻率和pcie 4.0 x16是蛋白質(zhì)折疊人工智能并行計(jì)算最理想架構(gòu)。
(5)作業(yè)調(diào)度軟件針對(duì)蛋白質(zhì)預(yù)測(cè)元計(jì)算兩個(gè)主要環(huán)節(jié):序列比對(duì)計(jì)算(CPU有限多核計(jì)算環(huán)節(jié))、人工智能預(yù)測(cè)(GPU多卡并行計(jì)算環(huán)節(jié)),
序列比對(duì)計(jì)算環(huán)節(jié)--調(diào)用【高頻服務(wù)器】處理,
蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)計(jì)算環(huán)節(jié)--調(diào)用多臺(tái)【GPU服務(wù)器】并行計(jì)算。
(6) 集群性能從硬件架構(gòu)、作業(yè)調(diào)度系統(tǒng)均比常規(guī)集群性能達(dá)到極致,全新改寫的作業(yè)調(diào)度系統(tǒng),比市面上的作業(yè)調(diào)度系統(tǒng)效率更高。
方案1 蛋白質(zhì)智能預(yù)測(cè)集群方案(40塊GPU卡)
NO |
型號(hào) |
技術(shù)規(guī)格 |
數(shù)量 |
單價(jià) |
小計(jì) |
1 |
序列比對(duì)服務(wù)器 |
intel 14代超頻處理器 (共計(jì)24核,8核@5.7GHz,16核@4.2GHz)/192GB DDR5/960GB/4U機(jī)架式(650w)/25GbE網(wǎng)口 |
1 |
28000 |
28000 |
2 |
GPU超算服務(wù)器 |
2顆Xeon 銀4314處理器 (32核@3.5GHz)/512GB/8塊A6000 /960GB/4U機(jī)架式(2000w 2+2冗余/100GbE網(wǎng)口 |
5 |
450000 |
2250000 |
3 |
并行存儲(chǔ)服務(wù)器 |
2顆Xeon 銀4314處理器 (24核@2.1GHz)/128GB /960GB /45TB高速緩存盤(全閃存陣列,讀20GB/s、寫11GB/s)/252TB并行存儲(chǔ)(雙通道)/4U機(jī)架式(1200w 1+1冗余/100GbE網(wǎng)口 |
1 |
165000 |
165000 |
4 |
管理服務(wù)器 |
2顆Xeon 銀4210 /128GB /RTX A2000/1.92TB/2U機(jī)架式/千兆 |
1 |
32000 |
32000 |
5 |
計(jì)算交換機(jī) |
MSN2010 4*100G/18*25G,2U機(jī)架式 |
1 |
45000 |
45000 |
6 |
管理交換機(jī) |
24口千兆,1U機(jī)架式 |
1 |
2800 |
2800 |
7 |
KVM切換器 |
16口 VGA,1U機(jī)架式 |
1 |
1800 |
1800 |
8 |
機(jī)柜 |
42U |
1 |
5500 |
5500 |
9 |
集群系統(tǒng) |
UltraLAB PSS作業(yè)調(diào)度管理軟件(5節(jié)點(diǎn)) |
1 |
50000 |
50000 |
|
|
|
|
|
|
|
合計(jì) |
|
¥2,580,100元 |
方案2 蛋白質(zhì)智能預(yù)測(cè)集群方案(80塊GPU卡)
NO |
型號(hào) |
技術(shù)規(guī)格 |
數(shù)量 |
單價(jià) |
小計(jì) |
1 |
序列比對(duì)服務(wù)器 |
Xeon W7-2465X超頻處理器 (共計(jì)28核4.8GHz)/256GB DDR5/960GB/4U機(jī)架式(850w) /25GbE網(wǎng)口 |
1 |
63000 |
63000 |
2 |
GPU超算服務(wù)器 |
2顆Xeon 銀4314處理器 (32核@3.5GHz)/512GB/8塊A6000 /960GB/4U機(jī)架式(2000w 2+2冗余/100GbE網(wǎng)口 |
10 |
450000 |
4500000 |
3 |
并行存儲(chǔ)服務(wù)器 |
2顆Xeon 銀4314處理器 (24核@2.1GHz)/128GB /960GB /45TB高速緩存盤(全閃存陣列,讀20GB/s、寫11GB/s)/252TB并行存儲(chǔ)(雙通道)/4U機(jī)架式(1200w 1+1冗余/100GbE網(wǎng)口 |
1 |
165000 |
165000 |
4 |
管理服務(wù)器 |
2顆Xeon 銀4210 /128GB /RTX A2000/1.92TB/2U機(jī)架式/千兆 |
1 |
32000 |
32000 |
5 |
計(jì)算交換機(jī) |
MSN2010 4*100G/18*25G,2U機(jī)架式 |
1 |
45000 |
45000 |
6 |
管理交換機(jī) |
24口千兆,1U機(jī)架式 |
1 |
2800 |
2800 |
7 |
KVM切換器 |
16口 VGA,1U機(jī)架式 |
1 |
1800 |
1800 |
8 |
機(jī)柜 |
42U |
2 |
5500 |
5500 |
9 |
集群系統(tǒng) |
UltraLAB PSS作業(yè)調(diào)度管理軟件(10節(jié)點(diǎn)) |
1 |
100000 |
100000 |
|
|
|
|
|
|
|
合計(jì) |
|
¥4,920,600元 |
參考資料:
AlphaFold2 https://github.com/deepmind/alphafold/
上海交大 AlphaFold再HPC平臺(tái)的部署和優(yōu)化
https://parafold.sjtu.edu.cn/docs/quick-start/
PombertLab/3DFI
https://github.com/PombertLab/3DFI
上述所有配置,代表最新硬件架構(gòu),同時(shí)保證是最完美,最快,如有不符,可直接退貨
欲咨詢機(jī)器處理速度如何、技術(shù)咨詢、索取詳細(xì)技術(shù)方案,提供遠(yuǎn)程測(cè)試,請(qǐng)聯(lián)系
UltraLAB圖形工作站供貨商:
西安坤隆計(jì)算機(jī)科技有限公司
國(guó)內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話:400-705-6800
咨詢微信號(hào):