基因測(cè)序、生物信息分析平臺(tái)工作站硬件配置推薦2020
基因測(cè)序、生物信息分析平臺(tái)工作站硬件配置推薦2021v3
(一)了解生物信息學(xué)
生物信息學(xué)(Bioinformatics)利用應(yīng)用數(shù)學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)的方法研究生物學(xué)的問(wèn)題。生物信息學(xué)的研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù),其研究工具是計(jì)算機(jī),研究方法包括對(duì)生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計(jì)算、模擬)。
生物信息學(xué)典型工作流程
這個(gè)過(guò)程是由一系列鏈接的步驟組成,這些步驟將原始輸入(測(cè)序原始數(shù)據(jù)RAW)轉(zhuǎn)換為有意義或可解釋的輸出,例如,高通量測(cè)序NGS數(shù)據(jù)而生成的fastq文件。然后用于基因組序列分析的特定功能方面的特定工具執(zhí)行。根據(jù)執(zhí)行的分析類(lèi)型,工作流可以具有可變數(shù)量的步驟,因此可以是簡(jiǎn)單的或復(fù)雜的。
生物信息學(xué)主要研究方向:DNA/RNA/蛋白質(zhì)測(cè)序,序列比對(duì),基因發(fā)現(xiàn),基因組組裝,藥物設(shè)計(jì),藥物發(fā)現(xiàn),蛋白質(zhì)結(jié)構(gòu)比對(duì)和預(yù)測(cè),通過(guò)使用計(jì)算密集型技術(shù)(用于模式識(shí)別,數(shù)據(jù)挖掘,機(jī)器學(xué)習(xí)算法和可視化)來(lái)加深對(duì)生物過(guò)程的理解。因此需要配備先進(jìn)的計(jì)算設(shè)備和豐富專(zhuān)業(yè)的分析軟件
(二)生物信息學(xué)分析的計(jì)算特點(diǎn)
如何選購(gòu)一個(gè)理想的圖形工作站硬件配置,可能很多人思考過(guò):
什么是用于生物信息學(xué)和計(jì)算生物學(xué)研究的最佳PC/工作站?
用于生物信息學(xué)分析的服務(wù)器配置
全基因組序列分析實(shí)驗(yàn)室的硬件配置
高通量序列分析服務(wù)器有什么要求
下一代測(cè)序數(shù)據(jù)分析硬件配置推薦
用于分析NGS宏基因組學(xué)數(shù)據(jù)的計(jì)算機(jī)配置?
2.1 生物信息分析的計(jì)算特點(diǎn)
生物信息數(shù)據(jù)分析涉及到基因組學(xué)、轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、宏基因組學(xué)、代謝物組學(xué)等,下圖是全基因組數(shù)據(jù)分析流程
生物信息學(xué)數(shù)據(jù)分析所涉及的計(jì)算主要是
(1)重測(cè)序過(guò)程中的序列/映射比對(duì)計(jì)算(Mapping)
對(duì)于使用BWA/Bowtie等程序進(jìn)行映射讀取,對(duì)內(nèi)存RAM要求不高(例如32GB即可),但CPU內(nèi)核數(shù)量(及其頻率)將決定計(jì)算過(guò)程需要多長(zhǎng)時(shí)間。如果要進(jìn)行大量對(duì)齊和比對(duì)(例如使用BWA),那么擁有大量CPU核心比擁有大量?jī)?nèi)存更為重要。
當(dāng)然配置規(guī)格取決于您的預(yù)算和計(jì)劃進(jìn)行的分析類(lèi)型。
RNASeq中計(jì)算量較大的就是比對(duì)步驟了,而比對(duì)往往只需要一次就可以! 一般32核CPU+64GB RAM硬件配置,可以滿(mǎn)足對(duì)基因組/轉(zhuǎn)錄組/虹基因組分析的標(biāo)準(zhǔn)映射(maping)以及下游分析。
(2)從頭測(cè)序De novo的序列組裝計(jì)算(Assembly)
如果要進(jìn)行從頭組裝(例如Velvet),假設(shè)一個(gè)人的全基因組測(cè)序數(shù)據(jù),采用二代測(cè)序的方法,人的基因組3G,10倍數(shù)據(jù)30G,那么這30G的堿基,在切成更小的kmer,假設(shè)數(shù)據(jù)增加到了100G,還不算存儲(chǔ)序列的一些其他信息,序列拼接的時(shí)候必須一次將所有數(shù)據(jù)同時(shí)存入內(nèi)存,如果內(nèi)存達(dá)不到100G,拼接根本無(wú)法完成。
因此,對(duì)于大型基因組裝而言,需要的硬件資源特別多,不緊cpu要有足夠的計(jì)算能力,內(nèi)存在150G以上,但是如細(xì)菌基因組,數(shù)據(jù)集和基因組數(shù)據(jù)量不太大,內(nèi)存128GB足夠了
為了使NGS(下一代測(cè)序)分析的工作負(fù)荷最大化,硬件配置三個(gè)關(guān)鍵瓶頸:可用的CPU核數(shù)、內(nèi)存容量以及I/O帶寬
2.2 生信分析對(duì)硬件配置要求
如何處理454和Illumina數(shù)據(jù)? 全基因組裝配/組裝?序列拼接?映射讀取到參考基因組?
(1)需要多少存儲(chǔ)空間才能保持?jǐn)?shù)據(jù)實(shí)時(shí)讀?。ㄓ脖P(pán)容量)?
開(kāi)發(fā)下一代測(cè)序(高通量測(cè)序)的臨床應(yīng)用的瓶頸是存儲(chǔ)和分析所生成的大量數(shù)據(jù)。應(yīng)用程序多種多樣,但共同的主題在計(jì)算和分析上具有挑戰(zhàn)性。
(2)要分析的每個(gè)文件有多大(RAM容量,硬盤(pán)讀寫(xiě)速度)?
(3)要使用的軟件準(zhǔn)備好使用多處理器運(yùn)行時(shí)間是否有要求(CPU核數(shù))?
配置參考:
(1)基于基因組計(jì)劃的大小
NO 基因組計(jì)劃 配置參考 1 細(xì)菌(最高10MB) 32GB RAM,8個(gè)以上內(nèi)核,10Gb磁盤(pán)空間 2 昆蟲(chóng)(高達(dá)500MB) 128GB RAM,16個(gè)以上內(nèi)核,1Tb磁盤(pán)空間 3 禽類(lèi)/小型植物基因組(最大1GB) 256GB RAM,32個(gè)以上內(nèi)核,1TB磁盤(pán)空間 4 哺乳動(dòng)物基因組(最大3GB) 512GBBb RAM,32個(gè)以上內(nèi)核,3TB磁盤(pán)空間 5 植物基因組(高達(dá)30GB) 1TB RAM,64 +核,10Tb磁盤(pán)空間
(2)基于課題組研究人員數(shù)量 NO 課題組 配置參考 1 單人 16核+64G~256GB+ 8TB硬盤(pán) 2 1到5人課題組 64核+512GB內(nèi)存+64TB硬盤(pán) 3 5人以上的課題組 100核以上+1TB內(nèi)存+海量并行存儲(chǔ)
(三)生物信息學(xué)分析的硬件配置推薦
NO |
品牌與型號(hào) |
配置規(guī)格 |
價(jià)格 |
備注 |
1 |
H380 150128-10TA |
8核5.0GHz /128GB DDR4 /QuaroP620 /1.9TB SSD系統(tǒng)盤(pán) +10TB SATA企業(yè)級(jí)/塔式(750w)/23寸-高清圖顯 |
35000 |
|
2 |
AX400 142256-12TA |
18核4.2GHz / 256GB DDR4 /QuaroP620 /1.9TB SSD系統(tǒng)盤(pán) +12TB SATA企業(yè)級(jí)/塔式(750w)/23寸-高清圖顯 |
58500 |
|
3 |
EX630i 226256-20TA |
2顆Xeon 金5218R處理器(40核2.6GHz )/ 256GB DDR4 /QuaroP620 /1.9TB SSD系統(tǒng)盤(pán)+20TB SATA企業(yè)級(jí)/塔式(865w)/23寸-高清圖顯 |
69990 |
|
4 |
EX630i 228384-20TA |
2顆Xeon 金6230R處理器(52核2.8GHz )/ 384GB DDR4 /QuaroP620 /3.84TB SSD系統(tǒng)盤(pán)+20TB SATA企業(yè)級(jí)/塔式(865w)/23寸-高清圖顯 |
98000 |
|
5 |
Alpha730i 427512-42TA |
4顆Xeon 金5218處理器(64核2.7GHz )/ 512GB DDR4 /QuaroP1000 /3.84TB SSD系統(tǒng)盤(pán) +42TB并行存儲(chǔ)/塔式(1400w冗余)/27"-4K圖顯 |
165000 |
|
6 |
Alpha730i 428512-70TA |
4顆Xeon 金6230處理器(80核2.8GHz )/ 512GB DDR4 /QuaroP1000 /1.92TB SSD系統(tǒng)盤(pán) +1TB高速緩存/70TB并行存儲(chǔ)/塔式(1400w冗余)/27"-4K圖顯 |
199990 |
|
7 |
Alpha730i 432768-84TB |
4顆Xeon 金6248處理器(80核3.2GHz )/ 768GB DDR4 /QuaroP1000 /1.92TB SSD系統(tǒng)盤(pán) +2TB高速緩存/84TB并行存儲(chǔ)/塔式(1400w冗余)/27"-4K圖顯 |
279000 |
|
8 |
Alpha730i 431768-84TB |
4顆Xeon 白金8260處理器(96核3.1GHz )/ 768GB DDR4 /QuaroP2000 /3.84TB SSD系統(tǒng)盤(pán) +2TB高速緩存/98TB并行存儲(chǔ)/塔式(1400w冗余)/27"-4K圖顯 |
330000 |
|
9 |
Alpha730i 4341T-112TB |
4顆Xeon 白金8270處理器(104核3.4GHz )/ 1TB DDR4 /QuaroP2000 /3.84TB SSD系統(tǒng)盤(pán) +4TB高速緩存/112TB并行存儲(chǔ)/塔式(1400w冗余)/27"-4K圖顯 |
428000 |
|
10 |
Alpha730i 4332T-112TB |
4顆Xeon 白金8280處理器(112核3.3GHz )/ 1.5TB DDR4 /QuaroP2000 /3.84TB SSD系統(tǒng)盤(pán) +4TB高速緩存/112TB并行存儲(chǔ)/塔式(1400w冗余)/27"-4K圖顯 |
585000 |
|
上述所有配置,代表最新硬件架構(gòu),同時(shí)保證是最完美,最快,如有不符,可直接退貨
欲咨詢(xún)機(jī)器處理速度如何、技術(shù)咨詢(xún)、索取詳細(xì)技術(shù)方案,提供遠(yuǎn)程測(cè)試,請(qǐng)聯(lián)系
UltraLAB圖形工作站供貨商:
西安坤隆計(jì)算機(jī)科技有限公司
國(guó)內(nèi)知名高端定制圖形工作站廠家
業(yè)務(wù)電話:400-705-6800
咨詢(xún)微信號(hào):