超級計(jì)算機(jī)助力癌癥研究項(xiàng)目
癌癥研究項(xiàng)目開展至今已有十年了,目的在于通過開發(fā)及運(yùn)用分析大量復(fù)雜數(shù)據(jù)的各種算法,從而深入了解癌癥。除了安大略癌癥研究所外,這個(gè)項(xiàng)目小組的成員還包括來自瑪嘉烈醫(yī)院(Princess Margaret Hospital)、大學(xué)健康網(wǎng)絡(luò)(University Health Network)以及紐約州布法羅的豪普特曼•伍德沃德醫(yī)學(xué)研究所(Hauptman-Woodward Medical Research Institute)的科學(xué)家。
該項(xiàng)目的首席科學(xué)家Igor Jurisica表示,研制新的治癌療法需要分析蛋白質(zhì)之間的相互關(guān)系;如果顯示在屏幕上,這些蛋白質(zhì)的相互關(guān)系非常像“巨大的黑色毛團(tuán)”。然后必須運(yùn)用不同的算法,幫助解釋大量數(shù)據(jù)。
這項(xiàng)研究的另一個(gè)方面需要了解蛋白質(zhì)的結(jié)構(gòu),那樣才能研制出治癌療法。這就需要形成蛋白質(zhì)結(jié)晶,還要確定形成優(yōu)質(zhì)蛋白質(zhì)結(jié)晶的最佳條件。但這種方法帶來了一個(gè)“嚴(yán)重的信息技術(shù)問題,”Jurisica如是說,因?yàn)楦鞣N蛋白質(zhì)和條件的組合會(huì)導(dǎo)致超過9000萬個(gè)圖像需要分析及解釋。
Jurisica說:“所以我們的工作就是運(yùn)用算法翻閱所有這些圖像,并進(jìn)行分類,以找出試驗(yàn)結(jié)果。這時(shí)候,我們需要能夠處理這種復(fù)雜情況的強(qiáng)大計(jì)算功能。”
安大略癌癥研究所如今使用一臺IBM System Cluster 1350超級計(jì)算機(jī),該超級計(jì)算機(jī)采用了DCS9550磁盤存儲(chǔ)系統(tǒng)。IBM的深度計(jì)算可視化(Deep Computing Visualization)軟件生成研究分析所需的高清晰度圖像。該系統(tǒng)還包括Linux集群中的1344個(gè)處理器核心,運(yùn)行速度達(dá)到了每秒12.5萬億次運(yùn)算,存儲(chǔ)容量高達(dá)150TB。
之所以能夠部署這套系統(tǒng),多虧加拿大創(chuàng)新基金會(huì)(Canada Foundation for Innovation)和安大略省研究和創(chuàng)新部(Ontario Ministry of Research and Innovation)下?lián)芰藢m?xiàng)資金。IBM為硬件、軟件和服務(wù)提供了實(shí)物捐贈(zèng)。
IBM公司的戰(zhàn)略項(xiàng)目主管Chris Pratt認(rèn)為,與這個(gè)研究小組保持的長期關(guān)系是一種合作關(guān)系,IBM的角色絕不僅僅是提供IT基礎(chǔ)設(shè)施。Pratt說:“這需要概念設(shè)計(jì)和范圍確定,從而解決設(shè)備的供應(yīng)及配置問題,并確保結(jié)果切實(shí)可行。”
他補(bǔ)充說:“這可不是一般的Exchange服務(wù)器;這是一類非常復(fù)雜的問題,需要特定的技能。”
截至去年11月,這個(gè)項(xiàng)目已在世界公共網(wǎng)格(World Community Grid)由25萬臺個(gè)人電腦組成的網(wǎng)絡(luò)上執(zhí)行了9000萬次分析。Jurisica說:“即便擁有如此強(qiáng)大的功能,我們還是要到2014年才能完成項(xiàng)目。”
過去在舊基礎(chǔ)設(shè)施上需要幾個(gè)月來處理的計(jì)算工作現(xiàn)在只要幾天。Jurisica說:“所以這確實(shí)是重大變化,時(shí)間縮短了一個(gè)數(shù)量級,現(xiàn)在我們可以迅速進(jìn)行這些分析。”
IBM熱衷研究項(xiàng)目體現(xiàn)了它信奉的這個(gè)觀點(diǎn):一個(gè)領(lǐng)域里面的創(chuàng)新可以運(yùn)用到其他領(lǐng)域。Pratt說:“綜觀各項(xiàng)研究,我們認(rèn)為研究的專業(yè)性非常強(qiáng),但一個(gè)研究領(lǐng)域的發(fā)現(xiàn)成果可以帶來毫不相干的其他領(lǐng)域領(lǐng)導(dǎo)取得重大進(jìn)展和突破。”
他表示,圖像分析也許最初只與攝像領(lǐng)域有關(guān),與癌癥研究領(lǐng)域無關(guān)。
Jurisica回憶,在項(xiàng)目的早期階段,蛋白質(zhì)結(jié)晶過程由研究人員用玻璃吸管手動(dòng)完成。但超級計(jì)算機(jī)改變了這種情況,大大提高了這項(xiàng)工作的速度和準(zhǔn)確性。
他說:“要不是信息技術(shù),無法解讀這些結(jié)果,因?yàn)闄C(jī)器每秒都在生成大量數(shù)據(jù);你必須有足夠的存儲(chǔ)容量來存儲(chǔ)大量數(shù)據(jù),并且分析及解讀結(jié)果。”
“要不是自動(dòng)化技術(shù),生物技術(shù)其實(shí)根本無法向前發(fā)展。”