超級計算機助力癌癥研究項目
癌癥研究項目開展至今已有十年了,目的在于通過開發(fā)及運用分析大量復(fù)雜數(shù)據(jù)的各種算法,從而深入了解癌癥。除了安大略癌癥研究所外,這個項目小組的成員還包括來自瑪嘉烈醫(yī)院(Princess Margaret Hospital)、大學健康網(wǎng)絡(luò)(University Health Network)以及紐約州布法羅的豪普特曼•伍德沃德醫(yī)學研究所(Hauptman-Woodward Medical Research Institute)的科學家。
該項目的首席科學家Igor Jurisica表示,研制新的治癌療法需要分析蛋白質(zhì)之間的相互關(guān)系;如果顯示在屏幕上,這些蛋白質(zhì)的相互關(guān)系非常像“巨大的黑色毛團”。然后必須運用不同的算法,幫助解釋大量數(shù)據(jù)。
這項研究的另一個方面需要了解蛋白質(zhì)的結(jié)構(gòu),那樣才能研制出治癌療法。這就需要形成蛋白質(zhì)結(jié)晶,還要確定形成優(yōu)質(zhì)蛋白質(zhì)結(jié)晶的最佳條件。但這種方法帶來了一個“嚴重的信息技術(shù)問題,”Jurisica如是說,因為各種蛋白質(zhì)和條件的組合會導(dǎo)致超過9000萬個圖像需要分析及解釋。
Jurisica說:“所以我們的工作就是運用算法翻閱所有這些圖像,并進行分類,以找出試驗結(jié)果。這時候,我們需要能夠處理這種復(fù)雜情況的強大計算功能。”
安大略癌癥研究所如今使用一臺IBM System Cluster 1350超級計算機,該超級計算機采用了DCS9550磁盤存儲系統(tǒng)。IBM的深度計算可視化(Deep Computing Visualization)軟件生成研究分析所需的高清晰度圖像。該系統(tǒng)還包括Linux集群中的1344個處理器核心,運行速度達到了每秒12.5萬億次運算,存儲容量高達150TB。
之所以能夠部署這套系統(tǒng),多虧加拿大創(chuàng)新基金會(Canada Foundation for Innovation)和安大略省研究和創(chuàng)新部(Ontario Ministry of Research and Innovation)下?lián)芰藢m椯Y金。IBM為硬件、軟件和服務(wù)提供了實物捐贈。
IBM公司的戰(zhàn)略項目主管Chris Pratt認為,與這個研究小組保持的長期關(guān)系是一種合作關(guān)系,IBM的角色絕不僅僅是提供IT基礎(chǔ)設(shè)施。Pratt說:“這需要概念設(shè)計和范圍確定,從而解決設(shè)備的供應(yīng)及配置問題,并確保結(jié)果切實可行。”
他補充說:“這可不是一般的Exchange服務(wù)器;這是一類非常復(fù)雜的問題,需要特定的技能。”
截至去年11月,這個項目已在世界公共網(wǎng)格(World Community Grid)由25萬臺個人電腦組成的網(wǎng)絡(luò)上執(zhí)行了9000萬次分析。Jurisica說:“即便擁有如此強大的功能,我們還是要到2014年才能完成項目。”
過去在舊基礎(chǔ)設(shè)施上需要幾個月來處理的計算工作現(xiàn)在只要幾天。Jurisica說:“所以這確實是重大變化,時間縮短了一個數(shù)量級,現(xiàn)在我們可以迅速進行這些分析。”
IBM熱衷研究項目體現(xiàn)了它信奉的這個觀點:一個領(lǐng)域里面的創(chuàng)新可以運用到其他領(lǐng)域。Pratt說:“綜觀各項研究,我們認為研究的專業(yè)性非常強,但一個研究領(lǐng)域的發(fā)現(xiàn)成果可以帶來毫不相干的其他領(lǐng)域領(lǐng)導(dǎo)取得重大進展和突破。”
他表示,圖像分析也許最初只與攝像領(lǐng)域有關(guān),與癌癥研究領(lǐng)域無關(guān)。
Jurisica回憶,在項目的早期階段,蛋白質(zhì)結(jié)晶過程由研究人員用玻璃吸管手動完成。但超級計算機改變了這種情況,大大提高了這項工作的速度和準確性。
他說:“要不是信息技術(shù),無法解讀這些結(jié)果,因為機器每秒都在生成大量數(shù)據(jù);你必須有足夠的存儲容量來存儲大量數(shù)據(jù),并且分析及解讀結(jié)果。”
“要不是自動化技術(shù),生物技術(shù)其實根本無法向前發(fā)展。”