事實上,我還沒有用到任何云,但是近期可能有需求,也調(diào)研了亞馬遜和阿里的云,下面說一說我的現(xiàn)實需求。
我研發(fā)的多重PCR引物設(shè)計的軟件mprimer,在常規(guī)的多重PCR引物設(shè)計中,計算量不存在問題,因為一般不超過10重,即使針對基因組進行特異性分析,使用一個CPU,也會很快出結(jié)果。但是如果要設(shè)計高通量的多重PCR引物用于二代測序目標區(qū)域富集的話,那時間問題就非常嚴重了。因為,至少在100重以上,1000重都是比較常見的,如果要針對整個外顯子設(shè)計引物(10000+),那時間問題就更為嚴重了,單核我估計得按年計算了,即使使用幾十個CPU,也得上月。
所以,高通量的多重PCR引物設(shè)計,尤其是針對二代測序目標區(qū)域的富集,絕對是一個計算密集型的問題。
當然,程序本身后續(xù)還要不斷的性能優(yōu)化,但當前階段,我對云有一個簡單粗暴的需求:核越多越好。
其實,我的程序本身可以提高性能的地方不少,比如,用c語言改寫一下核心計算模塊;改成map-reduce兼容的模式等等。但是無論如何,對計算資源的需求都是一定的。
不同的問題,對于云的需求肯定不同,就我目前的需求而言,亞馬遜的彈性云(計算優(yōu)化)是比較合適的。