行。 系统特点:在更换硬件的同时,确保能够提供软件移植服务,保证中心运行的软件能够在机群上运
“一直以来我们用的都是小型机,业务量的增加让我们必须购买新服务器。到底继续用小型机,还是改弦易张?”中国科学院上海生命科学研究院生物信息中心(以下简称中心)选型的经历才刚刚开始。
小型机变成机群
一直以来,中心大规模计算都使用的是某国际知名厂商的小型机。刚开始,中心只负责为上海地区提供生物运算分析的任务,随着中心业务不断扩大,上海地区已经远远不能满足中心需求,他们将触角伸到了上海周边地区,这就意味着数据量和运算量的陡增。购买新的服务器成为中心持续发展的必要条件。
“按常理来说,这种购买只是系统扩容,照以前的拷贝一份就可以,起码用着一直不错的小型机应该是首选。”中心最早打的也是这样的如意算盘。既然以前一直不错,干脆这次复制一个好了。还用得着考虑什么选型问题吗?
当然得考虑。在IT产品不断推陈出新的今天,为什么非要守着价格动辄上百万,每年维护费用又在十万以上的小型机?是不是可以找一个替代品,又能省钱,又能完成计算任务?
别忙!换产品可以,可是得完成运算任务。再便宜,也不能买了没法用吧。
中心先仔细分析了一下对服务器计算能力的具体需求。从运算能力、运算特点来看,中心要求服务器能支持并行计算,支持批处理运算。同时,中心运行的有很多分析软件,比如计算分子生物学算法、生物开发专用软件环境等,新服务器必须能支持这些软件。其余更为细节,但也是明确门槛的要求是:浮点计算能力到1000亿次/秒,内置大容量存储设备,相关设备能够相对独立,比如电源。
当然小型机也算是理想。但除小型机之外,机群也可以考虑。单个性能并不算太高,但有机、可靠整合的机群系统,从指标上能满足计算需求,也能保证系统的安全可靠。
先拿张纸算算机群的好处有哪些,是否值得换。中心是这样认识机群的。首先它便宜,比起同档次的小型机,购买价格和后期维护费用都小很多。其次,机群也能满足中心的计算能力。无论是中心要求的生物分析、进化分析、比对软件等并行计算能力,还是序列比对等批处理计算能力,机群都可以满足。同时,在中心看重的大存储方面,机群的数据存取也让中心比较乐观。
国际品牌改为国内
服务器国内外厂商有很多。中心列了一张大表,挨个写下自己比较熟悉的国际大厂商,用排除法选型。
最早心仪的是DELL服务器,便宜,性能好,而且不少用户也在青睐DELL。但一比对数据发现,DELL没有机群解决方案。白忙活一场!还是看看几个专业机群厂商吧。
Sun当然也是不错的选择。作为国际知名解决方案提供商,Sun的产品和服务不用怀疑,其中间件产品跨平台性不错,软件体系非常完善。但在价格上,还是偏贵。另外,Sun不能按照中心计算方法进行定制服务,也不能满足移植需求。
中心开始将眼光转向国内。在国内品牌选择上,2003年联想深腾以4.183万亿次的LINPACK速度列世界第14位的信息一下子打动了中心。联想在机群体系上已经建立了品牌和知名度,而且,有数据表明其在国际上的排名也不错,是不是可以考虑呢?中心将电话打到了联想。
在性能上,中心并没有太多顾虑。而关键是,联想能否提供软件移植服务,保证中心运行的软件能够在机群上运行。
“当时我们只是试探一下,抱着希望成功的目的。没想到,移植并不难,而且联想派出了几个工程师,将我们的MPI、OpenMP、PVM应用支撑平台顺利迁移到了机群上。”中心这样回忆。
当然还有其他吸引中心的地方。比如,联想提供的机群是安腾结点。经过测试,中心发现安腾结点的综合能力是其他结点的两倍以上。而且中心私下认为,安腾结点是将来的发展方向。“有些运算对内存要求很高。而安腾能够支持最多128GB的内存,让我们不再发愁。”测试数据让中心在联想后面打了勾。
点评:
数据量和运算量的陡增使得购买新的服务器成为行业信息中心持续发展的必要条件。
又能省钱,又能完成计算任务的解决方案成为首选。
从运算能力、运算特点来看,中心要求服务器能支持并行计算,支持批处理运算。同时,中心运行的有很多分析软件,比如计算分子生物学算法、生物开发专用软件环境等,新服务器必须能支持这些软件。其余更为细节,但也是明确门槛的要求是:浮点计算能力到1000亿次/秒,内置大容量存储设备,相关设备能够相对独立,比如电源。
有机、可靠整合的机群系统,从指标上能满足计算需求,也能保证系统的安全可靠。 中心从自身从小型机一步步跨越到机群的实践,并且总结从国外品牌直接换成国内品牌的经历,他们不由得会感慨:继承以前的选型习惯当然没错。但是,适时地打破常规,用更新的产品适应不断翻新的需求也是不错的出路和选择。
|