华大基因成立于1999年9月9日,其基因的测序能力及基因组分析能力处于***地位。在多年的发展中,华大基因建设了一支具有世界***水平的、年轻的产学研队伍,开展了广泛的国际国内科技合作与交流,开创了科学、技术、产业相互推动的发展模式,在基因组科学和产业发展领域再现了深圳速度和深圳奇迹。
高性能计算集群(HPCC)是基因研究工作的重要工具,基因的测序、数据处理、比对分析和结果提取等,都要在HPCC上进行。为了确保基因研究工作能够高效进行,华大基因对HPCC系统的建设,以及其中核心部件处理器的筛选,都非常重视。
就在最近,随着研究项目的增多,华大基因之前建设的HPCC平台开始逐渐显得有些力不从“芯”,为此华大基因又把目光投向了***一代的多核处理器,计划筛选最“强悍实用”的多核处理器来升级HPCC系统。
华大基因对市场上的新一代多核处理器进行了全面的对比分析,更结合实际工作进行了深入的测试。最终,华大基因决定全面引入基于AMD六核“伊斯坦布尔”处理器的戴尔刀片服务器,升级其HPCC系统。
华大基因采用68片戴尔M605刀片服务器和5个M1000e刀片服务器机箱实施升级,刀片服务器配置为:AMD六核皓龙2435处理器(代号“伊斯坦布尔”,2.6GHz);16GB内存(8×2GB);一块146GB的SATA硬盘。刀片服务器全部被插装在M1000e机箱内,机箱均通过万兆线缆与万兆交换机相连,从而构成一个刀片式的万兆高性能并行计算网络系统。该HPCC系统的管理节点是一台机架式服务器,后端存储则采用的是Panasas设备。
华大基因高性能计算主任方林表示:“我们以为AMD‘伊斯坦布尔’处理器是目前性价比***的多核处理器。在性能上比前代产品至少提升20%,同时还有价格优势。我们在大量引入AMD新一代六核处理器后,计算能力大概提升了两倍。这有力地推动了研究项目的开展,包括熊猫基因序列研究、中丹合作的糖尿病基因研究,中美英合作的千人基因组研究和人体肠道元基因组研究等在内的多个重大项目的进程,都有了不同幅度的加快,很多项目都将早出成果、多出成果。”
如今华大基因的HPCC平台每天要产出大概10个T左右的数据,这个数据是非常惊人的,因为很多大型企业一年的业务数据都没有10个T。在如此繁重的计算任务面前,基于伊斯坦布尔处理器的戴尔M605刀片服务器以稳定、高效和可靠的性能,实现了无故障运行。