用户背景介绍
基因组关乎我们人类生命中的奥秘。目前,生命科学的发展已进入基因组学的时代,随之而来产生了海量的数据。面对生命科学、医学的重大科学前沿问题,基因所要深度挖掘海量数据、建立新的数学模型,从全基因组水平、系统水平研究探索生物学规律。为了更好的进行数据分析、计算模拟等方面的工作,中科院北京基因所采用了初志A2000集群存储系统解决方案。
用户需求点分析
为满足生物计算平台的基因计算需要,预建设两套与计算集群相连接的大规模存储系统,以支撑海量数据的大规模计算,完成基因分析的实验课题。一是需要匹配前端计算集群的在线数据存储;二是匹配后端调用基因序列图谱的存储资源池。
项目方案:初志如何助力基因所
针对用户对预建设的大规模存储系统的诉求,初志有针对性的提供了基于A2000的集群存储架构系统的解决方案。
首先,在线数据存储需要匹配前端计算集群,要求高I/O即高带宽来提高海量数据的查询系统和工作效率。A2000采用每节点300MB/s的高I/O存储节点单元组成并行存储集群,实现高达12GB/s的聚合带宽,全面支撑前端高性能计算集群对存储调用带宽的要求,达到数据即时传递,敏捷运算,高效输出。满足海量数据的大规模计算需要,完成基因分析的实验课题。
其次,为了匹配后端调用基因序列图谱,搭建一个存储资源池,满足存储容量的要求,A2000采用每节点36TB的大容量存储单元进行存储资源池的搭建,为基因所提供了一个海量的存储空间,并预留了PB级扩容空间,为日后的发展打下基础,保障了未来扩展的持续性。
另外,除了满足用户业务的诉求外还做到了易管理,实现了前端计算存储集群与后端存储资源池的整合,进行一体化统一管理,极大地方便了系统管理员对全局存储的把控管理。不仅如此,A2000采用HPC系统,具有可扩展性,能够使存储系统随着HPC系统的扩展而扩展。
同时,A2000采用业界最快速的光模块万兆存储网络进行网络的连通,实现了真正意义的高效,快速,前沿的大规模存储系统。
客户收益
由于基因组学的相关学科的大幅发展,基因组学对生物医学、农学、药学、环境科学的影响将会极为深远。在技术进步的影响下,基因组的研究工作更能御风而行,事半功倍。
通过初志的A2000集群存储系统的实施,基因组研究所一方面提高了带宽,保证海量数据的大规模运算;另一方面,A2000的高安全性能,保障了精密科研单位研究成果的安全。同时,系统的易操作管理也使基因组研究所在管理上方便省心,易扩展性更是为未来的发展打下基础,满足用户后续发展。