随着互联网、移动互联网、云计算、大数据等技术的发展和在医疗行业的应用,为提高服务效率及品质,医学影像数字化、移动化、智能化已成为很多医院和医疗机构开展智慧医疗建设的切入点之一。
据了解,解决医学影像数字化的第一痛点是智慧医疗建设中首要任务。
智慧医疗的前提首先就是数字化。但医学影像的数字化必然意味着大规模存储空间的占用。尤其医学影像数据量大,要求保存的时间长:1张正位的胸部X线片约28兆字节,通常1个1500张床位的大型综合性医院,1天产生的影像数据量便有7GB,1年就有24TB;按相关规定,医学影像保存时间必须大于15年;若按照20年计算,则需480T的存储空间。在当前需求背景下,面向医院的影像归档与存储系统——医学影像信息系统 PACS (Picture Archiving and Communication Systems)成为当下众多医疗机构进行医学影像数字化的选择。
如某公立三甲医院网络医院当前PACS集群部署在本地,存储了医院成立以来十几年、多达300TB的历史数据,根据相关规定,医院必须保存至少15年,但是这些历史数据使用次数很少,『冷数据』占据大量存储资源。该公立三甲医院网络医院的快速发展使得每年新增影像数据接近80TB,存储资源日益紧张。而且随着医学影像数据量的持续增大,该公立三甲医院网络医院PACS系统的数据存取性能也在逐渐下降。
高性价比、高度弹性、快速部署,云计算的这些性能天然就是该公立三甲医院网络医院,解决当下数据存储迫切需求的最佳方案。
全球领先的云计算及人工智能科技公司阿里云全面、安全、稳定、高性价比的产品体系外和完善的生态合作伙伴和服务体系,是该公立三甲医院网络医院选择将数据资产迁移到阿里云的原因。
但是如何将300TB的全量数据安全、快速、不影响业务正常使用的情况下迁移至云端?每日增量数据又如何快速同步到云端,且不影响IDC存储的日常使用?作为首家尝试完成数据迁移上云任务的公立三甲医院网络医院,为避免迁云过程出现任何数据丢失、数据不可用、数据安全泄露等问题,该公立三甲医院与阿里云生态合作伙伴——袋鼠云一起完成迁云整体方案设计,并一一攻克其中过程难点。
1. 整体方案设计
经过前期的充分调研,最终,袋鼠云和客户设计整体云上业务架构方案如下:
历史影像数据将全部迁移至阿里云OSS,在本地IDC存储中只保留近5年内的热数据,为IDC存储腾出了大量空间,解决存储空间紧张的问题;OSS即开即用,拥有无限大空间存储,并按实际使用量付费,用户无需提前购置空间,在成本上相比于传统存储有明显的优势,且数据可靠性和安全性更有保障。
同时,在云端使用ECS,OSS,SLB等云产品构建以一套云端PACS系统,病人在该医院就诊的影像文件定时同步到云端,如果病人转院治疗需要原来的影像资料时,可以使用移动APP直接查看,再也无需重新拍片。
2. 难点一:将300TB的全量数据在安全、快速、不影响业务正常使用的情况下迁移至云端
如此海量的数据如果要直接迁移到云端很难实现,袋鼠云根据该公立三甲医院特点,采用了离线迁移的方式来完成这项复杂的工作。
阿里云提供有离线迁移数据的产品-闪电立方。它是阿里云为TB乃至PB级数据迁移提供的服务。闪电立方使用定制设备,能够安全、高效、低成本地帮助用户把海量数据从本地机房迁移到云端。
使用闪电立方进行全量数据迁移
如上图,客户向阿里云申请闪电立方设备,到货后,将该设备安装在本地IDC中,使用1G/10G网络互联在存储所在的网络,提供一台或者多台服务器(虚机即可)安装闪电立方agent,将存储上对应的目录和闪电立方存储的目录都挂载到agent服务器上。通过agent将数据快速复制到闪电立方上,在拷贝的过程中也会对数据的一致性做校验。
3. 难点二:在不影响IDC存储日常使用的前提下,将每日200+GB增量数据快速同步到云端
全量数据迁移完成后怎么迁移每天产生的200+GB增量数据呢?用户要求当天新增的PACS影像数据最迟能够在第二天看到,所以需要定时将增量数据同步至云端。
阿里云的另外一个产品-云存储网关(混合云存储阵列,Cloud Storage Gateway)帮助解决了这个难题,将IDC存储上产生的新数据实时同步到云端OSS,完成增量数据的传输。
客户需要提前购买阿里云的存储网关硬件,并部署在本地存储所在的网络环境中,同时客户IDC与阿里云机房通过专线打通。在IDC本地准备1台或多台服务器(虚机即可)安装rsync agent,并配置同步任务即可。
使用阿里云存储网关进行增量数据迁移
在同步服务器上挂载EMC存储对应的目录和存储网关上缓存的目录。通过rsync 将新增数据先同步到存储网关中,存储网关会实时将数据同步到云端OSS并同时缓存一份在本地磁盘。客户要求在不影响医院网络和存储的正常使用,希望当天产生的数据尽量能快速同步到云端OSS,最迟第二天能看到。我们对当前的网络带宽,每天的数据量等因素进行了测试,最终确定了每4小时同步一次增量数据,这样在上午产生的数据下午便能看到,且保证了医院业务正常运行。
据了解,该公立三甲医院网络医院,是所在公立三甲医院为贯彻落实国务院办公厅《关于促进“互联网+医疗健康”发展的意见》,落实深化省委省政府医疗卫生领域“最多跑一次”、“互联网+医疗健康”重点项目建设等通知精神所建立实施,这是全国迄今唯一一家实体医院+媒体联合模式打造的“互联网+医疗健康”项目。 将依托强大的三甲实体医院和优质医师资源,并借助云平台技术,可实现医联体之间数据互联互通,基层医院可以快速与浙医二院的双向转诊、远程会诊等;并依法依规向患者提供预约挂号、查看报告、支付结算、健康咨询、在线复诊、药事服务等便捷、高效的互联网医疗服务。
编后:4月28日,国务院办公厅正式发布的《关于促进“互联网+医疗健康”发展的意见》中指出:发展“互联网+”医疗服务,鼓励医疗机构应用互联网等信息技术拓展医疗服务空间和内容,构建覆盖诊前、诊中、诊后的线上线下一体化医疗服务模式。此次该公立三甲医院300TB医学影像数据成功迁云案例,具有“互联网+医疗健康”程碑式意义。