医疗行业用户谈关键业务基础设施

运维 服务器运维
现实是,双机应用仍然是现在的主流,凡涉及关键业务应用的领域,双机冗余都是一个重要的解决方案。但是双机冗余服务器方案不能够解决软件的故障。在实际运行过程中,有些时候数据库莫名其妙打不开了,在这种情况下,只有重新安装数据库,没有其他好的办法,而这不仅可能造成数据的丢失,也会在时间上无法满足医院的要求,这对医院是致命而不可接受的。

  在信息技术日新月异的今天,医疗机构越来越依赖信息系统来开展业务,对于门诊、临床等关键业务应用而言,提供7×24×365连续运营至关重要。目前大多数医院所采用双机热备、集群服务器在可靠性方面存在着不小的安全隐患,加之不少医院专业人员有限,在这种情况下,具有更高安全级别的容错服务器解决方案更加备受关注。

  容错是指服务器对于错误的容纳能力,是应用过程中对于服务器稳定性追求的一个目标。为了这样一个目标,服务器集群技术、双机冗余服务器方案和单机容错技术这三种实现方法都在被使用。但集群技术、双机冗余服务器方案由于依赖于软件的特性,其设计更为复杂,并且维护成本较高,而容错服务器的思路就是把所有运算器(CA)、控制器(CC)、存储器M和输入/输出装置这些部件全部采用冗余硬件设计。两个部件共运行同一个任务,以此来提高系统的运行可靠性。这种冗余硬件的设计并不难,但是最为困难的是如何保证计算和数据在硬件中的同步(Lockstep),这是美国容错技术有限公司(Stratus)的核心专利技术,也是其驰骋容错技术领域30年不败的关键。 

7×24小时不间断,stratus可以保证

  美国stratus容错公司生产的容错服务器在一些关键性领域里应用非常广泛,例如:电信、机场、银行、冶金行业、安全、医院HIS系统、公安、电力行业、大的零售业等一切要求高可用性的行业。 

而现实是,双机应用仍然是现在的主流,凡涉及关键业务应用的领域,双机冗余都是一个重要的解决方案。但是双机冗余服务器方案不能够解决软件的故障。在实际运行过程中,有些时候数据库莫名其妙打不开了,在这种情况下,只有重新安装数据库,没有其他好的办法,而这不仅可能造成数据的丢失,也会在时间上无法满足医院的要求,这对医院是致命而不可接受的。

 

[[59699]]
上海中医药大学附属曙光医院信息中心刘珉

 

在医院,7×24小时的不间断运行是对硬件与系统的考验,尤其是在关键业务上。上海中医药大学附属曙光医院曾使用stratus容错服务器很多年,信息中心刘珉主任说:对医院而言,信息主管最关心的是系统的安全稳定以及数据的准确性,在容错服务器中,由于采用冗余部件同时运行同一应用任务,这样当两个系统产生不一样计算结果时,系统就会察觉,并通过技术手段对于计算错误进行校验,从而提高应用的准确性。stratus容错服务器在我院使用的8年中,从未出现过停顿15分钟以上的故障,确实能够满足我们在关键业务上的需求。

 

[[59700]]
哥伦比亚大学基金会•上海德济医院信息主管张志翔

  哥伦比亚大学基金会•上海德济医院信息主管张志翔主任介绍说:由于私立医院在人力等方面的投入较之大型三甲医院不足,因此在硬件上更希望能够尽量降低人力和维护成本,并能够稳定安全的运行。stratus容错服务器正好能够满足我们在硬件安全高效的要求。

对于容错服务器而言,虽然在理论上存在着两个相同部件同时损坏的情况,但是随着硬件水平的提高,这种概率是比较低的。容错硬件的设计一方面可以防止硬件的单点故障,同时也可以防止硬件所造成的计算错误,并对此做出校正。

 

[[59701]]
上海市卫生局信息中心高级工程师沈惠德

 

上海市卫生局信息中心高级工程师沈惠德很形象地将双机与容错进行了比喻。他说:如果将服务器比作人的器官,那么双机冗余像是器官移植,会出现“排异”的可能性,而容错服务器更像是自身的一套器官,不会出现排异,因此其安全可靠性更高。在他看来,医院信息化的不断推进对安全的要求更高,随着对医院等级评测要求的提高,也将推动容错服务器的发展。

1+1>2,stratus可以做到

  买一台stratus容错服务器,得到的不仅仅是一个硬件设备,还有伴随的高可靠性、更精确运算以及更优性价比。

  美国stratus容错服务器代理商之一上海复高计算机科技有限公司副总经理马俊华表示:stratus容错服务器部署更简单,可以大大减少软件成本;安全更有保障,能有效地保护动态数据不丢失。上海复高计算机科技有限公司系统集成部总经理汪国亮说:如果采用双机冗余方案,需要购买两套操作系统、两套数据库产品,那么其总体的投资与容错服务器方案相当,而系统的可用性方面,容错服务器显然更具有优势。

  同为美国stratus容错服务器代理商的上海显亮数码科技发展有限公司总经理周彬彬说,应用容错服务器后,相比其他方式的“救火”行为,容错服务器将医院信息化底层无法预测的硬件故障预防,管理人员可以将更多的精力用于其他软件的运作与维护,可大大减少运维成本。

  根据国际著名咨询机构IDC所公发布的数据:容错服务器可用性是99.9998%,消除单点故障的集群,可靠性仅为99.99%,而IBM的大型机为99.995%。就技术而言,  双机只能保证写入硬盘的数据,不能够对缓存数据进行有效保护,双机系统当硬件出现故障进行切换时,是要产生停顿的,与此同时,双机切换有可能不成功,如此以来,对于医院的窗口单位而言,就会对正常的医疗秩序产生影响,甚至引发群体性事件,影响医院整体形象。有与之相比,容错产品支持任意硬件热插拔,包括主板、CPU等关键性硬件,外界并感觉不到切换,系统可靠性大大提高,同时因为系统具备纠错能力,系统更加稳定。如果说集群技术可以减少停机,那么容错系统的目标是避免停机,在相同的条件下,容错系统显然更加稳定和安全。需要稍加说明的是,小型机虽然也是一种选择,但这会增加成本,同时也对企业的技术人员提出了比较高的要求。

  目前,容错服务器推广应用还需要政府推动以及人们认知水平的提高。一个好消息是,越来越多的医院在选购stratus容错服务器,说明在医院的关键业务中,容错服务器更加适用。

 

责任编辑:常疆 来源: 中国数字医学
相关推荐

2010-10-19 14:55:55

惠普融合基础架构

2022-02-10 11:54:34

即时基础设施基础设施数字化转型

2011-08-05 09:23:51

2015-11-03 20:33:45

2022-12-15 10:37:07

2017-08-09 08:09:27

IT基础设施

2019-11-20 15:18:15

欺骗技术网络安全基础设施安全

2017-10-31 09:29:29

云基础设施控制

2022-02-25 08:27:54

EventMesh云原生网关

2023-08-22 14:12:41

2022-04-26 05:40:57

网络风险基础设施网络攻击

2020-10-12 10:11:39

IT云计算技术

2018-01-02 17:53:02

2024-03-29 14:25:44

云计算人工智能

2023-06-19 10:25:54

数据存储

2010-05-18 19:32:54

惠普安腾关键业务

2010-04-29 11:31:34

惠普融合

2024-01-02 12:53:58

智慧城市人工智能物联网

2015-06-29 13:46:24

全媒体/华为

2022-03-08 14:10:09

网络安全网络攻击
点赞
收藏

51CTO技术栈公众号