有些CIO清楚容错系统较之集群具有更高可靠性,但让CIO为难的是应该如何说服CEO,事情明摆着:一台容错服务器20多万元,集群服务器一台2万元左右,2台不过是4万多元,要说服CEO并不容易。
如果从ROI(投资回报率)来看,容错服务器整体上是一个系统,相应的操作系统、数据库、应用软件等只需要一份授权;与之相比,集群系统硬件成本低,但是软件成本高,需要多购买一份软件的授权。总体计算下来,容错占优。但在国内环境下,有些厂商往往采用硬件赠送软件的方式,或者采用开源软件,就会使得容错在总体价格上的优势被削弱。采用开源软件的问题在于技术支持上往往跟不上。
除了投资之外,可靠性上差异更为重要。对于某些关键业务应用,如钢厂MES系统(Manufacturing Execution Systems,制造执行系统),它是连接ERP 系统和基础自动化系统的桥梁,负责厂级生产管理和调度执行。其可靠性不可或缺,系统一旦宕机,生产就会停顿,损失无法估量。对于这样的关键业务系统,集群方案是不能够满足需要的,集群系统的设计目的是容灾,用于灾难情况下的系统恢复,而恢复是需要时间的,存在中断的危险。
有些厂商宣称集群系统可以无缝切换,多数情况下,这是做不到的。有些演示环境确实可以做到,但实际情况下,无缝切换很难实现。与之相比,容错系统具有更高的可靠性,从可靠性等级来衡量,容错系统的可靠性是99.999%,也就是5个9的水平;集群只有4个9。表明看仅是区区0.009的分别,但实际上,其中的差别是巨大的。
CIO肯定清楚其中的分别,但要让CEO搞清楚就难了。5个9,4个9都是一些技术语言,用来说服CEO往往是事倍功半。
说服CEO不要采用技术语言,只需要让他清楚一件事情:一个闪电或一个控制信号错误导致了动车追尾,罪魁祸首就是可靠性不够。那么,采用容错就可以高枕无忧了吗?当然不是,但是容错方案是可靠性***的方案了,如果连容错都抵挡不住,那么也就没有系统可以抵挡了。
一句话,要让CEO做选择题。CEO可以不选择***的方案,但一定要让CEO意识到可能存在的风险。CIO只要做到这点就可以了,至于最终决策不是CIO应该考虑的问题。