多云并非避免云故障的好手段，同城容灾、数据备份等就可以解决-多云解决方案

在单云就能满足要求的情况下盲目追求多云有点像是“何不食肉糜”了。毕竟IT选型***目标是：适用。

近日，某云厂商故障问题引起业内关注。有人提出，企业是否要选择其他方式来避免云故障损失，其中多云部署被多次提出。但同时不少人持反对意见，认为从性价比、技术实力等考虑多云并不现实。有意思的是，几乎无人质疑云计算比自建数据中心更为安全稳定。

首先需要确认一点：在全球范围内主流云厂商的故障时有发生。例如亚马逊AWS在2017年2月，就曾因一条错误指令引起宕机，影响了包括Slack、Quora和Trello在内的很多企业平台,停机4小时。去年9月，微软Azure数据中心还意外遭雷劈发生故障。

有网友评论，凡是IT都有故障概率，相对于传统IT单机，云计算已经通过大规模调度降低了故障率，大多数云厂商都声明可用性在99.9%-99.999%之间，且多数在故障后恢复很快。

知名市场研究机构Gartner旗下的CloudHarmony网站通过对48家云服务商故障发生的次数和市场监测表明，主流云厂商整体宕机时间在大幅缩短，意味着云厂商技术更加成熟，整体服务稳定性在逐年提高。

其次，多部署几个云就可以避免云故障带来的损失？亚马逊AWS***执行官Andy Jassy三年前就曾公开表示，使用多个云服务商的做法性价比不高。他认为，如果企业想走多云之路，最基本的要实现***层的标准化，但是现在的云平台大都不同。其次，要维持多个堆栈的运行，不仅对资源要求高，而且昂贵，这对很多人来讲都是件伤脑筋的事。

Electric Cloud 公司的***技术官兼联合创始人Anders Wallgren也认为，企业在尝试使用多云战略之前，一定要确保自己真正了解云计算。举个例子，企业团队可能具备使用多个 SaaS 应用程序的能力——但并不表示企业就能在多个平台上管理多个 IaaS 环境。

而修理成本、日常管理和维护成本等也是IT决策者们要清醒认识的问题，如果只是奔着避免云故障的目标，***可能发现要付出巨大的成本。

因此，对多云持犹豫态度的专家提出了一个更为现实的选项：相比用多云来解决稳定问题，更务实的做法是充分利用现有云服务商的***实践，优化自身系统的可用性。

云厂商基本已提供完善的容灾架构设计，包括冷备、热备、同城双活、异地多活等策略，可以针对系统可用级别与成本、效率综合考虑。对于不太重要的业务可以基于冷备或者热备的方案；对于比较重要的业务至少具备同城双活的能力；对于非常重要的核心业务需要考虑异地多活。且基础云产品基本都做到了跨可用区容灾，整体可用性成本很低。

举例来说，如果做了同城容灾，西南1的C机房故障，至少西南 1还有A、B等其他机房做备份。如果做了两地容灾策略，西南1故障，还有华南1、华东2可以用。基本上对于当前99%以上的企业而言，已经足以满足其可靠性要求。

另外，企业也可以利用云厂商服务来演练自己的容灾能力。除了应对硬件设备的灾难外，企业还会有其他挑战，包括流量冲击、引入不合理依赖、依赖环节不可用或者延迟高等。

上述建议适合大部分企业。但确实还有一些企业本身规模庞大，对业务的可用性要求极高，同时自身也有非常强悍的技术能力。在上述方案尚不能满足需求时，多云就成了一个待考察的选项了。在单云就能满足要求的情况下盲目追求多云有点像是“何不食肉糜”了。毕竟IT选型***目标是：适用。