【51CTO.com快译】大多数人看到关于重大云故障的头条新闻时,会想到是哪一家云提供商或负面宣传可能如何影响股价。我想到的却是幕后的人,即负责修复问题、让客户系统恢复运行的那些人。
尽管运维人员尽了最大的努力,偶尔的故障还是不可避免。互联网充满了变数,没有人完全摆脱得了这种危险。幸好,企业可以采取几个简单的步骤来防范意外故障的可能性。
下面这四个方法可以避免云故障,同时提高安全和性能:
1. 采用多站点或多云环境
将工作负载分散在多个地方或多家云提供商的企业增加了冗余性和弹性,还大大降低了停运风险。但这只是采用“多”IT环境的好处之一。这种方法还提供了更大的灵活性,使企业得以快速适应不断变化的业务要求。
寻找这样的云提供商:在多个地方有数据中心,将工作负载分散在多处。多站点策略可以将流量分发到最靠近最终用户的区域,以此提升性能。这还可以大大降低意外停机的可能性。如果一个数据中心因人为错误、恶意软件、火灾或自然灾害而停运,你的工作负载可以通过故障切换,安全地转移到另一个地方。
多云还可以提高跨IT环境的互操作性。假设你需要以允许双向数据流的方式将传统的本地系统与云平台连接起来。多云企业可以选择最适合该系统的云产品,而不是被迫选择可能无法与该系统兼容的单一云平台。我们都希望所有云都是完全开放的、可与每个系统兼容,但事实并非如此。
2. 密切关注互联网流量模式
贵公司的业务高度依赖网站和应用程序的互联网流量。如果你细想一下,互联网实际上成了你自己的内部网络的一种延伸。这就是为什么有必要监控全球互联网,留意故障、安全问题和延迟。发现问题后,公司可以采取步骤来解决问题,以免收入损失。
用户抱怨网站速度慢或应用程序延迟时,采取的第一步是运行路由跟踪,查明问题是出在内部系统,还是出在互联网上的某个环节。如果问题出在互联网上,合适的流量导向解决方案和区域部署有助于重新路由流量、提升性能并确保客户满意。
为了监控全球互联网健康状况可以采取的另一个步骤是查阅Oracle的互联网情报地图(Internet Intelligence Map)。这个免费资源旨在让用户可以了解自然灾害、政府引起的互联网关闭、互联网服务提供商(ISP)性能下降以及光缆断裂等因素如何影响全球互联网流量。
3. 将云安全视作优先事项
互联网很庞大,充满了机会,但是也为黑客利用网络安全漏洞、从后端服务器和数据库窃取信息提供了途径。如今,许多组织在云端部署和管理网站。因此,网站和面向互联网的应用程序可能无法完全受到企业防火墙的保护。这就是为什么考虑基于云的Web应用程序安全是好主意。
Web应用程序防火墙(WAF)和配套的基于云的解决方案可帮助贵公司抵御各种威胁,包括恶意机器人程序、DDoS攻击、API攻击和恶意软件上传。合适的基于云的WAF和DDoS保护解决方案有助于防止危险的互联网流量到达Web和应用服务器以及你的网络。
定期评估Web应用程序安全级别的公司可以比恶意黑客领先一步。购买云安全解决方案时,务必寻找与供应商无关的平台,无论什么样的基础设施端点设备,这种平台都可根据未来的业务计划轻松扩展。
4. 构建智能网络边缘
要确保客户在访问贵公司的网站或访问基于云的应用程序时有良好的体验,速度、性能和安全至关重要。但是云故障、网络安全威胁和人为错误可能会延迟网站流量速度,或者更严重的是,导致网站完全关闭。
公司可以积极主动地管理用来管理和保护用户访问互联网上或面向云的资产的工具和技术,以此缓解这些风险,并提升性能。拥有一个安全、智能、冗余的网络边缘从未如此重要。
构建智能网络边缘的过程始于合适的域名服务(DNS)。全局DNS可用性和性能对于确保高质量的用户体验至关重要。然而,许多公司继续依赖单一的DNS解决方案,这种解决方案常常在内部管理,缺乏扩展性、弹性和冗余性。
企业可以通过为IT环境添加云DNS服务来提高可靠性、性能和安全性。此外,冗余或辅助的DNS可加强DNS层的弹性。如果主DNS遇到故障或速度减慢,冗余DNS将保持运行状态。辅助的DNS还可帮助公司为全球各地的用户提供更一致、更高质量的体验。
原文标题:4 ways to avoid cloud outages and improve system performance,作者:Kyle York
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】