5个9的的可用性(即 99.999%)是指用户在给定时间段(通常定义为一年)内可以访问网络组件或服务的时间百分比。
从专有网络迁移到云服务使得企业要求服务提供商提供5个9的可用性。现在企业正不断添加更多关键任务应用程序和服务,这些服务必须是高度可用,并且将停机时间保持在最低限度,这一点至关重要。当资源无法访问时,员工、客户和供应链合作伙伴就无法再访问他们需要的信息或服务。
5个9和其他百分比的可用性
尽管目标是100%的可用性,但期望全年每天每分钟都可以使用服务是不合理的。维护、升级和无法控制的事件(或不可抗力)使供应商无法保证100%的正常运行时间。5个9可用性服务级别协议 (SLA) 要求很高;它要求给定服务每年不可用的时间不超过5分15秒。SLA所涵盖的服务可用性为4个9(即99.99%),每年可能有52分36秒不可用。三个9的可用性(99.9%)允许每年8小时46分钟的停机时间。
保持5个9的服务可用性百分比需要大量投资和维护,通过使用已建立的网络配置、监控和排除网络问题,并遵循最佳做法以确保系统组件保持正常运行。每小时某个服务不可用可能使公司损失数百万美元。
实现5个9可用性
如何得到更多的9?考虑以下步骤:
- 购买最容易维修的最好设备。然后,添加负载平衡、故障转移和冗余。高度可用的系统通常包括电源和处理器、备用电池、柴油或天然气发电机(用于比电池可处理的停电时间更长的停电时间)、多条不同的通信线路以及可能出现故障的任何其他设备。
- 在可能的情况下,自动监控网络性能并标记潜在故障。自动化工具、网络分析软件(持续跟踪网络组件健康状况),以及人工智能和机器学习等技术,可以帮助运营商减少人为错误的机会,并确保他们的网络保持正常运行。此外,人工智能和机器学习平台可以在出现网络问题或安全漏洞时,主动提醒网络运营商,并在必要时自动将操作从故障组件转移到备份。
- 注意软件。过时或未打补丁的软件可能会导致5个9的可用性变得不可能。如果某个特定组件由于操作系统故障而出现故障,并且需要很长时间才能恢复联机,那么可用性将受到影响。
- 测试备份和灾难恢复计划以确保它们足够应对灾难事故。