5个9可用性:真正含义是什么

运维 网络运维
5个9的的可用性(即 99.999%)是指用户在给定时间段(通常定义为一年)内可以访问网络组件或服务的时间百分比。

5个9的的可用性(即 99.999%)是指用户在给定时间段(通常定义为一年)内可以访问网络组件或服务的时间百分比。

从专有网络迁移到云服务使得企业要求服务提供商提供5个9的可用性。现在企业正不断添加更多关键任务应用程序和服务,这些服务必须是高度可用,并且将停机时间保持在最低限度,这一点至关重要。当资源无法访问时,员工、客户和供应链合作伙伴就无法再访问他们需要的信息或服务。

[[410271]]

5个9和其他百分比的可用性

尽管目标是100%的可用性,但期望全年每天每分钟都可以使用服务是不合理的。维护、升级和无法控制的事件(或不可抗力)使供应商无法保证100%的正常运行时间。5个9可用性服务级别协议 (SLA) 要求很高;它要求给定服务每年不可用的时间不超过5分15秒。SLA所涵盖的服务可用性为4个9(即99.99%),每年可能有52分36秒不可用。三个9的可用性(99.9%)允许每年8小时46分钟的停机时间。

保持5个9的服务可用性百分比需要大量投资和维护,通过使用已建立的网络配置、监控和排除网络问题,并遵循最佳做法以确保系统组件保持正常运行。每小时某个服务不可用可能使公司损失数百万美元。

实现5个9可用性

如何得到更多的9?考虑以下步骤:

  • 购买最容易维修的最好设备。然后,添加负载平衡、故障转移和冗余。高度可用的系统通常包括电源和处理器、备用电池、柴油或天然气发电机(用于比电池可处理的停电时间更长的停电时间)、多条不同的通信线路以及可能出现故障的任何其他设备。
  • 在可能的情况下,自动监控网络性能并标记潜在故障。自动化工具、网络分析软件(持续跟踪网络组件健康状况),以及人工智能和机器学习等技术,可以帮助运营商减少人为错误的机会,并确保他们的网络保持正常运行。此外,人工智能和机器学习平台可以在出现网络问题或安全漏洞时,主动提醒网络运营商,并在必要时自动将操作从故障组件转移到备份。
  • 注意软件。过时或未打补丁的软件可能会导致5个9的可用性变得不可能。如果某个特定组件由于操作系统故障而出现故障,并且需要很长时间才能恢复联机,那么可用性将受到影响。
  • 测试备份和灾难恢复计划以确保它们足够应对灾难事故。

 

责任编辑:赵宁宁 来源: TechTarget中国
相关推荐

2024-08-13 15:42:19

2012-10-08 13:40:56

2020-11-05 09:47:48

云计算IT技术

2009-01-03 15:20:08

ibmdwAIX

2010-08-04 09:13:36

Hyper-V快照

2018-12-12 11:11:20

系统可靠性可用性

2012-02-13 23:20:18

linux集群高可用

2017-08-24 17:05:06

2012-09-07 09:57:14

2009-04-16 15:34:35

SQL Server

2013-11-19 17:50:33

Linux辅助软件

2011-02-17 08:49:49

WebHTMLCSS

2014-05-14 09:43:01

SUSE私有云

2012-09-04 13:43:31

SQL Server

2021-05-24 09:15:42

Go熔断熔断器

2024-02-27 09:48:25

Redis集群数据库

2013-08-28 10:30:39

vSphere

2022-07-12 10:41:25

云计算持续可用性

2010-09-14 10:25:35

私有云

2019-03-05 09:32:31

SLA阿里云宕机
点赞
收藏

51CTO技术栈公众号