计算机正常运行最大的威胁是什么?是员工

网络 网络管理 网络运维
现如今,数据中心设备的可靠性已经得到了极大的提升,反而是使用设备的人员素质没能跟上,从而给计算机正常运行带来了很大的威胁。

之前有一个很老的笑话:“是人都会犯错,但是要真正把事情搞砸,你还缺台计算机。” 现在情况正好相反了,现如今,数据中心设备的可靠性已经得到了极大的提升,反而是使用设备的人员素质没能跟上,从而给计算机正常运行带来了很大的威胁。

[[378367]]

正常运行时间协会(Uptime Institute)对数千名 IT 专业人员一整年发生的故障事件进行了调查,得出结论表示绝大多数的数据中心故障是由于人为错误造成的,人为错误导致的故障率为 70%-75%。

而且有些故障很严重。调查发现,超过 30% 的 IT 服务与数据中心运营商经历了他们称之为是“严重服务退化”的停机事故。2019 年有 10% 的受访者称他们最近的事故造成的损失超过 100 万美元。

在正常运行时间协会在 2019 年 4 月的调查中,60% 的受访者认为,对于最近发生的重大停机事件,他们本可以通过更好的管理/流程或配置进行防止。而对于损失超过 100 万美元的故障事件,这一数字跃升至 74%。

正常运行时间协会认为,导致故障事件发生的最终的错误不一定是员工,而是令人失望的管理。

“这个行业仍然严重依赖于人工去完成一些最基础和最重要的工作,易受人为错误的影响,这一点无法避免,也许可做的防错/防灾措施很有限。”正常运行时间协会期刊的主编 Kevin Heslin 在一篇 博客文章 中写道。

“然而,对这些故障问题的快速调查发现,故障持续存在的主要原因不是人为失误,而是由于管理失误导致,如针对员工培训投资不足,相关政策执行不力,管理程序老旧,低估一名合格员工的重要性,这一系列的管理问题导致了故障停机。” Heslin 继续写道。

正常运行时间协会指出,公司的 IT 基础设施越复杂,特别是分布式特性基础设施,可能会越容易增加简单的错误层出不穷而导致业务中断的风险。同时指出公司需要意识到基础设施越复杂所涉及的风险就越大。

并警告说,在人员配备方面,不要以超过公司吸引和应用资源来管理基础设施的速度扩大关键 IT 能力,并在影响关键任务操作之前意识到任何人员和技能短缺。

 

责任编辑:赵宁宁 来源: Linux中国
相关推荐

2023-07-07 10:53:08

2015-10-12 15:21:57

桌面云/锐捷网络

2016-01-22 11:09:40

计算机图形学虚拟现实三维建模

2023-09-04 15:15:17

计算机视觉人工智能

2021-01-15 11:37:28

面向对象编程计算机科学OOP

2021-03-07 00:47:37

开发编程科学

2024-03-28 11:32:38

计算机网络集线器连接设备

2023-09-20 16:31:03

人工智能

2017-12-25 08:39:21

网络技术应用

2019-10-18 19:06:13

安全工具网络

2019-10-21 08:25:37

安全威胁员工钓鱼攻击

2023-09-28 00:07:47

2015-10-08 15:07:32

2023-09-01 10:40:52

人工智能人工驱动

2011-10-17 09:50:38

编程

2021-09-06 10:32:16

云计算云安全错误配置

2013-11-05 10:03:52

英特尔商业研究超级计算机

2022-07-22 11:46:32

Google计算机协会恶意软件

2023-07-13 11:48:18

量子技术量子计算机

2023-10-09 12:56:00

区块链计算机视觉
点赞
收藏

51CTO技术栈公众号