可以肯定的是,AIOps已经成为当今流行的术语之一。严格来说,它是指使用人工智能来协助IT运营。从另一个意义上来说,它让人联想到利用人工智能将企业的技术基础设施提升到一个全新的水平。在一次网络研讨会中,行业专家讨论了以下主题:
- 什么是AIOps?
- 如何开始使用AIOps?
- 面临的挑战是什么?如何解决这些问题?
- AIOps的未来是什么?未来2~3年将何去何从,而企业现在如何准备?
BMC Software公司首席产品官Ali Siddiqui和Intellyx公司总裁Jason Bloomberg这两位AIOps行业专家对这些主题进行了分析和探讨。
什么是AIOps?
Siddiquiu:“我认为AIOps的字面意思是‘用于运营的人工智能’。人工智能实际上是计算机科学的一个分支,专注于机器模式识别和统计技术来分析其环境,因此在AIOps的案例中,它将分析IT运营环境。而且我要说的是,要不断提供场景信息,AIOps将能够在事情发生之前看到它们。而这确实是一项关键技术,确实推动了ITOps的数字化转型。”
Bloomberg:“实际上,无论这个术语是好是坏,它都是Gartner公司提出的一个术语。它最初是指用于运营的算法基础设施,而没有人知道它们的含义,并且根本没有任何意义。
但是它并没有流行起来,所以他们很快就改变了其说法,并说:‘每个人都认为AIOps意味着人工智能,所以这就是我们一直以来认为的真正含义,并且是用于运营的人工智能’。但是正因如此,这确实是Gartner公司所做出的努力。该公司还创建IT运营管理(ITOM)这个术语,并将其与人工智能技术以某种方式组合在一起,然后观察供应商对此怎么做。”
那么AIOps主要用于IT吗?还是AIOps可以帮助企业运营业务的更大事情?
Bloomberg:“我想说的是这可能是一个间接的情况,因为当今的现代数字企业是软件授权的。因此,对于开展数字化转型的组织来说,软件可以帮助他们与客户建立联系。确保软件能够正常运行,并且功能强大并且能够满足业务需求是当前业务优先事项的核心部分,因此业务现在与IT一样令人关注,所以从这个意义上来说,AIOps将为此提供支持数字企业的愿景,但实际上仍与IT运营有关。”
如果企业希望加入AIOps,那么首先要做的是什么?
Siddiqui:“因此,在IT组织中,需要选择其中一些用例,最好是一两个用例,然后将企业的团队吸引到合适的供应商那里,以解决这些特定用例,并确实有一些主要目标告诉企业是否成功。所以这是我想说的关键事情之一,不仅仅是评估,还要知道能够在哪里结束?成功的标准是什么?”
有什么实际的例子可以证明这一点呢?
Siddiqui:“因此,从ITOps的角度来看,异常检测将是用例之一。从用例的角度来看,真正含义是不想人工设置阈值或进行基准确定,这是工作人员想通过系统学习来减少噪音,需要自学和自我纠正然后解决问题的东西。通过系统学习并进行异常检测,然后不仅告诉出现的异常,还要告诉将如何解决问题。”
Bloomberg:“重要的是要了解,在企业运营环境中,已经有许多不同的工具,其中一些是较旧的工具,其中一些可能是较新的工具。其中一部分挑战在于我们拥有这些不同的工具。”
需要记住,从首席信息官的角度来看,他们不仅拥有很多工具,而且已经在很多工具上花费更多费用,因此引进新工具必须有真正的成本理由。所以实际上有两种方法,一种是需要淘汰一个或多个老旧工具,因为它们不再满足业务需要,或者不再支持它。
另外,填补空白可能是将AIOps引入组织的最常见方法,而经常出现的问题是事件过多的问题。较旧的AIOps技术将始终产生事件,这些事件可能代表真正的问题,或者仅代表一些小问题,或者可能是关于同一问题的多个通知,然后企业最终遇到了这样的情况,即运营人员每小时看到数十个问题,而每天的事件数将会激增。
AIOps特别擅长解决该问题,识别那些异常,因此需要注意的那些奇异事件。它有助于减少次要事件的影响。AIOps也善于结合相关事件……一旦有了AIOps,这些事件现在将为企业带来额外的好处,以帮助其应对事件风暴。”
部署AIOps有哪些挑战,企业如何应对这些挑战?
Siddiqui:“部署AIOps的挑战是不要忘记平衡。当企业继续进行AIOps之旅时,必须考虑所有三个方面:人员、流程和工具。而且现在供应商中都有一些非常好的工具。但是人员和流程可能是薄弱环节。
归根结底,这实际上是将企业的业务重塑为技术驱动型业务。因此,重点实际上是敏捷性,并以客户为中心。
我认为,业务成果必须是最重要的。无论是敏捷性还是客户体验,改善客户体验,所以这些都至关重要。”
Bloomberg:“重要的是要理解,一般而言,AIOps和在AIOps场景中使用人工智能与当前在企业中使用人工智能有关,但又有所不同。人工智能在企业中用于提取大数据集的见解特别有用。对于任何在日常业务中处理大数据集的企业来说,这可能都是适用的。
因此,这是AIOps供应商介入的地方。他们说,‘我们将提供AIOps技术,而无需指派数据科学家来处理AIOps技术。'企业可以分配运营人员以及负责运营环境的其他人员。
故事的另一部分是AIOps故事的安全性部分。AIOps可以检测到的异常,可能只是某些系统内存不足或某种运营异常。但通常这是某种网络安全异常。这表明正在发生某种攻击。”
AIOps的未来是什么,企业如何为这一未来做准备?
Siddiqui:“因此,如果展望一下AIOps的未来,我认为在未来几年中,将会有太多数据带来的影响。因此,企业需要开箱即用的机器学习功能,可以从大量数据中洞悉数据,无论是日志、事件、指标,都无关紧要,然后另一件事是加强IT运营和开发人,这种紧密的联系将进一步推动一些AIOps的需求。
因此,企业必须有明确的投资回报率,并且工具整合可能会改善客户体验。因此,AIOps不仅有助于提高运营效率,而且有助于实现数字化转型。
因此,我对未来几年的发展很乐观,那就是自主数字企业之旅和ITOps紧密合作以找出业务成果。也就是说,供应商正在制造易于使用的工具。
我们有很多客户,他们中的许多人仍然是混合型的,这意味着他们正在向云端转移,旅程还没有结束。这就意味着有内部部署的要求。即使是我们的BMC AMI AIOps套件,特别是刚刚推出的AMI Operational Insight产品,它确实可以在内部部署设施中工作。”
Bloomberg: “我们现在谈论AIOps的唯一原因是因为人工智能是新兴技术。再过几年的时间,所有运维管理都将具有人工智能能力。如果所有东西都是人工智能授权的,那么人工智能运营将只是运营管理,而不再认为它是一个独特的类别。
但是,在企业基础设施环境中发生这种情况有两个主要驱动因素。其中之一是,当我们观察正在发生的大范围变化时,正在转向一种称之为云原生计算的模型,我们在其中将云计算的最佳实践用于所有企业IT,包括混合IT。
此外,该环境也是非常动态的。这是容器世界(Kubernetes)带给传统虚拟机的功能之一,它是一种非常动态的企业基础设施环境。当企业拥有这样的环境时 将会生成大量数据,根本没有办法人工管理这种环境,而必须使其自动化。所有这些趋势都不会停止,而且AIOps将在未来变得越来越重要,并且将无处不在。”