如今,企业确保其基础设施的平稳运行,对于维护服务和客户满意度至关重要。
Dynatrace UK&I公司区域副总裁Greg Adams对于自动化技术在多云基础设施监控中可以发挥的关键作用进行了探讨。
为了跟上数字化转型的步伐,各行各业的企业越来越多地转向多云架构,以获得保持领先所需的敏捷性和可扩展性。根据IDC公司的预测,随着这一趋势的持续,到2025年,全球在云计算服务上的总支出将超过1.3万亿美元。
然而,随着技术环境跨越更多云平台,添加的每个云平台都使将管理基础设施的任务更加复杂。反过来,这为不堪重负的IT运营(ITOps)团队带来了更多的工作,从而阻止他们专注于创新。事实上,研究发现,ITOps团队将近一半(42%)的时间花在日常工作上,其目标只是为了让其基础设施保持正常运转。
这些团队显然需要一种更可持续的方法来管理他们的基础设施,需要一种提高多云环境中的可观察性和自动化人工任务的方法,这样他们就有更多的时间专注于推动创新和为他们的组织创造价值。
多云面临的问题
如果不能有效地管理基础设施性能,ITOps团队将很难提供当今客户和用户所需的无缝数字体验。至关重要的是,他们在多云环境中具有清晰的端到端可观察性。不幸的是,这种洞察力变得更加难以捉摸,随着ITOps团队努力跟上他们的基础设施的发展,正在出现一些问题和盲点。
多云环境本质上是复杂的,并且难以使用许多现有的基础设施监控方法进行管理。这背后有几个因素:
首先,每个云平台都有自己的原生监控工具,例如Amazon CloudWatch或Azure Monitor。因此,ITOps团队逐渐发现自己拥有越来越多的工具,他们需要在传统监控解决方案之上进行分层,以跟踪跨基础设施的活动。研究表明,平均而言,企业依靠七种不同的监控解决方案来管理他们的多云环境。这迫使ITOps团队花费更多时间地将来自各种仪表板的见解整合在一起,以识别其数字服务中的问题,因为用户旅程会穿越多个云平台。
Kubernetes难题
使可观察性更加难以捉摸的另一个因素是多云环境中的变化频率。虽然Kubernetes等平台使企业能够快速扩展其多云基础设施以满足需求,但不断的变化使团队难以有效地监控和管理性能。Kubernetes环境也会产生大量数据,ITOps团队无法通过人工筛选来了解多云基础设施对用户体验的影响。
这将进一步增加复杂性,在他们努力缓解“工具蔓延”的过程中,ITOps团队通常采用自带设备(DIY)方法进行基础设施的监控,使用开源可观察性解决方案将多个工具组合在一起。这会浪费人力,并且难以维护,从而阻碍数字化转型,因为ITOps团队没有多少时间专注于更具战略性的工作。
自动化课程
为了克服这些挑战,企业需要为ITOps团队提供一种新的基础设施监控方法,利用AIOps来自动化尽可能多的人工任务。随着环境的变化,这通过不断发现和检测多云基础设施来消除盲点。因此,ITOps团队可以保持端到端的可观察性,而无需在人工监控过程中投入时间和精力。
AIOps还有助于自动分类警报和查询可观察性数据,以显示团队为向用户和客户提供无缝数字体验所需的准确见解。通过这种方法,AIOps可以让团队了解跨多云基础设施的任何问题的原因,并根据业务影响确定问题的优先级。这意味着ITOps团队可以首先解决最关键的问题,然后将精力集中在加速组织数字化转型的任务上。但是,这只有在团队可以将可观察性数据整合到一个地方时才有可能。整合视图创建单一事实来源,提供驱动有效自动化所需的完整场景。
更多时间进行创新
随着企业继续向多云环境过渡,确保基础设施平稳运行对于创建无缝数字服务和提高客户满意度变得越来越重要。实施以人工智能和自动化为中心的基础设施监控策略可减轻ITOps团队的人工任务负担。反过来,团队可以专注于加速转型,并为业务带来更好的成果。