虽然云计算已经以某种形式出现了十多年,但从私有、本地或公共位置管理其当前企业迭代的工具仍在快速发展。Gartner 表示,包括 IBM/Red Hat、VMware、CloudBolt、Flexera、Scalr、Cisco 和 Nutanix 在内的 90 多家供应商提供不同程度的云管理功能。
VMware 云管理业务部产品营销副总裁 Roy Ritthaler 表示,虽然有很多选择,但企业很难有效地管理多云环境。
Ritthaler 表示,“由于工作负载部署在多个公共云、多云 Kubernetes、私有云/数据中心和边缘位置,大多数企业发现很难统一了解其环境的健康状况以及管理成本、确保安全性和改善运营治理,同时实现核心流程自动化。”
这不仅是技术挑战,也是人员和流程的挑战。缺乏统一的供应工具、孤立的运营可见性、缺乏整体性能和成本洞察力以及互操作性和集成问题意味着孤立的资源、分散的团队和管理工具的扩散。涉及多个角色——IT 运营、DevOps/开发人员、财务和业务线 (LOB) 领导者——在企业采用云模型时需要广泛的培训、协作和流程变更。
IDC 研究发现,大多数企业预计他们将需要全新的多云管理工具来满足他们新兴的业务和基础设施运营需求。
“随着开发人员和业务组实施最符合其应用程序和业务创新路线图的云服务和工具,而对企业偏好的考虑有限,多云架构正在引入新一波的管理复杂性。容器、微服务和 Kubernetes 的引入进一步增加了复杂性。” IDC 表示。
据 IDC 称,未来两年,企业决策者预计将优先投资于分析、性能监控和报告、容量优化、成本管理以及自动化和自助服务,以增强多云和治理的管理能力。
这些管理工具紧密相连。成本决策必须根据容量需求和应用程序性能进行决策。
企业也对跨越不同云提供商的应用程序开发密度感到焦虑。
企业管理协会(Enterprise Management Associates)的一项研究表明,有 2316 个与 AWS、Azure 和 Google Cloud 相关的 Python 库,开发人员每天下载大约 1300 万次到 112 个不同的(主要是基于 Linux 的)操作系统。
“虽然单个项目通常位于单个云的边界内,但 EMA 也看到越来越多(约 10%)的项目跨越多个云。微服务的快速增长加剧了这一趋势,同时强调了开发人员和 IT 运营商迫切需要统一的治理和管理层,以同时为优化发布效率和运营可靠性做出贡献,”EMA 表示。
如此广泛的项目导致许多客户寻求帮助来管理跨多个环境的工作负载,这需要多个控制台和工具。
随着企业管理多云环境以及控制台和工具数量的增长,遇到来自孤立数据的挑战是很常见的,这是将运行在遗留系统上的应用程序迁移到不同的云环境中不可避免的常见副作用。
根据IBM的研究,随着企业将断开连接的数据从一个云迁移到另一个云以供各种应用程序使用,他们经常会遇到性能问题,并且成本会显著增加,甚至高达 300%。
部分用户也会抱怨多云服务,称由于云之间的数据传输和 IT 人员增加,使他们的成本大幅增加。
1. 在云之间获得统一的视图
随着企业迁移到多个云,他们很快发现每个云提供商都是独一无二的,这增加了管理这些环境的挑战,例如网络架构、功能和规模,这为客户在云中操作和给数据中心和校园网络等现有环境带来了运营挑战。
以 Arista 为例,该公司提供 CloudEOS 和 CloudVision 软件,这些软件支持私有云或公共云之间的网络连接和管理功能。
借助 CloudEOS,客户可以使用针对所有网络抽象的一致操作模型来操作多个公共云——使用它们用来操作现有数据中心和园区网络的相同运行手册和流程。“CloudEOS 遥测技术与 CloudVision 相结合,可提供给客户多云网络网络状态的时间序列存储和分析,这让客户可以回过头来检查问题发生的原因和方式,并减少恢复运营的时间,同时对初始故障检测进行快速的根本原因分析。”
在成本方面,单独的 Arista 产品 - CloudEOS Edge - 支持网络边缘的动态路径选择,允许客户为应用程序分配路径以降低数据传输/同步成本。通过跨数据中心、园区和多个公共云的统一 EOS 和 CloudVision 部署,客户可以支持和管理他们的多云战略,而不会将他们的团队规模扩大太多或影响他们的预算计划。
2. 故障排除
在管理多云环境时,企业面临的另一个问题是区分应用程序性能问题和网络问题。
企业往往很难准确预测新配置的云服务对网络的影响。
其实,IT 和 DevOps 团队可以一起工作,使用共享词汇来查明应用程序退化的根本原因,主动实时预防问题,设置策略,并自动响应以解决本地或云中的应用程序问题。
由于缺乏信息和可见性,大多数企业发现在公共云中排除网络问题非常困难,尤其是在故障排除需要数据包级别的可观察性时,应用程序和网络 IT 人员一起工作,使多云工作更有效,但目前大多数企业还没有做到这一点。
3. 来自 AI/ML 的帮助
将来自物理本地部署和多个云的数据拼接在一起并对其应用分析是一项挑战,但这是管理这种环境的关键。
部分提供机器学习和人工智能驱动的云管理平台,可以简化网络基础设施设备的入职、配置、监控、管理、故障排除、报警和报告。
在多云环境中,在本地和跨多个云环境中同样运行良好的解决方案是获得全面可见性和消除孤岛的关键。部分解决方案测量应用程序的可用性和性能,自动化操作以快速从应用程序或网络性能问题中恢复,并提供可见性和工具来诊断和修复问题,以免影响运营或最终用户对应用程序环境的体验。
当然,管理多云世界还面临其他挑战。
企业需要使员工具备管理多供应商产品的技能。数据格式和 API 是不同的,企业需要一个能够理解所有这些事情的团队。
IDC 表示,容器、微服务和 Kubernetes 的引入进一步增加了复杂性。
从多云管理组合中获得收益需要企业做出权衡和战略投资选择。在快速发展的技术环境中,很难完全预测新流程、方法和工具的影响。