云原生是企业采用云技术促进数字化转型的关键原则之一。随着容器、Kubernetes的部署不断增加和云采用的不断深入,特别是混合云的部署,开发人员的认知负担越来越重。基础设施环境日益复杂且难以管理,无法满足产品或软件开发团队、人工智能(AI)/机器学习(ML)工程师(ModelOps)或提示工程师对敏捷的需求,例如可扩展性、灵活性以及对标准和操作流程、合规和安全要求的环境变化的适应性。基础设施平台工程被视为一门新学科,它的出现是为了应对系统设计和底层混合基础设施日益增加的复杂性。在所有注重改善开发人员体验的云原生开发模式中,这是一种尤为有效的方法。
尽管基础设施平台工程被定义为一种有效的实践,可帮助基础设施和运营(I&O)领导者从平台角度更高效地管理底层混合基础设施和运营,但传统的I&O部门和I&O领导者仍面临挑战。I&O领导者可采用以下三个关键成功因素(见图1)以确保基础设施平台满足企业机构需求,并反映最终用户的优先事项。
图1:利用基础设施平台工程管理云原生平台的三个关键成功因素
将基础设施平台工程原则与基础设施用户的需求相对应
Gartner将平台定义为“一种可服务或赋能其他产品与服务的产品”。平台的范围应反映最终用户的需求,对任何平台的衡量最终都是以其为满足最终用户(例如开发人员或产品团队)以及整个企业的重要需求做出的贡献程度为标准的。这一标准同样适用于作为I&O和业务线关键基础设施平台其一的云原生平台。
多数大型企业都将云原生基础设施引入了云原生平台建设,尤其是在扩展到混合云环境时。然而,传统的云原生平台管理方式更多是以架构和领导力驱动,而并非由开发人员的开发体验和数字生产力驱动。
根据混合云中的云原生平台目标,优先纳入基础设施平台工程原则。企业将关键基础设施平台工程原则集成到混合云中的云原生平台中,这些原则与特定的用户需求目标相一致,具体如下:
- 自助服务体验
- 明确统一的应用编程接口(API)
- 可预测的可用性和性能
- 可共享
- 可观测性
- 默认保护
- “既定路线”统一方针
- 产品管理
- 模块化
文档可复用
采用以产品为导向的管理方法
当云原生被认定为是多数大型企业采用云技术的关键原则时,越来越多的内部开发团队开始向云原生应用架构转型(如微服务架构、服务网格)。这种云原生应用架构要求底层基础设施和平台具备前所未有的可扩展性、灵活性和可编程性,从而缩短部署时间并提高可扩展性,更好地支持数字化转型。
然而,当企业扩展到混合云并高度依赖Kubernetes时,平台工程团队就面临着架构挑战和(来自产品或开发团队)对于混合云场景的复杂需求。传统的管理方式使管理复杂需求和底层的复杂基础设施成为挑战。以产品为导向的管理方法是云原生平台成功扩展到混合云的关键。
与传统的开发和运营实践相比,敏捷交付实践的生产率更高,能交付更高质量的数字产品,并能更稳定地满足客户需求。
明确角色和职责
基础设施平台工程团队可以利用部署组件的内置设计特性来实现产品团队或开发人员所需的关键可复用功能。对于建立合理的自主性和提高开发人员生产率来说,明确界定平台和产品团队之间的职责分工非常重要。
基础设施平台工程团队的管理职责和云原生平台的常见功能如图2所示。
图2:支持云原生平台的基础设施平台团队的管理职责