Kubernetes优秀实践:如何正确设置资源请求和限制?

译文
开发 架构
管理Kubernetes时,我最大的烦恼之一是工作负载没有资源请求和限制。对此我感到非常沮丧,于是索性创建了一个开源项目Goldilocks,以简化设置初始资源请求和限制这一过程。我在这篇博文中将讨论如何正确设置资源请求和限制的Kubernetes优秀实践。

​译者 | 布加迪

审校 | 孙淑娟

Kubernetes是一个动态系统,可以自动适应用户工作负载的资源利用率。

Kubernetes有两个扩展级别。每个单独的Kubernetes部署都可以使用Horizontal Pod Autoscaler(HPA)来自动扩展,而整个集群使用Cluster Autoscaler来扩展。HPA监测部署中各个pod的目标指标(通常是CPU或内存使用情况),必要时添加或删除pod,使该指标接近指定的目标。同时,Cluster Autoscaler处理集群本身的扩展。它监视无法调度的pod,并为集群添加节点或从集群删除节点,以容纳这些pod。

Kubernetes支持这两种扩展操作的一项关键特性是,能够针对工作负载设置特定的资源请求和限制。通过为每个pod使用多少CPU和内存设置合理的限制和请求,您可以尽量提高基础架构的利用率,同时确保应用程序性能很高。想最大限度地有效利用Kubernetes集群,正确设置资源限制和请求很重要。对应用程序设置过低的限制会导致问题。比如说,如果内存限制太低,Kubernetes一定会因应用程序违反限制而终止它。与此同时,如果把限制设置得太高,就会因过度分配而浪费资源,这意味着最终支付更高的费用。

虽然Kubernetes优秀实践要求您应该始终对工作负载设置资源限制和请求,但知道为每个应用程序使用什么样的值并非总是易事。因而,一些团队从不设置请求或限制,而另一些团队在初始测试过程中设置得过高,然后从不确保设置正确。确保扩展操作合理的关键是,对每个工作负载正确设置资源限制和请求,以便工作负载有效地运行。

设置资源限制和请求是在Kubernetes集群上尽可能高效、可靠地运行应用程序的关键。

1、如何设置Kubernetes资源?

Fairwinds的开源项目Goldilocks帮助团队将资源分配给他们的Kubernetes部署,并做好这些资源的调校。Goldilocks是一个Kubernetes控制器,收集运行中的pod方面的数据,并就如何设置资源请求和限制提供建议。它可以帮助组织了解资源使用情况、资源成本和确保效率的优秀实践。Goldilocks使用Kubernetes Vertical Pod Autoscaler(VPA)。它考虑到工作负载以往的内存和CPU使用情况,以及pod的当前资源使用情况,以便建议如何设置资源请求和限制。(虽然VPA可以为您设置限制,但通常最好只使用VPA引擎来提供建议。)实际上,该工具为命名空间中的每个部署创建一个VPA,然后查询该VPA以获取信息。

要查看这些建议,必须使用Kubectl来查询每个VPA对象,这对于大中型部署来说很快会变得繁琐。这时候仪表板就有了用武之地。一旦您的VPA部署到位,建议会出现在Goldilocks仪表板中。

仪表板根据您希望为部署获得的服务质量(QoS)类别提供两种类型的建议:

保证式,这意味着应用程序将被授予比其他工作负载更高的优先级,以便保证可用资源。在这个类别中,您将资源请求和限制设置为完全相同的值,这将保证在调度时容器请求的资源对其可用。这个QoS类别通常适合最稳定的Kubernetes集群。

突发式,这意味着应用程序将保证得到最低数量的资源,但如果资源可用,将获得更多的资源。实际上,您的资源请求低于限制。调度程序将使用请求将pod放置到节点上,但随后pod可以在被终止或遏制之前使用更多的资源,直至达到上限。在决定资源匮乏时删除哪些工作负载时,该QoS类别被授予较低的优先级。

仪表板为保证式和突发式QoS类别提供了建议。在保证式类别中,我们建议将请求和限制设置为VPA“目标”字段。

注意,第三个QoS类别:尽力式(BestEffort)意味着不设置请求或限制,只有当所有其他请求都得到满足时才为应用程序分配资源。不建议使用尽力式。

2、为集群使用专门的实例组

如果您对微调实例(工作负载在其上面运行)感兴趣,可以使用不同的实例组类型和节点标签将工作负载引导到特定的实例类型。

不同的业务系统常常有不同大小的资源需求,以及专门的硬件需求(比如GPU)。Kubernetes中的节点标签概念让您可以将标签放在所有不同的节点上。同时,pod经过配置后,可以使用特定的“nodeSelectors”以匹配特定的节点标签,这些标签决定了pod可以调度到哪些节点上。通过利用具有适当标记的不同实例类型的实例组,您可以将所选择的云提供商提供的底层硬件与Kubernetes中的工作负载混合搭配。

如果您有不同大小、不同需求的工作负载,将这些工作负载放在不同的实例类型上,并使用标签将工作负载引导到这些不同的实例类型上从战略上和成本上来说都是明智之举。

竞价实例(spot instance)与这一想法密切有关。大多数组织熟悉按需购买实例或在固定期限内按保留条款购买实例的模式。但是如果工作负载可能被中断,您可能需要考虑使用竞价实例。这种实例让您可以以相当大的折扣使用云提供商的剩余容量,面临的风险是对常规按需实例的需求加大时,您的实例可能会被终止。

如果您的某些业务工作负载可以容忍实例随机终止的风险,那么可使用同样的节点标签概念,将这些工作负载专门调度到这些类型的实例组上,从而大幅节省成本。

3、如何使用Kubernetes资源方面的建议?

Goldilocks是Fairwinds Insights用于提供工作负载效率和性能优化的工具之一。有了Fairwinds Insights,Goldilocks可以跨多个集群部署,这样团队可以通过单一管理平台获得信息。Fairwinds Insights为Goldilocks添加了数据和建议,包括潜在的成本节约。出现的仪表板包括命名空间和部署列表,附有平均总成本和成本方面的建议。

许多组织将CPU和内存请求及限制设置过高,所以当它们运用Fairwinds Insights的建议时,能够将更多的pod放在更少的Kubernetes worker节点上。启用Cluster Autoscaler后,任何多余的节点都将在它们不使用时被删除,这节省了时间和资金。

使用像Fairwinds Insights这样的软件或像Goldilocks这样的开源工具,开发人员可以通过为自己自动建议来避免不靠谱的猜测。反过来,这让您有机会提高集群效率和减少云开销。

原文链接:https://www.cncf.io/blog/2022/10/20/kubernetes-best-practice-how-to-correctly-set-resource-requests-and-limits/

责任编辑:武晓燕 来源: 51CTO技术栈
相关推荐

2021-05-25 09:00:00

Kubernetes容器集群

2022-03-24 08:04:50

Kubernetes资源限制

2021-06-08 10:26:10

云计算云计算产业云应用

2020-07-31 07:00:00

Kubernetes容器Linux

2021-03-11 14:33:28

Kubernetes开源容器

2022-09-01 08:50:22

kubernetes容器

2022-12-26 07:52:33

DockerfileFROM命令

2021-03-01 19:24:13

Kubernetes备份容器

2022-06-21 08:03:49

RBAC 限制容器

2021-05-18 08:00:00

Kubernetes容器进程

2019-05-21 10:45:44

Docker架构容器

2020-11-23 08:48:00

Kubernetes容器开发

2018-07-18 09:45:09

云服务Kubernetes实践

2022-07-29 13:55:03

大数据大数据管理

2020-03-16 08:48:18

Kubernetes容器云原生

2024-01-22 12:46:00

KubernetesAPI接口

2018-07-13 09:05:13

KubernetesDevOps云计算

2022-11-30 15:28:55

2022-04-07 09:30:00

自动化LinodeKubernetes

2022-11-24 09:55:12

Kubernetes监控
点赞
收藏

51CTO技术栈公众号