Kubernetes实践之优雅终止

云计算
Pod 销毁时,会停止容器内的进程,通常在停止的过程中我们需要执行一些善后逻辑,比如等待存量请求处理完以避免连接中断,或通知相关依赖进行清理等,从而实现优雅终止目的。本文介绍在 Kubernetes 场景下,实现容器优雅终止的最佳实践。

[[403677]]

本文转载自微信公众号「云原生知识宇宙」,作者I am roc。转载本文请联系云原生知识宇宙公众号。

概述

Pod 销毁时,会停止容器内的进程,通常在停止的过程中我们需要执行一些善后逻辑,比如等待存量请求处理完以避免连接中断,或通知相关依赖进行清理等,从而实现优雅终止目的。本文介绍在 Kubernetes 场景下,实现容器优雅终止的最佳实践。

容器终止流程

我们先了解下容器在 Kubernetes 环境中的终止流程:

  1. Pod 被删除,状态置为 Terminating。
  2. kube-proxy 更新转发规则,将 Pod 从 service 的 endpoint 列表中摘除掉,新的流量不再转发到该 Pod。
  3. 如果 Pod 配置了 preStop Hook ,将会执行。
  4. kubelet 对 Pod 中各个 container 发送 SIGTERM 信号以通知容器进程开始优雅停止。
  5. 等待容器进程完全停止,如果在 terminationGracePeriodSeconds 内 (默认 30s) 还未完全停止,就发送 SIGKILL 信号强制杀死进程。
  6. 所有容器进程终止,清理 Pod 资源。

业务代码处理 SIGTERM 信号

要实现优雅终止,务必在业务代码里面处理下 SIGTERM 信号,参考 处理 SIGTERM 代码示例 ) 。

别让 shell 导致收不到 SIGTERM 信号

如果容器启动入口使用了脚本 (如 CMD ["/start.sh"]),业务进程就成了 shell 的子进程,在 Pod 停止时业务进程可能收不到 SIGTERM 信号,因为 shell 不会自动传递信号给子进程。更详细解释请参考 为什么我的容器收不到 SIGTERM 信号 ?

如果解决?请参考 在 SHELL 中传递信号。

合理使用 preStop Hook

若你的业务代码中没有处理 SIGTERM 信号,或者你无法控制使用的第三方库或系统来增加优雅终止的逻辑,也可以尝试为 Pod 配置下 preStop,在这里面实现优雅终止的逻辑,示例:

  1. lifecycle: 
  2.         preStop: 
  3.           exec
  4.             command: 
  5.             - /clean.sh 

参考 Kubernetes API 文档

在某些极端情况下,Pod 被删除的一小段时间内,仍然可能有新连接被转发过来,因为 kubelet 与 kube-proxy 同时 watch 到 pod 被删除,kubelet 有可能在 kube-proxy 同步完规则前就已经停止容器了,这时可能导致一些新的连接被转发到正在删除的 Pod,而通常情况下,当应用受到 SIGTERM 后都不再接受新连接,只保持存量连接继续处理,所以就可能导致 Pod 删除的瞬间部分请求失败。

这种情况下,我们也可以利用 preStop 先 sleep 一小下,等待 kube-proxy 完成规则同步再开始停止容器内进程:

  1. lifecycle: 
  2.           preStop: 
  3.             exec
  4.               command: 
  5.               - sleep 
  6.               - 5s 

调整优雅时长

如果需要的优雅终止时间比较长 (preStop + 业务进程停止可能超过 30s),可根据实际情况自定义 terminationGracePeriodSeconds,避免过早的被 SIGKILL 杀死,示例:

参考资料

处理 SIGTERM 代码示例: https://imroc.cc/k8s/ref/code-example-of-handle-sigterm/

为什么我的容器收不到 SIGTERM 信号: https://imroc.cc/k8s/faq/why-cannot-receive-sigterm/

在 SHELL 中传递信号: https://imroc.cc/k8s/trick/propagating-signals-in-shell/

 

责任编辑:武晓燕 来源: 云原生知识宇宙
相关推荐

2021-03-11 14:33:28

Kubernetes开源容器

2021-03-12 07:47:44

KubernetesRedis-clustRedis

2021-06-03 08:32:52

KubernetesRBACRole

2023-10-19 19:42:25

IstioPodkubernetes

2021-10-26 10:28:41

开发架构Kubernetes

2023-05-12 14:14:00

Java线程中断

2021-12-29 17:24:16

Kubernetes集群事件

2021-06-25 15:53:25

Kubernetes程序技巧

2022-09-01 08:50:22

kubernetes容器

2024-09-03 16:28:20

2022-01-27 08:27:23

Dubbo上下线设计

2023-03-27 08:41:59

Java并发编程中断线程

2023-11-07 07:08:57

2019-08-16 11:48:53

容器云平台软件

2018-12-16 16:21:08

HadoopKubernetes容器

2020-09-25 08:00:57

Kubernetes

2021-06-08 10:26:10

云计算云计算产业云应用

2019-08-09 10:58:48

2015-07-17 10:25:43

kubernetesDocker集群系统

2024-03-29 12:11:46

点赞
收藏

51CTO技术栈公众号