一、kubectl 命令参数自动补全
使用 Kubernetes,就一定会使用 Kubectl 命令,默认安装好 Kubectl 命令不支持自动补全参数。下面配置 Kubectl 命令参数自动补全方法:
Linux 上,比如 Centos
- $ yum install -y bash-completion
- $ source /usr/share/bash-completion/bash_completion
- $ source <(kubectl completion bash)
- $ echo "source <(kubectl completion bash)" >> ~/.bashrc
MAC 上
- $ brew install bash-completion
- $ source $(brew --prefix)/etc/bash_completion
- $ source <(kubectl completion zsh)
- $ echo 'source <(kubectl completion zsh)' >> ~/.zshrc
Kubectl 常用操作 [1]
1、如何查找非 running 状态的 Pod 呢?
- $ kubectl get pods -A --field-selector=status.phase!=Running | grep -v Complete
2、如何查找 running 状态的 Pod 呢?
- $ kubectl get pods -A --field-selector=status.phase=Running | grep -v Complete
3、获取节点列表,其中包含运行在每个节点上的 Pod 数量?
- $ kubectl get po -o json --all-namespaces | jq '.items | group_by(.spec.nodeName) | map({"nodeName": .[0].spec.nodeName, "count": length}) | sort_by(.count)'
- [
- {
- "nodeName": "service1",
- "count": 6
- },
- {
- "nodeName": "service3",
- "count": 13
- }
- ]
4、使用 kubectl top 获取 Pod 列表并根据其消耗的 CPU 或 内存进行排序
- # 获取 cpu
- $ kubectl top pods -A | sort --reverse --key 3 --numeric
- # 获取 memory
- $ kubectl top pods -A | sort --reverse --key 4 --numeric
二、添加Namespace默认CPU和内存限制
有时候 Pod 没有做资源限制,会因为个别 Pod 使用量超出,影响整个宿主机应用。下面给出一个具体例子,可以根据实际情况来调整相关参数。
- apiVersion: "v1"
- kind: "LimitRange"
- metadata:
- name: "resource-limits"
- namespace: default
- spec:
- limits:
- - type: "Pod"
- max:
- cpu: "4"
- memory: "4Gi"
- min:
- cpu: "100m"
- memory: "100Mi"
- - type: "Container"
- max:
- cpu: "4"
- memory: "4Gi"
- min:
- cpu: "100m"
- memory: "100Mi"
- default:
- cpu: "500m"
- memory: "500Mi"
- defaultRequest:
- cpu: "100m"
- memory: "100Mi"
- maxLimitRequestRatio:
- cpu: "60"
三、利用 Kubelet 给 Node 预留资源
- evictionHard:
- imagefs.available: 15%
- memory.available: 1G
- nodefs.available: 10%
- nodefs.inodesFree: 5%
四、利用 Kubernetes RBAC 划分好权限
多个团队部署应用到一个kubernetes集群时,情况就可能变得很复杂。切记不要把管理员权限开放给每个人。个人建议是,根据命名空间来区分隔离每个团队,然后使用RBAC策略只允许各自团队访问各自的命名空间。
如果我们把管理员权限开放给每个人,那么在pod级上进行读取、创建和删除访问时,可能让人抓狂,因为误操作的情况会经常发生。为此,应该只允许管理员有权访问,从而将管理集群和部署集群的人员权限区分开。
五、充分利用 PodDisruptionBudget 控制器
如何保证在 kubernetes 集群中的应用程序总能正常运行?
答案:是使用 PodDisruptionBudget 控制器。
在进行 kubectl drain 操作时,kubernetes 会根据 PodDisruptionBudget 控制器判断应用Pod集群数量,进而保证在业务不中断或业务SLA不降级的情况下进行应用Pod销毁。PDB(PodDisruptionBudget)应该放在每个拥有一个以上实例的deployment上。我们可以使用简单yaml为集群创建PDB,并使用标签选择器确定PDB应该作用在哪些带有标签的资源上。
- 注意:PDB只考虑主动中断,硬件故障之类的情况不在PDB考虑范围内。
例子:
- apiVersion: policy/v1beta1
- kind: PodDisruptionBudget
- metadata:
- name: zk-pdb
- spec:
- minAvailable: 2
- selector:
- matchLabels:
- app: zookeeper
六、使用探针来检测应用的状态
Kubernetes 支持配置探针。kubelet 使用探针来确定Pod中应用程序是否健康。K8S 提供了两种类型来实现这一功能,Readiness 探针和 Liveiness 探针。
- Readiness:探针用于确定容器何时准备好接收流量。
- Liveiness:探针用于确定容器是否健康,如果不健康根据策略判断是否重新部署一个新的容器来替换。
例子:
- readinessProbe:
- tcpSocket:
- port: 8080
- initialDelaySeconds: 5
- periodSeconds: 10
- livenessProbe:
- tcpSocket:
- port: 8080
- initialDelaySeconds: 15
- periodSeconds: 20
参考链接
- [1] https://mp.weixin.qq.com/s/fJpSlVOywrgIhejsWSvhbw
- [2] https://zhuanlan.zhihu.com/p/81666500