【51CTO.com快译】Chaos Mesh®是一个云原生混沌工程(Chaos Engineering)平台,负责编排Kubernetes环境中的混沌。借助Chaos Mesh,您可以模拟种种故障,并使用Chaos Dashboard这个Web UI直接管理混沌试验。自开源以来,Chaos Mesh已被许多公司采用,以确保其系统的弹性和稳健性。但在过去的一年,我们常听到社区的要求,询问服务没有部署在Kubernetes上时如何运行混沌试验。
什么是chaosd?
chaosd是一个增强的工具包,可满足物理机上的混沌测试日益增长的需求。您可能会觉得这个名字很熟悉!那是由于它是从Chaos Mesh中的一个关键组件chaos-daemon演变而来的。
在TiDB黑客马拉松2020上,我们重构了chaosd,使其不仅仅是一个命令行工具。现在有了chaosd v1.0.1,您可以模拟针对物理机的特定错误,然后像什么没发生一样撤消混沌试验。
chaosd的功能特性
chaosd的最新升级版拥有广泛的功能,以下是最突出的几项:
- 易于使用:可以使用chaosd 命令轻松创建和管理混沌试验。
- 多种故障类型:可以在不同级别模拟物理机上注入的故障,包括进程故障、网络故障、Java虚拟机(JVM)应用程序故障、压力场景、磁盘故障和主机故障。
- 多种工作模式:可以将chaosd 用作命令行工具或服务。
事不宜迟,不妨试一试。
如何使用chaosd?
这部分将逐步介绍如何使用chaosd注入网络故障。您的Linux内核版本必须是v2.17或更高版本。
1.下载并解压chaosd
要下载chaosd,请运行以下命令:
- curl -fsSL -o Chaosd-v1.0.1-linux-amd64.tar.gz https://mirrors.chaos-mesh.org/chaosd-v1.0.1-linux-amd64.tar.gz
解压缩文件。它含有两个文件夹:
- chaosd含有chaosd的工具入口。
- tools含有进行混沌试验所需的工具,包括stress-ng(模拟压力场景)、Byteman(模拟JVM应用程序故障)和PortOccupyTool(模拟网络故障)。
2. 创建混沌试验
在这个混沌试验中,服务器将无法访问chaos-mesh.org。
运行以下命令:
- sudo ./chaosd attack network loss --percent 100 --hostname chaos-mesh.org --device ens33
示例输出:
- Attack network successfully, uid: c55a84c5-c181-426b-ae31-99c8d4615dbe
在该模拟中,ens33网络接口卡无法向chaos-mesh.org发送网络数据包或无法从chaos-mesh.org接收数据包。之所以要使用sudo命令,是由于混沌试验修改了网络规则,这需要root权限。
另外,别忘了保存混沌试验的uid。您稍后将在恢复过程中输入该信息。
3. 验证结果
使用ping命令查看服务器是否可以访问chaos-mesh.org:
- ping Chaos-mesh.org
- PING Chaos-mesh.org (185.199.109.153) 56(84) bytes of data.
执行该命令后,该网站很可能不会响应。按CTRL+C组合键以停止ping进程。您应该可以看到ping命令的统计信息:100% packet loss(100%丢包)。
示例输出:
- 2 packets transmitted, 0 received, 100% packet loss, time 1021ms
4. 恢复试验
要恢复试验,运行以下命令:
- sudo ./chaosd recover c55a84c5-c181-426b-ae31-99c8d4615dbe
示例输出:
- Recover c55a84c5-c181-426b-ae31-99c8d4615dbe successfully
这一步还需要使用sudo命令,因为需要root权限。完成恢复试验后,再次尝试ping chaos-mesh.org,以验证连接。
下几步
1.支持仪表板Web
如您所见,chaosd易于使用。但是我们可以让它变得更简单——面向chaosd的仪表板Web目前正在积极开发中。
我们将继续增强其可用性,并实现更多的功能,比如管理使用chaosd运行的混沌试验以及使用Chaos Mesh运行的混沌试验。这将为Kubernetes和物理机上的混沌测试提供一致且统一的用户体验。
下面的架构只是一个简单的例子:
图1. Chaos Mesh的优化后架构
2.添加更多的故障注入类型
目前,chaosd提供六种故障注入类型。我们计划开发得到Chaos Mesh支持的更多类型,包括HTTPChaos和IOChaos。
如果您有兴趣帮助我们改进chaosd,欢迎选择一个问题单,开始入手!
试一试!
如果您有兴趣使用chaosd,并想探索更多,请查看文档。如果您在运行chaosd时遇到问题,或者有功能请求,请随时创建问题单。我们很想听到您的声音!
原文标题:How to Run Chaos Experiments on Your Physical Machine,作者:Xiang Wang
【51CTO译稿,合作站点转载请注明原文译者和出处为51CTO.com】