SRE和DevOps值得关注的十大开源项目

开源
在本文中,我们将会介绍一些在监控,部署和运维领域最受欢迎的开源项目。

构建可扩展且高度可靠的软件系统是每个SRE的最终目标。

[[399813]]

在SRE/DevOps领域中,有大量出色的开源项目,每个项目都有新颖而激动人心的解决方案。在本文中,我们将会介绍一些在监控,部署和运维领域最受欢迎的开源项目。

1. Cloudprober

Cloudprober可以主动跟踪和监控应用程序,并帮助你提前发现故障。它使用“活动(active)”监控模型来检查你的组件是否按预期运行。例如,它会主动运行探针,以确保你的前端是否可以访问你的后端。同样,可以运行探针来验证你的本地系统是否可以真正访问你的云虚拟机。通过这种跟踪方法,可以轻松地跟踪应用程序的配置,还可以轻松定位系统中发生的问题。

特征:

  •  能与Prometheus和Grafana等开源监控系统集成。Cloudprober也可以导出探测结果。
  •  目标自动发现。为GCE和Kubernetes提供了开箱即用的支持;其他云服务可以轻松配置。
  •  部署简单。它可以通过Docker容器快速部署。
  •  占用空间小。Cloudprober镜像大小很小,仅包含静态编译的二进制文件,并且它需要非常少的CPU和RAM就能运行大量的探针。

2.Cloud Operations Sandbox(Alpha)

Cloud Operations Sandbox是一个开源平台,可以通过该平台了解Google服务的可靠性工程实践,还可以使用Cloud Operations工具套件,并将其应用于云服务。注意:这需要一个Google云服务帐户。

特征:

  •  演示服务—基于现代云原生微服务架构设计的应用程序。
  •  一键式部署-通过脚本将服务部署到Google Cloud Platform的工作。
  •  负载生成器-在演示服务上模拟流量的组件。

3. Kubernetes的版本检查器

这是一个Kubernetes工具,可以帮助你查看集群中运行的镜像的版本。该工具还允许你在Grafana仪表板上,以表格查看镜像版本。

特征:

  •  可以一次设置多个镜像仓库。
  •  使你可以将版本信息视为Prometheus指标。
  •  支持诸如ACR,DockerHub,ECR之类的镜像仓库。

4.Istio

Istio是一个开源框架,用于监控微服务流量,实施策略以及以标准化方式汇总遥测数据。Istio的控制平面上为集群管理(例如Kubernetes)提供了一个抽象层。

特征:

  •  支持HTTP,gRPC,WebSocket和TCP通信的负载均衡。
  •  通过丰富的路由规则,重试,故障转移和故障注入对流量行为进行细粒度控制。
  •  可插拔的策略层和配置API,支持访问控制,速率限制和配额。
  •  集群的入口和出口,以及集群内所有流量指标,日志和跟踪信息。
  •  基于身份的验证和授权,保障了服务间通信的安全。

5. Checkov

Checkov是“基础结构即代码”的实践,它是一个静态代码检查工具,能够扫描Terraform,Cloud Details,Cubanet,Serverless或ARM模型云基础架构,并能够检测配置是否有误。

特征:

  •  超过400条内置规则涵盖了AWS,Azure和Google Cloud的最佳安全实践。
  •  能够监控Terraform管理的IaaS,PaaS或SaaS的开发,维护和更新。
  •  能够在EC2用户数据,Lambda上下文和Terraform程序中检测AWS凭证。

6.Litmus

Litmus是一个云原生混沌工程。Litmus提供了一些工具来协调Kubernetes上的混沌情况,以帮助SRE发现其部署中的漏洞。SRE首先使用Litmus进行混沌测试,然后使用它来发现故障和漏洞,提高系统的弹性。

特征:

  •  开发人员可以在应用程序开发期间运行混沌测试,作为单元测试或集成测试的扩展。
  •  对于CI流水线构建者:当应用程序遇到流水线中的故障时,可以运行混沌测试以查找错误。

7.Locust

Locust是一个易于使用,可编写脚本且灵活的性能测试工具。你可以使用Python代码自定义操作,而不是使用笨拙的UI。这使Locust可以扩展且并对开发人员友好。

特征:

  •  Locust具有分布式和可扩展性,可轻松支持成百上千的用户。
  •  UI界面,可实时显示进度。
  •  稍加修改就可以测试任何系统。

8.Prometheus

Prometheus是Cloud Native Computing Foundation项目,是一个系统和服务监控系统。它在特定时间从已配置的目标中提取指标,测试规则并显示结果。如果违反了指定条件,它将触发警告通知。

特征:

  •  多维数据模型(由度量标准定义的时间序列)。
  •  通过服务发现或静态配置发现目标。
  •  不依赖于分布式存储;单个节点是具有自治能力。
  •  PromQL,一种强大而灵活的查询语言。

9.Kube-monkey

Kube-monkey是Netflix的Chaos Monkey在Kubernetes集群中的实现方式。对一个系统进行压力测试的一种万无一失的方法是随机打碎东西。这就是Netflix的Chaos Monkey背后的理论,这是一种混沌工程工具。

特征:

  •  Kube-monkey的工作方式是在你指定的集群中随机破坏pod,并且可以在特定的时间窗口内进行微调。
  •  可根据你的要求,进行高度可定制。

10.PowerfulSeal

PowerfulSeal会将故障注入Kubernetes集群中,从而帮助你尽快识别问题。它使创建完整的混沌工程成为可能。

特征:

  •  与Kubernetes,OpenStack,AWS,Azure,GCP和本地环境兼容。
  •  可以与Prometheus和Datadog集成以进行指标收集。
  •  通过自定义用例,支持多种模式。

结论

开源技术的最大好处是它们的可扩展性。你可以根据需要向该工具添加功能,以更好地适应你的基础架构。

由于微服务架构成为主流,因此使用可靠的工具来监控和诊断系统,必将成为每个开发人员的必备技能。 

 

责任编辑:庞桂玉 来源: 马哥Linux运维
相关推荐

2021-03-25 09:00:00

开发工具集群

2010-10-28 11:22:45

开源项目

2013-02-01 10:49:20

2022-11-28 16:27:24

DevOps开发

2018-02-08 09:25:08

开源AI项目

2022-01-26 09:41:25

边缘计算开源项目

2020-03-24 14:35:24

开源工具Joplin

2016-12-15 13:51:30

开源数据可视化

2024-12-02 13:29:46

2018-05-22 08:33:22

2010-01-05 13:41:40

2023-07-27 17:09:55

智能建筑物联网5G

2018-12-11 04:05:26

边缘计算数据物联网

2013-07-24 09:20:39

大数据创业公司大数据

2024-06-26 12:52:15

2019-08-23 09:00:00

PHP开发工具编程 语言

2024-08-05 14:13:56

2018-09-06 09:00:00

软件测试DevOps机器学习

2022-08-15 09:34:56

机器学习人工智能

2023-05-16 14:11:48

点赞
收藏

51CTO技术栈公众号