通过可靠的设计预防VMware环境故障

云计算 虚拟化
ESXi主机需要vCenter才能进行高级功能和管理,当然,即使没有它,你也可以执行很多管理任务。但是,当你遇到事故或中断时,vCenter是虚拟环境中最重要的工具。

 ESXi主机需要vCenter才能进行高级功能和管理,当然,即使没有它,你也可以执行很多管理任务。但是,当你遇到事故或中断时,vCenter是虚拟环境中最重要的工具。在设计VMware环境时,你必须保护vCenter,并考虑为大规模故障制定应急计划。

很多管理员在同一个环境虚拟化vCenter以及管理vCenter。这意味着如果你遇到大问题(例如存储故障),你的主要诊断工具也可能会脱机。

当你使用冗余网络和电源连接时,你可能会忽略对vCenter的全面保护。幸运的是,你可以在发生故障时将多个vCenter服务器链接在一起。高可用性(HA)也可以提供vCenter保护–通过备份vCenter服务器并启动故障转移,但如果整个虚拟环境出现故障,这将无济于事。

规划管理集群

管理集群是位于主要生产基础架构外的主机,专用于管理工具和应用程序。管理集群应包含vCenter、Active Directory控制器、备份打印服务器、备份域名系统和动态主机配置协议服务器。异地管理群集对数据中心至关重要。

要使管理群集真正有效,你必须将其连接到主生产网络,但同时保持其独立,以免网络问题影响它。存储也是如此,存储应该存在于自己的框架中,或者你可以使用本地共享存储(例如vSAN)来提供备用存储位置。

如果你无法阻止VMware环境发生故障,包含关键工具和服务的管理集群可以为你提供基本功能以使其他系统重新联机。这不应取代或复制你现有的数据中心。但是,它可以在发生大规模中断时保持vCenter安全。

调整规模以防止VMware环境故障

故障威胁会影响你创建主机的大小以及可向主机中部署多少个VM或容器。你的主机越大,中断的影响就越大,具体取决于你的工作负载分布情况。

VM密度也会影响HA。对于相同数量的VM,你拥有的主机越少,重启所用的时间就越长,因为你必须一次重新启动更多的VM。

同时,保持工作负载分离可能会增加主机故障的影响。而如果你将生产工作负载与开发或测试工作负载混合在一起,则故障的影响会更小。但你必须管理更多资源池以确保生产VM具有资源权限。混合工作负载还会创建更密集的主机,因此你必须确定哪个更重要:在环境平稳运行时减少工作量,还是在发生重大故障时减少工作量。

在设计中寻找折中点

好的设计需要折中点。对你有意义的内容可能会让另一个管理员感到困惑,并且,修复可能并不总是完美。你可以通过确保其他管理员了解你的思维过程,以防止未来的VMware环境故障。

你应该记录你的设计过程,这不仅包括你做出的决定,还包括做出这些决定的原因。这有助于其他人理解背后的逻辑。这些细节可以防止他人犯错误。你当然不会希望新员工升级或更换基础架构时,遇到与你相同的问题。

责任编辑:武晓燕 来源: TechTarget中国
相关推荐

2009-07-30 18:33:22

VMware ESXESXi操作系统

2019-11-01 15:43:58

云计算云迁移公共云

2009-08-19 22:29:12

VMWare系统时间故

2020-08-13 10:57:26

服务器故障服务器预防性维护

2012-05-03 09:49:03

虚拟化vmware桌面虚拟化

2013-10-28 14:17:00

2020-07-09 09:18:23

服务器数据中心技术

2010-12-28 19:55:20

软件架构可靠性

2023-12-28 11:54:54

2020-02-25 10:56:33

云迁移公共云云计算

2012-03-14 16:09:56

虚拟化vmware.SRM 5

2011-07-22 10:10:18

VMware

2021-01-28 09:48:39

UPS电源数据中心

2024-01-15 10:57:05

2023-11-17 09:00:00

Kafka开发

2011-07-13 09:54:22

VMware故障vSphere

2009-09-22 13:54:57

VMware驱动VMware后门系统故障

2009-08-06 10:28:11

Vmware虚拟机自动

2015-03-20 09:45:17

IP协议

2023-11-22 16:08:29

大数据提高数据质量
点赞
收藏

51CTO技术栈公众号