阻碍云实例优化的5个常见问题-最优化问题的实例

[[205059]]

目前所推出的公有云环境(如AWS，微软Azure和谷歌云平台)，已经成为企业在IT基础架构资源上节省资金的一种手段。不幸的是，情况并非如此。云端产品日益增加的复杂性以及大多数组织对这些环境的不可见性使得难以有效控制成本。许多组织在公有云中无意识地导致过度配置，而这个错误的代价太高，企业对此无法忽视。通过避免五个最常见的错误，企业可以***限度地提高云计算资源效率，并降低业务在这些新环境中的性能风险。

错误1：不了解详细的应用程序工作负载模式

并不是所有的工作负载都是平等的，无论企业正在采用哪个公有云，***的问题就是关于云实例选择的细节。理解工作负载的用途和工作负载利用模式的详细性质，这一点很重要。

在每个月底完成一次工作的公有云中运行批处理工作负载的经济性与那些全天忙于各种高峰和低谷的应用程序有很大的不同。要正确地选择正确的资源和云实例，企业确实需要了解一天之内工作负载模式以及该模式如何在业务周期中发生变化。

不幸的是，许多组织采取简单的方法分析其工作量，而只查看每天的平均数或百分位数并不是彻底的方法，不能深入地了解具体的模式。结果是对资源需求的不准确的描述，这可能导致过度配置和性能问题。这些简单的方法很少做到正确。当企业在寻找帮助其选择正确的云实例的解决方案时，请选择真正了解工作负载的详细使用模式的东西。

错误#2：没有利用基准来平衡平台之间的数据

调整云计算资源分配的一个常见方法是在从一个虚拟环境或云环境移动到另一个虚拟环境或云环境时，将其分配差不多的大小。这意味着将工作负载分配给旧的资源。但并不是每个环境都运行相同规格的硬件。如果企业不使用基准来规范工作负载数据，并适应环境中底层硬件之间的性能差异，那么就无法准确地了解该工作负载将如何在新环境中执行。

较新的环境通常具有更强大的硬件，从而使企业更容易获得回报，因此，工作负载并不需要分配相同数量的资源。这是在转换服务器和优化公有云使用时的关键所在，因为提供者不断提供新硬件上运行的更新的云实例类型。为了避免大量占用资金，你需要能够进行比较，唯一的办法就是通过数据的标准化。

错误3：着眼于调整规模，并忽视现代化的工作量

将工作负载实现现代化，在更新的性能更强大的硬件上运行版本更新的云实例产品，可以成为降低成本的有效手段。事实上，人们已经发现，适当规模的实例可以在公有云计算中节省20%的成本，而现代化和适当的调整则平均节省了41%的成本。

随着公有云供应商提供的服务和实例类型多的令人眼花缭乱，企业很难选择适合的实例，更不用说跟上新的选择。尽管潜在的节省成本值得努力。要做到这一点，需要详细了解工作负载，云实例目录，成本以及规范化数据的能力，以解决环境之间的性能差异。这不是人工可以完成的，需要进行彻底的分析才能找到正确的组合来节省资金并确保业绩。这也是应该定期完成的事情，甚至几个月前部署的应用程序可能就是很好的候选者。

错误4：陷入“Bump-up循环”

“Bump-up循环”是一个恶性的循环，会导致过度配置和超支。假设工作负载正在运行，其CPU使用率是100%。采用一个简单的工具将会看到这一点，认为它的配置不足，并且建议调高CPU资源(以及云实例的成本)。这里的问题是某些工作负载将使用与它们相同的资源。如果提供更多的CPU，这些应用程序将采用它，仍然运行在100%，也许只是更短的时间。这个循环重复执行，被困在代价昂贵的Bump-up循环中。

为了避免这种资源吸引循环，您需要准确了解工作负载的工作情况以及其工作原理。再次，我们回到需要了解各个工作负载模式和工作负载的性质。当查看内存时，这是特别重要的，这是云计算成本的主要驱动力。

错误5：无法管理空闲的僵尸实例

大多数组织没有一个有效的过程来识别空闲的“僵尸”实例，导致他们随着时间的推移而堆积。它们通常是由于仓促地为短期部署实例而忘记关闭实例的结果。僵尸实例只是浪费预算。为了避免这种不必要的成本，组织必须使用足够的历史来查看整个业务周期(数周或数月)的工作量模式。识别和消除这种实例可以节省成本，但它需要比大多数工具提供更长期的工作量可见性。

大多数组织没有意识到他们在公有云中花费的费用是多少。节省这笔资金需要更加注意了解企业工作负载如何利用资源以及他们真正需要在不影响性能的前提下尽可能高效地工作。要明白细节是避免云预算超支的唯一途径。