您的公共云计算工作是否太慢?您不清楚该从在哪里最先入手?以下是一些快速指南,可以帮助您找到大多数影响云性能的根本原因。
我发现很多IT人员可以快速诊断传统系统存在的问题,但却无法诊断云系统的问题。这是为什么呢?因为他们对公共云(例如亚马逊云服务或微软云)中的内容没有深入的了解,并且认为这是一个黑盒子。
事实并非如此。此外,大多数公共云提供的系统管理工具和应用程序接口(API)都是一流的。但是,您首先必须了解要查看的位置以及要使用的工具。
云的性能非常复杂,因为它是一个复杂的分布式系统。但是,请按照以下五个诊断步骤来查找并修复其故障。如果您只用一步就找到影响性能的原因,那么请不要停止查找!因为可能存在多个原因影响其性能。
1. 检查支持工作负载的基础架构,包括应用程序和数据
使用系统监视和日志分析工具,您可以确定CPU和存储利用率,找到谁是最可能影响性能的罪魁祸首。
因为应用程序和数据库的容量随着时间的推移而不断增大,许多使用云的IT专业人员无法根据需要分配到更多的CPU和存储空间。虽然您会认为公共云会自动扩展以满足您的需求,但事实并非如此。您在需要处理更多工作负载之前,需要配置和提供更多的服务器。
2. 查看应用程序本身
有很多监视工具可以监测应用程序,我强烈建议您使用一个或多个这类工具。
在导致云性能变差的概率方面,应用程序几乎与基础架构一样多,因为应用程序可能未被重构或修改来使用原生云的功能。因此,应用程序在使用该基础架构时可能会变得非常低效,而这会导致错误地将云性能变差的原因归咎于基础架构上。
3. 查看其他不太可能导致性能变差的根本原因
现在该检查其他组件了。检查安全系统:加密服务可以使存储和计算能力达到饱和工作状态。检查治理服务,即使监控服务会首先告诉您有关性能方面的问题。我发现所有这些工具都可能使基础架构过度繁忙。
4. 检查网络,包括对云内外带宽的检查
由于您在开放的互联网上使用公共云服务,因此就会经常发生与其他数据包的竞争。要查看这是否是导致性能变差的原因,请使用ping测试,以及进行数据传输的上下波动,并通过测试来估算云计算工作负载的传输和网络使用情况。
5. 检查用户的浏览器和计算机
最后,与云应用程序交互的用户浏览器也会经常存在问题。
我发现过一些恶意软件和加密问题,基本上Windows电脑和苹果电脑上所有可能出现的问题都会使客户端的云性能变慢。如果前四个步骤检查都没发现问题,那么请技术支持人员来检查一下。