从支付宝故障看服务器扩容三:事后评估篇

原创
运维 服务器运维
2009年10月29日15:30分很多淘宝网的淘友们发现突然出现了支付宝故障,官方的解释是服务器扩容,但是这毕竟为用户造成了很多的不便。我们在上一篇文章讲述了服务器扩容的事前准备篇,本文来讲述一下服务器扩容的事中实施篇。

【51CTO独家特稿】我们在上一篇文章中介绍了服务器扩容的事中实施,详细介绍了服务器扩容的过程。不过服务器扩容完毕,事情结束了吗?NO,扩容的结果只是证明我们目标达成了,至于这个服务器扩容是否真正的完美无瑕,我们还需要做一系列的评估与验证。

服务器扩容事后评估篇A、数据验证

关键的一步!服务器扩容是为了满足当前日益增长的信息与数据要求,而如果因为服务器扩容而造成数据的流失这还不如不进行扩容改造!所以我们在扩容完毕后首先要验证数据的完整性和正确性,一个数据也不能丢失,这是唯一的要求,也是必须的要求。

服务器扩容事后评估篇B、服务验证

假如我们这次扩容增加了5块SAS硬盘,前期工作我们已经验证了这次增加的有效性和可行性,但是这并不意味着此次增加就完全高枕无忧,我们还需要在扩容完毕后在功率上、使用效率上、整体性能上作出综合的评价,扩容是否给我们带来实质性的提高?需求我们是不是得以满足?都需要验证。

服务器扩容事后评估篇C、数据中心整体评估

这是一个全面考量的过程,如果增加了10片刀片,数据中心所需要的电力消耗必然会大幅提升,成本是一个方面,我们需要关注,但是我们更关注的是UPS的动力、支撑能力,一旦出现UPS负载过高的情形,增加UPS将是必不可少的,整个增加过程自然是前期工作,但是也需要我们后期验证作保证。

另外,我们还需要借助无线红外热感系统来监控整个数据中心的温度变化,一旦出现居于温度过高的现象恐要危及到其他的服务器,这也是我们在扩容完毕后需要监测与改造的。

服务器扩容结语:

服务器扩容不仅仅是考查IT运维团队的技术水平,也在验证这个团队的细致程度。在这个过程中,我们一定要在前期做足功课,在部署过程中胆大心细,不要担心问题的发生,遇到问题解决问题,当所有的case都完成后,做出近乎苛刻的测试,在用户发现问题前搞定它,呈现给最终用户的必须是最好的。

如果能注意到这些服务器扩容的问题将不再是问题。

【编辑推荐】

  1. 从支付宝故障看服务器扩容一:事前准备篇
  2. 从支付宝故障看服务器扩容二:事中实施篇
  3. 支付宝服务器扩容系统瘫痪一个半小时
责任编辑:桑丘 来源: 51CTO.com
相关推荐

2009-11-02 11:04:03

2009-11-02 11:18:08

服务器扩容支付宝故障

2009-10-30 09:48:56

2015-06-04 11:35:07

IT

2019-11-22 10:41:13

支付宝存储服务器

2021-09-09 15:30:28

鸿蒙HarmonyOS应用

2021-01-25 14:13:26

iOS支付宝支付

2014-11-17 10:52:56

支付宝去阿里化

2009-09-17 12:15:28

互联网

2011-07-13 16:26:30

服务器

2018-03-27 12:02:31

央行支付宝红包

2011-04-15 23:14:22

2010-09-07 15:30:54

IE截取器

2011-04-21 11:27:42

Firefox支付宝

2009-03-16 08:54:19

IE截取器浏览器安全

2010-01-04 15:19:52

2009-12-14 16:31:00

Linux安装支付宝

2009-11-23 10:02:22

PHP支付宝接口

2020-08-13 10:57:26

服务器故障服务器预防性维护

2017-12-18 18:23:09

支付宝扫码赚钱支付宝套路
点赞
收藏

51CTO技术栈公众号