怪异服务器故障带来的经验

运维 服务器运维
服务器是数据中心最常见的设备之一,一旦出现了服务器故障,相关的业务基本上就会停止。本文就向您介绍了一个奇怪的服务器故障。

最近遇到一个怪异服务器故障,费了好大劲才排除,现在拿来跟大家分享一下。

服务器故障现象

一台Intel奔腾3/550服务器,近期频繁出现几次蓝屏幕死机故障。趁死机关闭的机会,将内存由原来的128M升级到512M(普通内存),并且在系统CMOS设置中选择装入(Load)最优参数设置,对内存每个单元进行检测。怪异服务器故障出现了,当我开机后,内存检测正常,但是屏幕提示须重新SETUP,按指定的[F2]键后却死机。我装个内存条招谁惹谁了,怎么会死机?而且内存检测正常啊?

服务器故障处理

服务器出了故障就要解决,哪怕是怪异服务器故障。按照缩小故障源的思路,换回原来的内存条,逐步去掉各个部分(软驱、硬盘、光驱等),可是这个怪异服务器故障依然存在。分析可能与系统SETUP设置有关,特别是关于对内存每个单元进行检测的设置。于是,拔出电池,对电池插脚短接放电,没有奏效。看来,这个怪异服务器故障还真是顽固。后来,找到主板清除CMOS跳线设置,将插脚线由1-2改到2-3一会儿,然后恢复原位,开机正常(编者提示:不要轻易拔出电池,而是要找CMOS清除跳线)。再次将内存升级,调整CMOS SETUP设置,特别注意到对内存的检测,设置为检测到每兆,至此系统完全恢复正常。

服务器故障经验

后来我一分析,这个怪异服务器故障发生的根本原因是服务器的内存缺省设置为ECC(带校验),由于使用普通不带校验的内存,而系统中设置每个单元都进行检测,所以导致了上面的故障。排除的方法是清除CMOS设置,调整有关参数设置。另外,CMOSSETUP装入最优参数设置通常有2种:一种是BIOS优化参数,这种参数稳定性最好;另一种是SETUP优化参数,优化整个系统,但是需要系统支持,其稳定性不能保证最好。所以,当系统出现故障时,不妨先将稳定性最好的参数装入,解决问题后再行恢复。

【编辑推荐】

  1. 服务器故障排查方法总纲
  2. 服务器故障不用忙 找对方法解迷茫
  3. 彻底解决DHCP服务器故障
责任编辑:桑丘 来源: 巧巧读书
相关推荐

2016-10-20 23:36:41

数据中心数据中心故障

2013-11-12 11:09:26

云服务器服务器市场亮点

2009-09-17 16:06:18

2009-09-17 18:09:53

Nis服务器

2010-08-25 14:40:49

DHCP服务器故障

2010-08-31 17:37:22

DHCP服务器故障

2009-09-17 15:48:58

WSUS服务器

2010-04-29 12:09:42

Unix服务器

2011-05-25 10:52:45

2010-09-03 11:43:23

DHCP服务器管理

2010-08-27 10:08:57

DHCP服务器

2010-01-07 11:08:32

2018-04-03 10:30:35

2010-08-31 17:15:57

DHCP服务器

2009-10-21 14:39:27

HP服务器故障排除

2009-10-21 14:16:50

服务器故障排除

2010-08-25 15:11:44

DHCP服务器

2011-07-13 16:26:30

服务器

2009-12-04 09:47:47

LinuxNFS服务器

2009-08-18 14:57:40

服务器故障排查
点赞
收藏

51CTO技术栈公众号