HP服务器故障排除实战

运维 服务器运维
服务器的管理维护包括软件和硬件两个方面,哪一方面出问题都会让服务器运行出现故障甚至瘫痪。下面就给大家说一说本人在实际中遇到的一次HP服务器故障排除。

网络技术飞速发展,计算机网络被广泛应用于学校、科研部门、政府机关及商业等各个领域。网络管理的好坏将直接影响网络的有效使用,其中对于服务器的安全维护十分重要。服务器的管理维护包括软件和硬件两个方面,哪一方面出问题都会让服务器运行出现故障甚至瘫痪。下面就给大家说一说本人在实际中遇到的一次HP服务器故障排除。

HP服务器故障排除一、出现故障

笔者单位使用的是HP NetServer LH3000服务器组成的局域网,自从建网以来服务器硬件一直良好。但有一次启动服务器后发现有问题,刚开始自检运行都正常,等到进入Windows2000主画面时,发现服务器主机内的噪音变大,开始认为是系统软件加载错误导致的,多次重新启动服务器,有时重启后正常维持时间稍长,有时稍短。等到系统启动完毕后,注册进入系统,打开管理工具,查看系统日志,没有发现故障提示。

HP服务器故障排除二、故障的排除

于是我们怀疑是感染了病毒,把服务器设置成从软盘驱动器启动,用KV3000杀毒王引导盘启动服务器,之后扫描硬盘,查完后未发现病毒,排除了病毒感染的可能性。又怀疑与BIOS有关?检查BIOS设置,查出版本号,到惠普网站查询,找到了对应的新BIOS版本,于是决定升级BIOS试一试。先到惠普网站下载了***的BIOS升级程序,拷贝到软盘,为了保险,先将服务器现在的BIOS备份后再升级。从软盘引导系统,运行升级程序,大约25分钟之后,升级终于顺利完成。再启动进入BIOS设置,改为硬盘启动。重启服务器,进入系统后,过了一会儿,故障依旧。至此,我们才转向服务器的硬件检查,打开了机箱,检查电源风扇,运转正常,粗略检查其它风扇也未见异常。***请HP专业维护人员来,并将系统I/O控制板和电源控制板予以更换,更换重启服务器后,问题仍未解决。于是开始全面检查服务器,在服务器面板主菜单中查看,意外发现“Event Log”中的“System Event”下有一提示,显示“Fan Slow”。于是我们重新打开机箱,认真检查每组风扇,由于服务器内部有多组风扇,各自负责不同控制板的散热。分别检查,终于在机器隔板下的隐蔽处找到两组风扇,其中有一组风扇停转。原因找到后,换上新风扇再启动服务器,声音小了。运行一切正常。至此服务器故障得以排除。

HP服务器故障排除三、故障排除分析

从以上故障排除过程得知,HP NetServer LH3000服务器的面板日志记录中记载着系统每次启动和关闭时的硬件检测信息,如果系统出现故障,我们可以直接查看系统事件,以便快速诊断故障部位,这将起到事半功倍的作用。现将HPNetServer LH3000服务器面板的主要内容简单介绍一下:

Event Log

Fw lnfo:主要是一些设备信息,如BIOS版本号等。

System lnfo:主要是硬件信息,如CPU主频、型号、CPU号(多处理器)、L2Cache、内存容量及所在插槽等。

Component lnfo:主要是产品标号、序列号等。

Service:记录一些服务信息。

Adjust Contrast:调整面板显示的对比度。

按面板右侧的上下箭头,选择进入子菜单;当光标处于“Event Log”时回车进入,选择“System Event”再进入,即显示系统引导、死机、管理、硬件故障信息等内容。通过查看记录即可知道异常情况的原因及时间等信息,为解决问题提供依据。

HP服务器故障排除四、经验总结

HP服务器出现噪音变大的故障,初期可能只是风扇转速减慢,系统还能继续工作,但由于系统负荷逐渐加大,环境温度升高,使服务器内部温度升高,加大了风扇的负荷,最终导致一组风扇损坏,将排风散热的工作由另一组风扇负担,系统初始启动时,系统产生热量较小,一组风扇还可以承担。当系统运行一段时间后,机箱内温度开始升高,当系统检测到温度已超过其阈值时,于是发出指令提高风扇转速,加速散热,从而导致服务器主机内的声音突然加大。如果各组风扇都运行正常,则可以保证服务器主机内的温度在正常范围内,从而保证系统正常运行。

在检查服务器的硬件问题时,***先查看服务器面板主菜单“Event Log”的内容。由于服务器事件存储容量有限,应定期备份记录,否则溢出后新事件将无法记录,会导致系统实时信息丢失,不利于排查故障。建议用Navigator CD制作DiagTools启动软盘,需两张软盘。定期用软盘启动服务器,启动后回车,即选择Diagtools和Event Log Display Utility Ver 3.12,进入Event Log Display Utility Ver 3.12,即可导出Event Log记录;否则按“ESC”,只有Diagtools不能导出事件日志。还可以通过Diagtools工具检查系统,保证系统的安全。

【编辑推荐】

  1. 服务器故障不用忙 找对方法解迷茫
  2. 服务器故障排除大汇总
  3. 怪异服务器故障带来的经验
责任编辑:桑丘 来源: ZDNet服务器频道
相关推荐

2011-05-25 10:52:45

2009-06-27 20:20:00

LinuxNFS故障

2010-03-19 17:44:22

服务器RAIDRAID 5故障

2009-09-17 18:09:53

Nis服务器

2009-10-21 14:16:50

服务器故障排除

2009-12-04 09:47:47

LinuxNFS服务器

2009-09-24 15:09:27

打印服务器

2009-09-24 15:17:19

打印服务器

2009-12-15 16:30:02

邮件服务器故障

2009-09-08 15:41:08

NFS服务器

2009-08-26 11:55:55

Dell服务器故障排除

2009-10-13 10:55:14

Web服务器故障排除

2009-07-16 15:27:59

web服务器

2009-08-24 17:20:29

IBM刀片服务器宕机

2009-08-14 17:34:02

2009-04-22 17:03:40

Linux服务器七要素

2010-04-19 17:18:14

2010-12-30 11:20:13

数据库连接

2011-11-15 22:13:48

服务器死机故障排除

2009-08-31 17:12:35

点赞
收藏

51CTO技术栈公众号