你是否也经历过这些崩溃瞬间?
- 凌晨3点被报警叫醒,手动查日志半小时才发现是磁盘满了
- 重复执行ps -ef | grep java查看进程状态,一天敲了20遍
- 新同事误删了关键日志,却找不到操作记录。
今天分享四个实战Shell脚本,覆盖80%日常运维场景,从此告别低效手工操作。
效率翻倍脚本清单
1. 服务器「开机自检」脚本
功能亮点:
- 开机自动生成健康报告
- 异常指标标红告警
- 可以根据自身业务情况选择微信/邮件进行通知。
该收集系统健康状态 :
- 获取 CPU 负载 (top)
- 计算 内存占用率 (free)
- 检查 磁盘使用情况 (df)
- 监测 关键服务状态(systemctl is-active)
异常指标标红:
- 设定** CPU >80%、内存 >80%、磁盘 >90% **作为告警阈值
- 超出范围时,标红显示
运行示例:
请将上述脚本内容保存到一个名为 health_check.sh 的文件里。之后,您可以通过运行 bash health_check.sh 来执行这个脚本。如果一切顺利,您将会看到类似下面展示的结果。
2. 日志「智能清理」工具
痛点解决:
- 传统rm -rf容易误删重要日志
- 手动清理无法精准控制时间/大小
智能清理逻辑:
- find "$LOG_DIR" -type f -name "*.log" -mtime +$RETENTION_DAYS:这个命令会在 LOG_DIR 目录中查找所有 .log 文件,并且这些文件的修改时间超过了 RETENTION_DAYS 天。-mtime +$RETENTION_DAYS 表示查找修改时间超过 7 天的文件。
- -exec bash -c '...' bash {} +:对于找到的每个文件,-exec 会执行一个 Bash 脚本。bash -c '...' 中的脚本会对每个文件执行归档操作。
3. 进程自动监控与重启脚本
为了确保我们的服务能够平稳运行,当遇到进程意外退出的情况时,我们希望能自动监控并重启这些进程,以减少对业务的影响。这个脚本正是为此而设计的,它可以帮助我们实现这一目标。
4. 故障「秒级定位」神器
功能演示:
使用 ./log_scan.sh 脚本,快速抓取系统与应用层错误,秒级定位问题,助力高效故障排查!
核心代码:
新手避坑指南
Shell脚本四大死亡陷阱:
- 未处理的空格路径(永远用引号包裹变量)
- 直接使用rm -rf $VAR(必须先检查变量非空)
- 忽略错误退出码(关键操作前加set -e)
- 跨平台换行符问题(用dos2unix预处理脚本)