在运维工作中,为保证业务的正常运行,我们需要定时查看指定的进程是否还存在,一旦进程退出了,说明服务可能存在问题,运维工程师就可以在第一时间处理问题。今天就跟大家分享一个实用的shell脚本——时刻检查你的进程状态。
在对进程进行监控时,我们一般需要得到该进程的 ID,进程 ID 是进程的唯一标识,但是有时可能在服务器上不同用户下运行着多个相同进程名的进程。
下面的函数 GetPID 给出了获取指定用户下指定进程名的进程 ID 功能(目前只考虑这个用户下启动一个此进程名的进程),它有两个参数为用户名和进程名,它首先使用 ps 查找进程信息,同时通过 grep 过滤出需要的进程,最后通过 sed 和 awk 查找需要进程的 ID 值(此函数可根据实际情况修改,比如需要过滤其它信息等)。
对进程进行监控
- function GetPID #User #Name
- {
- PsUser=$1
- PsName=$2
- pid=`ps -u $PsUser|grep $PsName|grep -v grep|grep -v vi|grep -v dbx\n
- |grep -v tail|grep -v start|grep -v stop |sed -n 1p |awk '{print $1}'`
- echo $pid
- }
示例演示:
1. 源程序(例如查找用户为 root,进程名为 TestApp 的进程 ID)
- PID=`GetPID root TestApp`
- echo $PID
2. 结果输出
- 11426
- [dyu@xilinuxbldsrv shell]$
3. 结果分析
从上面的输出可见:11426 为 root 用户下的 TestApp 程序的进程 ID。
4. 命令详解
(1)ps: 查看系统中瞬间进程信息。 参数:
- -u< 用户识别码 > 列出属于该用户的程序的状况,也可使用用户名称来指定
- -p< 进程识别码 > 指定进程识别码,并列出该进程的状况
- -o 指定输出格式
(2)grep: 用于查找文件中符合字符串的当前行。 参数:
- -v 反向选择,亦即显示出没有 ‘搜寻字符串’ 内容的那一行
(3)sed: 一个非交互性文本编辑器,它编辑文件或标准输入导出的文件,一次只能处理一行内容。 参数:
- -n 读取下一个输入行,用下一个命令处理新的行而不是用第一个命令
- p 标志 打印匹配行
(4)awk:一种编程语言,用于在 linux/unix 下对文本和数据进行处理。除了在命令行中使用,它更多是作为脚本来使用。 参数:
- -F fs or –field-separator fs :指定输入文件折分隔符,fs 是一个字符串或者是一个正则表达式,如 -F:。
PS:有时有可能进程没有启动,下面的功能是检查进程 ID 是否存在,如果此进程没有运行输出:
- The process does not exist.
- # 检查进程是否存在
- if [ "-$PID" == "-" ]
- then
- {
- echo "The process does not exist."
- }
- fi