Linux 服务器我们天天打交道,特别是 Linux 工程师更是如此。为了保证服务器的安全与性能,我们经常需要监控服务器的一些状态,以保证工作能顺利开展。
本文介绍的几个命令,不仅仅适用于服务器监控,也适用于我们日常情况下的开发。
1、watch
watch 命令我们的使用频率很高,它的基本作用是,按照指定频率重复执行某一条指令。使用这个命令,我们可以重复调用一些命令来达到监控服务器的作用。
默认情况下,watch 命令的执行周期是 2 秒,但我们可以使用 -n 选项来指定运行频率,比如我们想要每隔 5 秒执行 date 命令,可以这么执行:
- $ watch -n 5 date
一台服务器肯定有多人在用,特别是本部门的小伙伴。对于这些小伙伴有没浑水摸鱼,我们可以使用一些命令来监控他们。
我们可以每隔 10 秒执行 who 命令,来看看都有谁在使用服务器。
- $ watch -n 10 who
- Every 10.0s: who butterfly: Tue Jan 23 16:02:03 2019
- shs :0 2019-01-23 09:45 (:0)
- dory pts/0 2019-01-23 15:50 (192.168.0.5)
- alvin pts/1 2019-01-23 16:01 (192.168.0.15)
- shark pts/3 2019-01-23 11:11 (192.168.0.27)
如果发现系统运行很慢,我们可以调用 uptime 命令来查看系统平均负载情况。
- $ watch uptime
- Every 2.0s: uptime butterfly: Tue Jan 23 16:25:48 2019
- 16:25:48 up 22 days, 4:38, 3 users, load average: 1.15, 0.89, 1.02
一些关键的进程肯定不能挂,否则可能会影响到业务开展,所以我们可以重复统计服务器中的所有进程数量。
- $ watch -n 5 'ps -ef | wc -l'
- Every 5.0s: ps -ef | wc -l butterfly: Tue Jan 23 16:11:54 2019
- 245
想动态知道服务器内存使用情况,可以重复执行 free 命令。
- $ watch -n 5 free -m
- Every 5.0s: free -m butterfly: Tue Jan 23 16:34:09 2019
- total used free shared buff/cache available
- Mem: 5959 776 3276 12 1906 4878
- Swap: 2047 0 2047
当然不仅仅是这些,我们还可以重复调用很多命令来对服务器一些关键参数进行监控,
2、top
使用 top 命令我们可以知道系统的很多关键参数,而且是动态更新的。默认情况下,top 监控的是系统的整体状态,如果我们只想知道某个人的使用情况,可以使用 -u 选项来指定这个人。
- $ top -u alvin
- top - 16:14:33 up 2 days, 4:27, 3 users, load average: 0.00, 0.01, 0.02
- Tasks: 199 total, 1 running, 198 sleeping, 0 stopped, 0 zombie
- %Cpu(s): 0.0 us, 0.2 sy, 0.0 ni, 99.8 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st
- MiB Mem : 5959.4 total, 3277.3 free, 776.4 used, 1905.8 buff/cache
- MiB Swap: 2048.0 total, 2048.0 free, 0.0 used. 4878.4 avail Mem
- PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
- 23026 alvin 20 0 46340 7820 6504 S 0.0 0.1 0:00.05 systemd
- 23033 alvin 20 0 149660 3140 72 S 0.0 0.1 0:00.00 (sd-pam)
- 23125 alvin 20 0 63396 5100 4092 S 0.0 0.1 0:00.00 sshd
- 23128 alvin 20 0 16836 5636 4284 S 0.0 0.1 0:00.03 zsh
在这个结果里,你不仅仅可以看到 alvin 这个用户运行的所有的进程数,也可以看到每个进程所消耗的系统资源(CPU,内存),同时依然可以看到整个系统的关键参数。
3、ac
如果你想知道每个用户登录服务器所使用的时间,你可以使用 ac 命令。这个命令需要你安装 acct 包(Debian)或 psacct 包(RHEL,Centos)。
如果我们想知道所有用户登陆服务器所使用的时间之和,我们可以直接运行 ac 命令,无需任何参数。
- $ ac
- total 1261.72
如果我们想知道各个用户所使用时间,可以加上 -p 选项。
- $ ac -p
- shark 5.24
- alvin 5.52
- shs 1251.00
- total 1261.76
我们还可以通过加上 -d 选项来查看具体每一天用户使用服务器时间之和。
- $ ac -d | tail -10
- Jan 11 total 0.05
- Jan 12 total 1.36
- Jan 13 total 16.39
- Jan 15 total 55.33
- Jan 16 total 38.02
- Jan 17 total 28.51
- Jan 19 total 48.66
- Jan 20 total 1.37
- Jan 22 total 23.48
- Today total 9.83
小结
我们可以使用很多命令来监控系统的运行状态,本文主要介绍了三个:watch 命令可以让你重复执行某一条命令来监控一些参数的变化,top 命令可以查看某个用户运行的进程数以及消耗的资源,而 ac 命令则可以查看每个用户使用服务器时间。你经常使用哪个命令呢?欢迎留言讨论!