快手二面,磁盘异常爆满如何排查?

存储 数据管理
有时你可能会发现,使用​find​或​du​查找到的文件占用空间与​df​命令显示的磁盘使用量相差甚远。比如上图我们使用du -hs​查看根目录下所有文件的总和就只有10G左右,但 df显示磁盘占用了37G,没有隐藏目录的情况下,剩余的空间去了哪里?

大家比较常见的情况应该是内存或者 CPU 的告警,磁盘相对来说不那么容易出问题,毕竟大部分应用都不需要和磁盘交互,磁盘告警的示例如下:

图片图片

一般遇到磁盘爆满的告警,第一步要做的就是确认告警信息是否正确,登录服务器,通过 df -Hl 查看:

图片图片

可以看到 /dev/vda1 占据了 43G 的内存,和告警信息一致,接着我们就是要找到导致磁盘空间满的具体目录或文件。

如何定位占用大量磁盘空间的目录或文件?

一种基础的做法是,在根目录下执行du -hs命令,列出各个目录的大小。

图片图片

为了进一步细化,可以进入具体的目录重复该操作。这种方法虽然简单,但不够高效。

更优的方法是使用du命令的-d参数(或--max-depth参数),设置目录扫描的深度。扫描深度越大,输出的结果会越多,此时可以通过grep过滤不必要的信息。

du -h -d 2 | grep [GT] | sort -nr  
du -h --max-depth=2 | grep [GT] | sort -nr

这种方式可以快速筛选出以G或T为单位的大目录,并按大小排序。

另一种更高效的方法是使用find命令:

find / -type f -size +1G -exec du -h {} \;

相较于du,find更加灵活和快速。通过这两种方式,可以迅速定位占用磁盘空间的文件或目录。

磁盘空间不一致的情况

然而,事情并不总是这么简单。有时你可能会发现,使用find或du查找到的文件占用空间与df命令显示的磁盘使用量相差甚远。比如上图我们使用du -hs查看根目录下所有文件的总和就只有10G左右,但 df显示磁盘占用了37G,没有隐藏目录的情况下,剩余的空间去了哪里?

这种现象通常是由被删除的文件占用空间但未释放资源导致的。虽然文件被删除了,但系统还没有真正释放其占用的空间。

此时,我们可以使用lsof命令来检查是否有未完全释放的文件:

lsof +L1

图片图片

从上图结果中可以看到,有一个被删除但仍占用约28G空间的日志文件。这是比较常见的情况。解决方法是重启相关应用(如Tomcat),以释放这些被占用的空间。

磁盘空间被系统保留

有时候,你可能还会发现df命令显示的Used和Available空间之和小于Total大小,似乎有部分空间"消失"了。

图片图片

这实际上是Linux文件系统的安全机制。默认情况下,系统会为root用户预留5%的磁盘空间,用于紧急情况。这样可以确保关键应用(如数据库)在磁盘满时仍有少量空间,避免崩溃。

如果需要释放这部分保留空间,可以使用tune2fs命令调整预留空间的比例:

tune2fs -m 1 /dev/vda1

上述命令执行后将只保留 1G 的安全空间:

图片 图片

责任编辑:武晓燕 来源: 飞天小牛肉
相关推荐

2018-01-18 10:46:01

服务器磁盘原因

2022-06-07 17:08:51

WizTreewindows工具

2023-11-24 08:21:47

POI数据

2013-05-14 15:47:27

MySQL监控错误日志

2024-12-16 15:50:51

2021-07-15 23:16:09

IO异常排查

2024-11-20 16:00:19

MybatisJava数据库

2022-09-24 13:21:34

Java服务异常

2021-06-07 09:37:05

异常Bug排查

2019-01-17 23:12:58

快手“萌面”KmojiAI技术

2024-04-17 08:02:29

接口refused程序

2023-11-27 13:18:00

Redis数据不丢失

2021-05-19 14:03:48

磁盘故障

2022-07-26 08:03:27

Kubernetes节点磁盘

2021-12-26 00:10:39

二分法排查版本

2024-04-23 08:04:45

2018-11-26 08:49:42

CPU排查负载

2010-08-30 19:51:08

DHCP故障

2021-04-25 09:58:48

mmapJava面试

2024-07-10 12:23:10

点赞
收藏

51CTO技术栈公众号