rm删除文件空间就释放了吗?天真!

开发 前端
在Linux,你是不是曾经天真的以为,使用rm删除一个文件,占用的空间就释放了?事情可能不是常常如人意。不信吗?来看下面的例子。

rm删除文件空间就释放了吗?太天真了!

[[325464]]

删除一个文件

在Linux,你是不是曾经天真的以为,使用rm删除一个文件,占用的空间就释放了?事情可能不是常常如人意。

不信吗?来看下面的例子。

产生一个指定大小的随机内容文件

我们先看一下当前各个挂载目录的空间大小:

  1. $ df -h 
  2. /dev/sda11      454M  280M  147M  66% /boot 

我这里挑选了其中一个结果展示(你可以选择任一挂载目录),接下来准备在/boot下生成一个文件。

首先我们产生一个50M大小的文件:

  1. $ dd if=/dev/urandom of=/boot/test.txt bs=50M count=1 

其中dd命令可以参考《dd命令实用详解》,而关于/dev/urandom,在《Linux特殊设备文件你知道吗》中已经有介绍。

至此,我们产生了一个50M大小的文件,再看boot下:

  1. $ df -h 
  2. /dev/sda11      454M  312M  115M  74% /boot 

这里你不用关心到底多了多少,你只需要关注,/boot下的文件增多了。

测试程序

  1. #include<stdio.h> 
  2. #include<unistd.h> 
  3. int main(void) 
  4.     FILE *fp = NULL
  5.     fp = fopen("/boot/test.txt", "rw+"); 
  6.     if(NULL == fp) 
  7.     { 
  8.        perror("open file failed"); 
  9.        return -1; 
  10.     } 
  11.     while(1) 
  12.     { 
  13.        //do nothing 
  14.        sleep(1); 
  15.     } 
  16.     fclose(fp); 
  17.     return 0; 

至于程序本身,也没干啥实际的事情,就是打开一个文件,然后一直循环。

编译并运行:

  1. $ gcc -o openFile openFile.c 
  2. $ ./openFile 

打开另外一个窗口,删掉test.txt:

  1. $ rm /boot/test.txt 

再看一下boot空间:

  1. $ df -h 
  2. dev/sda11      454M  312M  115M  74% /boot 

咦?空间大小怎么一点都没变!!明明使用rm把它删除了啊?

我们把openFile程序停掉,再看看:

  1. $$ df -h 
  2. /dev/sda11      454M  280M  147M  66% /boot 

乖乖,空间马上就释放掉了,也就是按照预期,我们的文件被删除了。

一个文件什么情况下才会被删除?

实际上,只有当一个文件的引用计数为0(包括硬链接数)的时候,才可能调用unlink删除,只要它不是0,那么就不会被删除。所谓的删除,也不过是文件名到 inode 的链接删除,只要不被重新写入新的数据,磁盘上的block数据块不会被删除,因此,你会看到,即便删库跑路了,某些数据还是可以恢复的。

换句话说,当一个程序打开一个文件的时候(获取到文件描述符),它的引用计数会被+1,rm虽然看似删除了文件,实际上只是会将引用计数减1,但由于引用计数不为0,因此文件不会被删除。

  1. struct inode { 
  2. struct hlist_node   i_hash; /* hash链表的指针 */ 
  3. struct list_head    i_list; /* backing dev IO list */ 
  4. struct list_head    i_sb_list; /* 超级块的inode链表 */ 
  5. struct list_head    i_dentry; /* 引用inode的目录项对象链表头 */ 
  6. unsigned long    i_ino; /* 索引节点号 */ 
  7. atomic_t         i_count; /* 引用计数 */ 
  8. unsigned int     i_nlink; /* 硬链接数目 */ 
  9. ...... 

关于里面的细节,还有很多内容(如硬链接数量也会影响文件是否被删除),这里不一一展开。

如何释放已经被删除文件占用的空间?

关于释放,前面已经说了,重启打开该文件的进程即可。但是有没有方法找到哪些文件被删除了,但还是被某些进程打开了呢?

自然是有方法的:

  1. $ lsof |grep deleted 

其中被标记为deleted的文件,就是这样的一些文件。

其实在前面的例子中,我们也可以很容易观察到(openFile程序运行,test.txt文件被删除):

  1. $ ls -al /proc/`pidof openFile`/fd 
  2. total 0 
  3. lrwx------ 1 root root 64 5月   4 09:27 0 -> /dev/pts/25 
  4. lrwx------ 1 root root 64 5月   4 09:27 1 -> /dev/pts/25 
  5. lrwx------ 1 root root 64 5月   4 09:27 2 -> /dev/pts/25 
  6. lrwx------ 1 root root 64 5月   4 09:27 3 -> /boot/test.txt (deleted) 

看见没有,test.txt后面还有deleted字样。

既然我们都说了,这样的情况下文件是没有被删除的,那么还能不能恢复呢?实际上还是可以读取的。

总结

实际上对于这种文件被删除了,常常出现于程序的日志文件中,可能你有一个定时任务去清理程序产生的日志文件,但是如果程序本身忘记关闭句柄,就会导致磁盘空间得不到释放,最终就是你认为文件都被删除了,但是磁盘却依然被占着。所以,养成好习惯,打开文件后,不用时,记得关闭文件描述符。

如果发现明明已经删除了大量文件,但是空间却并没有恢复正常,那么不妨看看是不是还有程序打开了这些文件。

 

责任编辑:赵宁宁 来源: 编程珠玑
相关推荐

2020-07-03 15:30:14

rm文件Linux

2010-04-28 19:18:44

Hp unix

2017-11-03 09:59:16

Linux文件空间

2023-03-05 22:11:20

删除文件磁盘

2024-02-29 17:41:50

2019-12-31 15:52:20

Linux文件命令

2023-03-03 00:07:24

2024-12-16 15:07:10

2022-11-14 12:41:29

2022-03-15 17:28:46

微软Azure数据

2018-03-19 08:34:18

Windows 10Windows原系统残留

2022-02-08 22:50:12

手机存储内存

2019-11-20 10:24:43

Linux重复文件磁盘

2019-11-20 10:23:51

磁盘WindowsLinux

2012-04-19 09:29:48

2010-08-26 10:47:05

2019-04-17 10:14:31

2020-09-24 14:39:20

华为云AI知识计算

2020-09-06 22:59:35

Linux文件命令

2010-03-29 17:17:54

Oracle 删除
点赞
收藏

51CTO技术栈公众号