Linux下如何寻找相同文件?

系统 Linux
随着电脑的使用,系统里将产生很多垃圾,最典型的就是同一份文件被保存到了不同的位置,这样导致的结果就是磁盘空间被大量占用,系统运行越来越慢。

 大家好,我是良许。

[[330834]]

随着电脑的使用,系统里将产生很多垃圾,比较典型的就是同一份文件被保存到了不同的位置,这样导致的结果就是磁盘空间被大量占用,系统运行越来越慢。

所以如果你的电脑空间告急的话,可以试着去删除这样的文件,释放一些空间。在 Linux 下,我们可以通过识别文件的 inode 值来找出系统中的相同文件。

inode 是一个数据结构,记录了文件所有信息,除了文件名和文件内容。如果两个或多个文件具有相同的 inode 值,即使它们的文件名不一样,位置不一样,它们的内容、所有者、权限其实都是一样的,我们可以将其视有相同文件。

这类型的文件其实就是所谓的「硬链接」。硬链接具有相同的 inode 值,但文件名不一样。而软链接其实就是快捷方式,它指向目标文件,但有着自己的 inode 值。

 

  1. $ ls -l my* 
  2. -rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 myfile 
  3. lrwxrwxrwx 1 liangxu liangxu     6 Apr 15 11:18 myref -> myfile 
  4. -rw-r--r-- 4 liangxu liangxu   228 Apr 12 19:37 mytwin 

我们无法直接知道同一目录下有哪些文件是有相同的 inode 值,但要识别起来也不难。其实我们只要使用 ls -i 命令,再以 inode 值进行排序,就可以直接找到这些文件。

 

  1. $ ls -i | sort -n | more 
  2.  ... 
  3.  788000 myfile    <== 
  4.  788000 mytwin    <== 
  5.  801865 Name_Labels.pdf 
  6.  786692 never leave home angry 
  7.  920242 NFCU_Docs 
  8.  800247 nmap-notes 

在这个结果的第一列里,就是对应的 inode 值。所以从这个结果里我们一眼就可以看出来,哪些文件具有相同 inode 值。

如果你只是想找到一个文件的对应硬链接文件,我们可以使用 find 命令,再加个 -samefile 选项即可快速找到。

 

  1. $ find . -samefile myfile 
  2. ./myfile 
  3. ./save/mycopy 
  4. ./mytwin 

这些文件都是有相同的 inode 值,不信的话可以再使用 ls 命令来查看更多信息:

 

  1. $ find . -samefile myfile -ls 
  2.  788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./myfile 
  3.  788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./save/mycopy 
  4.  788000    4 -rw-r--r--   4 liangxu    liangxu      228 Apr 12 19:37 ./mytwin 

我们可以看到,除了文件名之外,这几个文件名的信息完全一样。细心的朋友可能会注意到,在第2列(硬连接数)是4,而实际上我们找出来的文件只有3个,这说明还有一个文件与他们共享 inode 值,只是我们通过这条命令没有找出来而已。

作为一个懒人,每次敲命令多麻烦,直接上脚本找出目录下的相同文件!

 

  1. #!/bin/bash 
  2.  
  3. # seaches for files sharing inodes 
  4.  
  5. prev="" 
  6.  
  7. # list files by inode 
  8. ls -i | sort -n > /tmp/$0 
  9.  
  10. # search through file for duplicate inode #s 
  11. while read line 
  12. do 
  13.     inode=`echo $line | awk '{print $1}'
  14.     if [ "$inode" == "$prev" ]; then 
  15.         grep $inode /tmp/$0 
  16.     fi 
  17.     prev=$inode 
  18. done < /tmp/$0 
  19.  
  20. # clean up 
  21. rm /tmp/$0 

运行结果:

 

  1. $ ./findHardLinks 
  2.  788000 myfile 
  3.  788000 mytwin 

当然了,你还可以使用 find 命令,根据 inode 值,找到系统里所有相同文件。

 

  1. $ find / -inum 788000 -ls 2> /dev/null 
  2.  788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /tmp/mycopy 
  3.  788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/myfile 
  4.  788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/save/mycopy 
  5.  788000   4 -rw-r--r--   4 liangxu   liangxu    228 Apr 12 19:37 /home/liangxu/mytwin 

在这条命令里,我们将错误提示重定向到 /dev/null 这个特殊文件里,这样在搜索一些我们没有权限访问的路径时,不会满屏的 permission denied 。

责任编辑:华轩 来源: 良许Linux
相关推荐

2012-05-07 13:13:03

Python

2014-03-20 10:31:02

Linuxbin

2019-10-21 08:56:36

Linux日志文件拆分

2021-11-26 22:01:26

Linux传输网络

2019-10-17 17:15:01

Linux解压文件命令

2010-11-29 14:24:06

Linux软件管理

2018-05-09 12:27:34

Linux命令寻找文件

2017-05-04 14:43:43

恶意文件WinLinux

2018-05-09 16:37:45

LinuxPDF文件解除密码

2011-08-11 22:27:47

笔记本常见问题

2021-02-03 10:43:54

Linux系统磁盘

2021-10-29 15:13:21

LinuxPDF文件

2009-12-10 09:42:07

2021-09-30 07:26:15

Linux文件夹windows

2021-06-03 10:16:15

物联网安全物联网设备恶意软件

2018-08-23 09:56:03

Linux程序版本

2021-02-16 10:57:34

C++ C 语言windows

2020-10-12 07:44:20

Linux旧文件tmpwatch

2017-12-04 14:20:27

LinuxUbuntu安卓文件传输助手

2011-02-21 14:59:50

Linuxsendmail安装
点赞
收藏

51CTO技术栈公众号