运用sed命令高效地删除文件的特定行

系统 Linux
正常来说,我们想要删除文件中的某些行内容,一般都是先打开这个文件,然后找到要删除的内容,再然后选中这些行并按删除键进行删除,这在数据量很少时是没有问题的。

[[339302]]

运用 sed 命令高效地删除文件的特定行

正常来说,我们想要删除文件中的某些行内容,一般都是先打开这个文件,然后找到要删除的内容,再然后选中这些行并按删除键进行删除,这在数据量很少时是没有问题的。但是,一旦文件中的行数据非常多,而且数据冗杂的情况下,你还要用上面的方法去做的话就很恐怖了。为此,今天这篇文章将带大家一起学习运用 sed 命令行工具,即使在数据多而杂的情况下也能高效而优雅地删除文件中的特定行内容。

sed 是 Stream Editor 的简写,它用于在 Linux 中进行基本的文本转换,是文件操作的一个重要命令,所以,我们也可以用它来实现文本的删除操作。

下面是一些 sed 命令的使用示例,覆盖了大多数的使用场景,由浅入深地帮助你学习 sed 命令,让你轻松地实现高效删除文件的特定行内容。

首先我们准备一个演示文件 sed-demo.txt 。

  1. # cat sed-demo.txt 
  2.  
  3. 1 Linux Operating System 
  4. 2 Unix Operating System 
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 6 Arch Linux 
  9. 7 CentOS 
  10. 8 Debian 
  11. 9 Ubuntu 
  12. 10 openSUSE 

然后我们就可以运用 sed 命令进行实验了。

注意:-i 表示直接进行文件操作,而不在终端上显示结果。因为是演示所以这里不带 -i选项,我们在实际中请带上 -i 选项。

1. 删除某一行

首先,我们先从删除某一行开始,比如删除第一行、最后一行,实际也就是第 N 行嘛。

删除第 N 行的命令格式:

  1. sed 'Nd' file 

我们来删除第一行试试:

  1. # sed '1d' sed-demo.txt 
  2.  
  3. After deletion: 
  4. 2 Unix Operating System 
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 6 Arch Linux 
  9. 7 CentOS 
  10. 8 Debian 
  11. 9 Ubuntu 
  12. 10 openSUSE 

很简单是吧?这里就不多作解释了,你想要删除第几行的内容只需要把命令中的 1 替换一下就 ok 了。

那问题来了,最后一行用什么数字表示呢?这里给大家一个小提示,可以用美元符号 $ 表示最后,所以删除最后一行的命令可以这么写:

  1. # sed '$d' sed-demo.txt 
  2.  
  3. After deletion: 
  4. 1 Linux Operating System 
  5. 2 Unix Operating System 
  6. 3 RHEL 
  7. 4 Red Hat 
  8. 5 Fedora 
  9. 6 Arch Linux 
  10. 7 CentOS 
  11. 8 Debian 
  12. 9 Ubuntu 

2. 删除某些行

sed 命令可以删除连续又或者不连续的行内容。

删除连续的行,例如删除从 5 到 7 行 的内容:

  1. # sed '5,7d' sed-demo.txt 
  2.  
  3. After deletion: 
  4. 1 Linux Operating System 
  5. 2 Unix Operating System 
  6. 3 RHEL 
  7. 4 Red Hat 
  8. 8 Debian 
  9. 9 Ubuntu 
  10. 10 openSUSE 

删除不连续的行,例如删除第 1 、第 5 、第 9 和最后一行:

  1. # sed '1d;5d;9d;$d' sed-demo.txt 
  2.  
  3. After deletion: 
  4.  
  5. 2 Unix Operating System 
  6. 3 RHEL 
  7. 4 Red Hat 
  8. 6 Arch Linux 
  9. 7 CentOS 
  10. 8 Debian 

另外,它还可以配合逻辑非 ! 使用,比如删除第 3到 6 行以外的其他行:

  1. # sed '3,6!d' sed-demo.txt 
  2.  
  3. After deletion: 
  4.  
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 6 Arch Linux 

3. 删除空白行

sed 还支持删除文件的空白行,命令如下:

  1. # sed '/^$/d' sed-demo.txt 
  2.  
  3. After deletion: 
  4.  
  5. 1 Linux Operating System 
  6. 2 Unix Operating System 
  7. 3 RHEL 
  8. 4 Red Hat 
  9. 5 Fedora 
  10. 6 Arch Linux 
  11. 7 CentOS 
  12. 8 Debian 
  13. 9 Ubuntu 
  14. 10 openSUSE 

提示:这里两个斜杠 / / 内的表达式起到了文本匹配的作用,大家可以参考正则表达式的使用方法。下面将列举一些常用的方法来加深大家的学习。

4. 删除包含特定字符的行

假设我们想要删除示例文件中的包含 System 这个单词的行内容,我们可以用 /System/,它表示有出现 System 这个字符串就进行匹配,具体的命令如下:

  1. # sed '/System/d' sed-demo.txt 
  2.  
  3. After deletion: 
  4.  
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 6 Arch Linux 
  9. 7 CentOS 
  10. 8 Debian 
  11. 9 Ubuntu 
  12. 10 openSUSE 

不仅如此,我们还可以加上一下逻辑条件,比方说下面的命令:

  1. # sed '/System\|Linux/d' sed-demo.txt 
  2.  
  3. After deletion: 
  4.  
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 7 CentOS 
  9. 8 Debian 
  10. 9 Ubuntu 
  11. 10 openSUSE 

符号 \| 代表逻辑或,上述命令的意思是文本中有 System 或 Linux 的行都要进行删除。

5. 删除特定字符开头的行

首先,我们创建另一个示例文件 sed-demo-1.txt 进行更好地演示,其内容如下:

  1. # cat sed-demo-1.txt 
  2.  
  3. After deletion: 
  4. Linux Operating System 
  5. Unix Operating System 
  6. RHEL 
  7. Red Hat 
  8. Fedora 
  9. debian 
  10. ubuntu 
  11. Arch Linux - 1 
  12. 2 - Manjaro 
  13. 3 4 5 6 

上面也已经提到过,$ 号可以理解为结尾,那么有没有字符可以代表开头呢?答案是有的,这里我们可以用 ^ 号代表开头。

那么,我们想要删除以某一个字符开头的行时,比如说删除以 R 开头的行,可以使用如下命令:

  1. # sed '/^R/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4. Linux Operating System 
  5. Unix Operating System 
  6. Fedora 
  7. debian 
  8. ubuntu 
  9. Arch Linux - 1 
  10. 2 - Manjaro 
  11. 3 4 5 6 

那么问题来了,比如我想删除以 R 或者 F 开头的行,那我是不是要执行两次命令呢?如果是有更多岂不是要执行多次命令?这里它有一个简单的写法,你只要把这些字符写在一对中括号 [] 里就可以了:

  1. # sed '/^[RF]/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4. Linux Operating System 
  5. Unix Operating System 
  6. debian 
  7. ubuntu 
  8. Arch Linux - 1 
  9. 2 - Manjaro 
  10. 3 4 5 6 

上面命令的作用是 删除以 R 或者 F 开头的行。

6. 删除特定字符结尾的行

同上面一个道理,删除以某一个字符结尾的行,比方说删除以 m 结尾的行,我们可以这样做:

  1. # sed '/m$/d' sed-demo.txt 
  2.  
  3. After deletion: 
  4. 3 RHEL 
  5. 4 Red Hat 
  6. 5 Fedora 
  7. 6 Arch Linux 
  8. 7 CentOS 
  9. 8 Debian 
  10. 9 Ubuntu 
  11. 10 openSUSE 

删除以 x 或 m 结尾的行可以这样写:

  1. # sed '/[xm]$/d' sed-demo.txt 
  2.  
  3. After deletion: 
  4.  
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 7 CentOS 
  9. 8 Debian 
  10. 9 Ubuntu 
  11. 10 openSUSE 

7. 删除以大写字母开头的行

这里问题又来了,我想要删除所有以大写字母开头的行呢?按照上面的做法是不是要将 A 到 Z 这 26 个字母都写进 [ ] 里呢?其实我们大可不必这样做,在 A 和 Z 中间加个 - 就可以了:

  1. # sed '/^[A-Z]/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4. debian 
  5. ubuntu 
  6. 2 - Manjaro 
  7. 3 4 5 6 

机智的你看到这里肯定会想到其他类似的用法的了,不妨看看下面是否有你想到的命令吧。

8. 删除包含字母字符的行

  1. # sed '/[A-Za-z]/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4. 3 4 5 6 

9. 删除包含数字的行

  1. # sed '/[0-9]/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4.  
  5. Linux Operating System 
  6. Unix Operating System 
  7. RHEL 
  8. Red Hat 
  9. Fedora 
  10. debian 
  11. ubuntu 

另外,通过这个例子,我们可以加上 ^ 和 $ 更好地看到他们三个之间的区别:

  1. # sed '/^[0-9]/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4.  
  5. Linux Operating System 
  6. Unix Operating System 
  7. RHEL 
  8. Red Hat 
  9. Fedora 
  10. debian 
  11. ubuntu 
  12. Arch Linux - 1 
  1. # sed '/[0-9]$/d' sed-demo-1.txt 
  2.  
  3. After deletion: 
  4.  
  5. Linux Operating System 
  6. Unix Operating System 
  7. RHEL 
  8. Red Hat 
  9. Fedora 
  10. debian 
  11. ubuntu 
  12. 2 - Manjaro 

10. 其他更多

实际上,我们要删除的文件内容是更为具体的,简单的条件是满足不了我们的需求的,所以,sed也支持更复杂的条件组合。比方说我要指定删除在 1 到 6 行内有 Linux 这个词的内容,那么:

  1. # sed '1,6{/Linux/d;}' sed-demo.txt 
  2.  
  3. After deletion: 
  4. 2 Unix Operating System 
  5. 3 RHEL 
  6. 4 Red Hat 
  7. 5 Fedora 
  8. 7 CentOS 
  9. 8 Debian 
  10. 9 Ubuntu 
  11. 10 openSUSE 

删除包含 System 以及其下一行的内容:

  1. # sed '/System/{N;d;}' sed-demo.txt 
  2.  
  3. After deletion: 
  4. 3 RHEL 
  5. 4 Red Hat 
  6. 5 Fedora 
  7. 6 Arch Linux 
  8. 7 CentOS 
  9. 8 Debian 
  10. 9 Ubuntu 
  11. 10 openSUSE 

本文转载自微信公众号「良许Linux」,可以通过以下二维码关注。转载本文请联系良许Linux公众号。

 

责任编辑:武晓燕 来源: 良许Linux
相关推荐

2019-08-28 15:43:03

sed命令Linux

2010-12-29 09:02:30

动态构建语句ASP.NET

2022-11-08 09:38:18

Linux命令行删除文件

2020-04-03 13:45:16

删除Linux垃圾文件

2020-02-24 11:12:01

Linux电脑数据

2021-03-08 07:46:53

Git开源控制系统

2009-07-15 16:52:27

LMDS宽带无线接入

2010-05-06 17:31:39

Unix命令

2024-10-28 16:42:04

Linux编辑器sed 命令

2015-03-25 11:42:52

Java删除特定元素

2022-05-11 09:51:10

云计算公共云

2021-08-05 18:34:55

IntelliJ ID高效

2010-03-03 15:06:52

Android 游戏开

2022-08-17 12:35:26

Linux sed编辑器

2011-07-21 09:33:40

组策略

2017-01-12 19:22:19

Linuxlsof命令恢复删除的文件

2021-05-31 07:57:00

拼接字符串Java

2019-09-27 12:44:03

数据建模企业数据存储

2023-12-04 13:21:00

PandasPython

2015-08-04 15:09:31

点赞
收藏

51CTO技术栈公众号