在 Linux 系统中,sed 是一个非常强大的流编辑器,用于在文件或数据流中进行文本处理。sed 命令最主要的功能包括查找、替换、插入和删除文本,可以结合正则表达式完成复杂的文本编辑任务,非常适用于日志分析、文件批处理和脚本自动化等场景。
1. 基本语法
sed 的基本语法如下:
sed [options] 'command' file
常用选项说明:
• -e:允许多次使用 sed 的编辑命令。
• -i:直接修改文件(原地编辑)。
• -n:不自动打印模式空间中的行,常和 p 配合用于只打印匹配的行。
2. 基本命令与示例
2.1 替换文本
sed 中最常用的操作就是替换文本。s 命令用于替换匹配的字符串。
sed 's/old/new/' file.txt
这条命令会将文件 file.txt 中的第一个 old 替换为 new。如果希望替换行中所有匹配的内容,可以使用全局替换标志 g:
sed 's/old/new/g' file.txt
例如,假设有一个日志文件 log.txt,我们需要将其中的所有 ERROR 替换成 WARN:
sed 's/ERROR/WARN/g' log.txt
2.2 直接修改文件(原地编辑)
可以使用 -i 选项直接修改文件,而不是输出结果:
sed -i 's/old/new/g' file.txt
这条命令会在文件 file.txt 中永久替换所有的 old 为 new,不用将输出重定向到另一个文件。
2.3 替换带有分隔符的文本
如果替换的文本中带有 /,可以选择其他分隔符来避免冲突。例如,用竖线 | 作为分隔符:
sed 's|/usr/local/bin|/opt/bin|' file.txt
3. 查找并打印文本
3.1 查找并显示匹配行
可以使用 -n 和 p 配合打印包含特定内容的行。例如,打印包含 “error” 的行:
sed -n '/error/p' file.txt
3.2 显示文件特定行
sed 还可以基于行号打印特定行。以下命令打印文件的第 5 行:
sed -n '5p' file.txt
要打印从第 3 行到第 7 行的数据:
sed -n '3,7p' file.txt
4. 插入与删除
4.1 插入文本
可以使用 i 命令在指定行之前插入文本:
sed '2i\Insert this line' file.txt
这会在文件 file.txt 的第 2 行前插入 “Insert this line”。
4.2 删除文本
使用 d 命令可以删除指定行,例如删除第 2 行:
sed '2d' file.txt
要删除文件的空行:
sed '/^$/d' file.txt
5. 结合正则表达式进行高级操作
5.1 使用正则替换复杂模式
假设要将所有数字替换成 #,可以用正则表达式:
sed 's/[0-9]/#/g' file.txt
5.2 删除特定模式的行
例如,要删除所有包含 “ERROR” 的行:
sed '/ERROR/d' file.txt
6. sed 命令的实战示例
示例1:批量替换文件内容
假设我们有一批 HTML 文件,需要将其中所有的 http:// 修改为 https://,可以用以下命令:
sed -i 's|http://|https://|g' *.html
示例2:日志清洗与分析
假设有一个日志文件 access.log,我们需要将所有访问 IP 地址匿名化(隐藏最后一段 IP):
sed -E 's/([0-9]+\.[0-9]+\.[0-9]+)\.[0-9]+/\1.xxx/g' access.log
示例3:快速查看配置文件的特定字段
假设有一个配置文件 config.ini,我们只想查看以 db_ 开头的配置项:
sed -n '/^db_/p' config.ini
7. 小结
sed 是一个功能强大、灵活的文本处理工具,适合处理大规模的文本替换和处理任务。在自动化脚本中,sed 可以帮助我们快速完成复杂的文本操作,是系统管理员和开发人员的利器。在使用 sed 时,需要注意正则表达式的语法和命令的参数,以确保得到预期的输出效果。