在awk中怎么使用循环

系统 Linux
awk 脚本有三个主要部分:BEGIN 和 END 函数(都可选),用户自己写的每次要执行的函数。某种程度上,awk 的主体部分就是一个循环,因为函数中的命令对每一条记录都会执行一次。然而,有时你希望对于一条记录执行多次命令,那么你就需要用到循环。

[[284446]]

来学习一下多次执行同一条命令的不同类型的循环。

awk 脚本有三个主要部分:BEGINEND 函数(都可选),用户自己写的每次要执行的函数。某种程度上,awk 的主体部分就是一个循环,因为函数中的命令对每一条记录都会执行一次。然而,有时你希望对于一条记录执行多次命令,那么你就需要用到循环。

有多种类型的循环,分别适合不同的场景。

while 循环

一个 while 循环检测一个表达式,如果表达式为 true 就执行命令。当表达式变为 false 时,循环中断。

  1. #!/bin/awk -f
  2.  
  3. BEGIN {
  4. # Loop through 1 to 10
  5.  
  6. i=1;
  7. while (i <= 10) {
  8. print i, " to the second power is ", i*i;
  9. i = i+1;
  10. }
  11. exit;
  12. }

在这个简单实例中,awk 打印了放在变量 i 中的整数值的平方。while (i <= 10) 语句告诉 awk 仅在 i 的值小于或等于 10 时才执行循环。在循环最后一次执行时(i 的值是 10),循环终止。

do-while 循环

do-while 循环执行在关键字 do 之后的命令。在每次循环结束时检测一个测试表达式来决定是否终止循环。仅在测试表达式返回 true 时才会重复执行命令(即还没有到终止循环的条件)。如果测试表达式返回 false,因为到了终止循环的条件所以循环被终止。

  1. #!/usr/bin/awk -f
  2. BEGIN {
  3.  
  4. i=2;
  5. do {
  6. print i, " to the second power is ", i*i;
  7. i = i + 1
  8. }
  9. while (i < 10)
  10.  
  11. exit;
  12. }

for 循环

awk 中有两种 for 循环。

一种 for 循环初始化一个变量,检测一个测试表达式,执行变量递增,当表达式的结果为 true 时循环就会一直执行。

  1. #!/bin/awk -f
  2.  
  3. BEGIN {
  4. for (i=1; i <= 10; i++) {
  5. print i, " to the second power is ", i*i;
  6. }
  7. exit;
  8. }

另一种 for 循环设置一个有连续索引的数组变量,对每一个索引执行一个命令集。换句话说,它用一个数组“收集”每一条命令执行后的结果。

本例实现了一个简易版的 Unix 命令 uniq。通过把一系列字符串作为键加到数组 a 中,当相同的键再次出现时就增加键值,可以得到某个字符串出现的次数(就像 uniq--count 选项)。如果你打印该数组的所有键,将会得到出现过的所有字符串。

用演示文件 colours.txt(前一篇文章中的文件)来举例:

  1. name       color  amount
  2. apple      red    4
  3. banana     yellow 6
  4. raspberry  red    99
  5. strawberry red    3
  6. grape      purple 10
  7. apple      green  8
  8. plum       purple 2
  9. kiwi       brown  4
  10. potato     brown  9
  11. pineapple  yellow 5

这是 awk 版的简易 uniq -c

  1. #! /usr/bin/awk -f
  2.  
  3. NR != 1 {
  4.     a[$2]++
  5. }
  6. END {
  7.     for (key in a) {
  8.                 print a[key] " " key
  9.     }
  10. }

示例数据文件的第三列是第一列列出的条目的计数。你可以用一个数组和 for 循环来按颜色统计第三列的条目。

  1. #! /usr/bin/awk -f
  2.  
  3. BEGIN {
  4.     FS=" ";
  5.     OFS="\t";
  6.     print("color\tsum");
  7. }
  8. NR != 1 {
  9.     a[$2]+=$3;
  10. }
  11. END {
  12.     for (b in a) {
  13.         print b, a[b]
  14.     }
  15. }

你可以看到,在处理文件之前也需要在 BEFORE 函数(仅仅执行一次)中打印一列表头。

循环

在任何编程语言中循环都是很重要的一部分,awk 也不例外。使用循环你可以控制 awk 脚本怎样去运行,它可以统计什么信息,还有它怎么去处理你的数据。我们下一篇文章会讨论 switchcontinuenext 语句。 

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2016-08-29 20:51:16

awkLinux开源

2016-08-10 16:07:08

awkLinux开源

2016-08-11 09:18:33

awkShellLinux

2016-10-08 20:58:50

awkLinux编写脚本

2019-12-12 18:00:54

awkLinux开源

2016-07-29 15:13:00

awk文本处理工具编程

2017-11-23 09:00:02

Linuxcron计划任务

2022-03-20 10:40:11

Linuxawk 脚本

2016-08-10 11:19:11

awkLinux开源

2023-06-12 15:33:52

Scalafor循环语句

2010-09-08 17:15:45

SQL循环结构

2010-05-11 10:29:06

Unix awk

2023-06-15 17:00:11

Rust循环

2009-11-25 10:52:22

PHP函数contin

2010-03-04 15:28:01

Ubuntu Shel

2017-08-04 14:00:32

Linuxawk变量

2024-09-11 17:00:36

2019-11-26 14:00:58

awkLinux命令

2021-03-25 09:58:22

鸿蒙HarmonyOS应用开发

2023-12-19 16:43:01

点赞
收藏

51CTO技术栈公众号