在 C 语言中使用 getopt 解析命令行短选项

开发
通过使用命令行让用户告诉程序要什么,可以让程序更加灵活。

在已经知道要处理什么文件和对文件进行哪些操作的情况下,编写处理文件的 C 语言程序就很容易了。如果将文件名“硬编码”在程序中,或者你的程序只以一种方式来处理文件,那么你的程序总是知道要做什么。

但是如果程序每次运行时能够对用户的输入做出反应,可以使程序更灵活。让用户告诉程序要处理什么文件,或者以不同的方式完成任务,要实现这样的功能就需要读取命令行参数。

读取命令行

一个 C 语言程序可以用如下声明开头:

int main()

这是启动 C 程序最简单的形式。但如果在圆括号中加入标准参数,你的程序就可以从命令行中读取选项了:

int main(int argc, char **argv)

​argc​​ 表示命令行中的参数个数。它总是一个至少为 1 的数。

​argv​​ 是一个二级指针,它指向一个字符串数组。这个数组中保存的是从命令行接收的各个参数。数组的第一个元素 ​​*argv[0]​​ 是程序的名称。​​**argv​​ 数组的其它元素包含剩下的命令行参数。

下面我将写一个简单的示例程序,它能够回显通过命令行参数传递给它的选项。它跟 Linux 的 ​​echo​​ 命令类似,只不过我们的程序会打印出程序名。同时它还会调用 ​​puts​​ 函数将命令行选项按行打印输出。

#include <stdio.h>

int
main(int argc, char **argv)
{
int i;

printf("argc=%d\n", argc); /* debugging */

for (i = 0; i < argc; i++) {
puts(argv[i]);
}

return 0;
}

编译此程序,并在运行时提供一些命令行参数,你会看到传入的命令行参数被逐行打印出来:

$ ./echo this program can read the command line
argc=8
./echo
this
program
can
read
the
command
line

这个命令行将程序的 ​​argc​​ 置为 8,​​**argv​​ 数组包含 8 个元素:程序名以及用户输入的 7 个单词。由于 C 语言中数组下标从 0 开始,所以这些元素的标号分别是 0 到 7。这也是在 ​​for​​ 循环中处理命令行参数时能够用 ​​i < argc​​ 作为比较条件的原因。

你也可以用这个方式实现自己的 ​​cat​​ 或 ​​cp​​ 命令。​​cat​​ 命令的基本功能是显示一个或几个文件的内容。下面是一个简化版的​​cat​​ 命令,它从命令行获取文件名:

#include <stdio.h>

void
copyfile(FILE *in, FILE *out)
{
int ch;

while ((ch = fgetc(in)) != EOF) {
fputc(ch, out);
}
}

int
main(int argc, char **argv)
{
int i;
FILE *fileptr;

for (i = 1; i < argc; i++) {
fileptr = fopen(argv[i], "r");

if (fileptr != NULL) {
copyfile(fileptr, stdout);
fclose(fileptr);
}
}

return 0;
}

这个简化版的 ​​cat​​ 命令从命令行读取文件名列表,然后将各个文件的内容逐字符地显示到标准输出上。假定我有一个叫做 ​​hello.txt​​ 的文件,其中包含数行文本内容。我能用自己实现的 ​​cat​​ 命令将它的内容显示出来:

$ ./cat hello.txt
Hi there!
This is a sample text file.

以这个简单程序为出发点,你也可以实现自己版本的其它 Linux 命令。比如 ​​cp​​ 命令,它从命令行读取两个文件名:要读取的文件和要写入的文件。

读取命令行选项

通过命令行读取文件名和其它文本固然很棒,但是如果想要程序根据用户给出的选项改变行为呢?比如 Linux 的 ​​cat​​ 命令就支持以下命令行选项:

  • ​-b​​ 显示非空行的行号
  • ​-E​​ 在行尾显示 ​​$​
  • ​-n​​ 显示行号
  • ​-s​​ 合并显示空行
  • ​-T​​ 将制表符显示为 ​​^I​
  • ​-v​​ 用 ​​^x​​ 和 ​​M-x​​ 方式显示非打印字符,换行符和制表符除外

这些以一个连字符开头的单字母的选项叫做短选项。通常短选项是分开使用的,就像这样 ​​cat -E -n​​。但是也可以将多个短选项合并,比如 ​​cat -En​​。

值得庆幸的是,所有 Linux 和 Unix 系统都包含 ​​getopt​​ 库。它提供了一种简单的方式来读取命令行参数。​​getopt​​ 定义在头文件 ​​unistd.h​​ 中。你可以在程序中使用 ​​getopt​​ 来读取命令行短选项。

与其它 Unix 系统不同的是,Linux 上的 ​​getopt​​ 总是保证短选项出现在命令行参数的最前面。比如,用户输入的是 ​​cat -E file -n​​。​​-E​​ 在最前面,​​-n​​ 在文件名之后。如果使用 Linux 的 ​​getopt​​ 来处理,程序会认为用户输入的是 ​​cat -E -n file​​。这样做可以使处理过程更顺畅,因为 ​​getopt​​ 可以解析完所有短选项,剩下的文件名列表可以通过 ​​**argv​​ 来统一处理。

你可以这样使用 ​​getopt​​:

#include <unistd.h>

int getopt(int argc, char **argv, char *optstring);

​optstring​​ 是由所有合法的选项字符组成的字符串。比如你的程序允许的选项是 ​​-E​​ 和 ​​-n​​, 那么 ​​optstring​​ 的值就是 ​​"En"​​。

通常通过在循环中调用 ​​getopt​​ 来解析命令行选项。每次调用时 ​​getopt​​ 会返回找到的下一个短选项,如果遇到无法识别的选项则返回 ​​'?'​​。当没有更多短选项时它返回 ​​-1​​,并且设置全局变量 ​​optind​​ 的值指向 ​​**argv​​ 中所有段选项之后的第一个元素。

下面看一个简单的例子。这个演示程序没有实现 ​​cat​​ 命令的所有选项,但它只是能够解析命令行。每当发现一个合法的命令行选项,它就打印出相应的提示消息。在你自己的程序中,你可能会根据这些命令行选项执行变量赋值等者其它操作。

#include <stdio.h>
#include <unistd.h>

int
main(int argc, char **argv)
{
int i;
int option;

/* parse short options */

while ((option = getopt(argc, argv, "bEnsTv")) != -1) {
switch (option) {
case 'b':
puts("Put line numbers next to non-blank lines");
break;
case 'E':
puts("Show the ends of lines as $");
break;
case 'n':
puts("Put line numbers next to all lines");
break;
case 's':
puts("Suppress printing repeated blank lines");
break;
case 'T':
puts("Show tabs as ^I");
break;
case 'v':
puts("Verbose");
break;
default: /* '?' */
puts("What's that??");
}
}

/* print the rest of the command line */

puts("------------------------------");

for (i = optind; i < argc; i++) {
puts(argv[i]);
}

return 0;
}

假如你把程序编译为 ​​args​​,你可以通过尝试不同的命令行参数组合,来了解程序是怎么解析短选项,以及是怎么将其它的命令行参数留下来的。最简单的例子是将所有的选项都放在最前面,就像这样:

$ ./args -b -T file1 file2
Put line numbers next to non-blank lines
Show tabs as ^I
------------------------------
file1
file2

现在试试将两个短选项合并使用的效果:

$ ./args -bT file1 file2
Put line numbers next to non-blank lines
Show tabs as ^I
------------------------------
file1
file2

如果有必要的话,​​getopt​​可以对命令行参数进行重排:

$ ./args -E file1 file2 -T
Show the ends of lines as $
Show tabs as ^I
------------------------------
file1
file2

如果用户输入了错误的短选项,​​getopt​​ 会打印一条消息:

$ ./args -s -an file1 file2
Suppress printing repeated blank lines
./args: invalid option -- 'a'
What's that??
Put line numbers next to all lines
------------------------------
file1
file2

下载速查表

​getopt​​ 还有更多的功能。例如,通过设计 ​​-s string​​ 或 ​​-f file​​ 这样的命令行语法规则,可以让短选项拥有自己的二级选项。你也可以告诉 ​​getopt​​ 在遇到无法识别的选项时不显示错误信息。使用 ​​man 3 getopt​​ 命令查看 ​​getopt(3)​​ 手册可以了解 ​​getopt​​ 的更多功能。

如果你需要 ​​getopt()​​ 和 ​​getopt_long()​​的使用语法和结构上的提示,可以 ​​下载我制作的速查表​​。它提供了最小可行代码,并列出了你需要了解的一些全局变量的含义。速查表的一面是 ​​getopt()​​ 的用法,另一面是 ​​getopt_long()​​的用法。

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2021-07-29 10:00:43

XMLXMLStarletLinux

2021-11-15 14:30:49

Pythonargparse编程语言

2018-11-05 13:50:44

Linux命令tcpdump

2022-10-18 10:00:09

Linuxtcpdump命令

2021-08-19 14:27:56

Java应用程序解析方法

2011-05-25 13:22:05

PHPJSON

2022-11-03 20:38:01

CMD命令Go

2021-08-30 07:50:42

脚本语言命令行

2018-10-22 10:00:05

Linux命令ls

2020-09-11 07:50:37

nmcli命令行网络连接

2010-06-01 19:24:40

SVN命令行

2020-08-21 07:35:12

Linux命令行计算器

2018-01-24 18:30:53

浏览器Firefox命令行

2010-03-10 17:23:37

Python 命令行参

2010-07-15 10:47:22

Perl命令行

2010-08-20 10:05:23

用户命令

2009-07-20 09:55:30

华为命令行解析华为认证

2023-10-04 00:01:00

sizeofC 语言

2009-07-15 17:10:26

Jython解析命令行

2019-05-21 10:38:17

Linux命令行
点赞
收藏

51CTO技术栈公众号