学习如何用 C 语言来进行文件输入输出操作

开发 后端
如果你打算学习 C 语言的输入、输出,可以从 stdio.h 包含文件开始。正如你从其名字中猜到的,该文件定义了所有的标准(“std”)的输入和输出(“io”)函数。

[[390686]]

理解 I/O 有助于提升你的效率。

如果你打算学习 C 语言的输入、输出,可以从 stdio.h 包含文件开始。正如你从其名字中猜到的,该文件定义了所有的标准(“std”)的输入和输出(“io”)函数。

大多数人学习的第一个 stdio.h 的函数是打印格式化输出的 printf 函数。或者是用来打印一个字符串的 puts 函数。这些函数非常有用,可以将信息打印给用户,但是如果你想做更多的事情,则需要了解其他函数。

你可以通过编写一个常见 Linux 命令的副本来了解其中一些功能和方法。cp 命令主要用于复制文件。如果你查看 cp 的帮助手册,可以看到 cp 命令支持非常多的参数和选项。但最简单的功能,就是复制文件:

  1. cp infile outfile

你只需使用一些读写文件的基本函数,就可以用 C 语言来自己实现 cp 命令。

一次读写一个字符

你可以使用 fgetc 和 fputc 函数轻松地进行输入输出。这些函数一次只读写一个字符。该用法被定义在 stdio.h,并且这也很浅显易懂:fgetc 是从文件中读取一个字符,fputc 是将一个字符保存到文件中。

  1. int fgetc(FILE *stream);
  2. int fputc(int c, FILE *stream);

编写 cp 命令需要访问文件。在 C 语言中,你使用 fopen 函数打开一个文件,该函数需要两个参数:文件名和打开文件的模式。模式通常是从文件读取(r)或向文件写入(w)。打开文件的方式也有其他选项,但是对于本教程而言,仅关注于读写操作。

因此,将一个文件复制到另一个文件就变成了打开源文件和目标文件,接着,不断从第一个文件读取字符,然后将该字符写入第二个文件。fgetc 函数返回从输入文件中读取的单个字符,或者当文件完成后返回文件结束标记(EOF)。一旦读取到 EOF,你就完成了复制操作,就可以关闭两个文件。该代码如下所示:

  1. do {
  2. ch = fgetc(infile);
  3. if (ch != EOF) {
  4. fputc(ch, outfile);
  5. }
  6. } while (ch != EOF);

你可以使用此循环编写自己的 cp 程序,以使用 fgetc 和 fputc 函数一次读写一个字符。cp.c 源代码如下所示:

  1. #include <stdio.h>
  2.  
  3. int
  4. main(int argc, char **argv)
  5. {
  6. FILE *infile;
  7. FILE *outfile;
  8. int ch;
  9.  
  10. /* parse the command line */
  11.  
  12. /* usage: cp infile outfile */
  13.  
  14. if (argc != 3) {
  15. fprintf(stderr, "Incorrect usage\n");
  16. fprintf(stderr, "Usage: cp infile outfile\n");
  17. return 1;
  18. }
  19.  
  20. /* open the input file */
  21.  
  22. infile = fopen(argv[1], "r");
  23. if (infile == NULL) {
  24. fprintf(stderr, "Cannot open file for reading: %s\n", argv[1]);
  25. return 2;
  26. }
  27.  
  28. /* open the output file */
  29.  
  30. outfile = fopen(argv[2], "w");
  31. if (outfile == NULL) {
  32. fprintf(stderr, "Cannot open file for writing: %s\n", argv[2]);
  33. fclose(infile);
  34. return 3;
  35. }
  36.  
  37. /* copy one file to the other */
  38.  
  39. /* use fgetc and fputc */
  40.  
  41. do {
  42. ch = fgetc(infile);
  43. if (ch != EOF) {
  44. fputc(ch, outfile);
  45. }
  46. } while (ch != EOF);
  47.  
  48. /* done */
  49.  
  50. fclose(infile);
  51. fclose(outfile);
  52.  
  53. return 0;
  54. }

你可以使用 gcc 来将 cp.c 文件编译成一个可执行文件:

  1. $ gcc -Wall -o cp cp.c

-o cp 选项告诉编译器将编译后的程序保存到 cp 文件中。-Wall 选项告诉编译器提示所有可能的警告,如果你没有看到任何警告,则表示一切正常。

读写数据块

通过每次读写一个字符来实现自己的 cp 命令可以完成这项工作,但这并不是很快。在复制“日常”文件(例如文档和文本文件)时,你可能不会注意到,但是在复制大型文件或通过网络复制文件时,你才会注意到差异。每次处理一个字符需要大量的开销。

实现此 cp 命令的一种更好的方法是,读取一块的输入数据到内存中(称为缓存),然后将该数据集合写入到第二个文件。这样做的速度要快得多,因为程序可以一次读取更多的数据,这就就减少了从文件中“读取”的次数。

你可以使用 fread 函数将文件读入一个变量中。这个函数有几个参数:将数据读入的数组或内存缓冲区的指针(ptr),要读取的最小对象的大小(size),要读取对象的个数(nmemb),以及要读取的文件(stream):

  1. size_t fread(void *ptr, size_t size, size_t nmemb, FILE *stream);

不同的选项为更高级的文件输入和输出(例如,读取和写入具有特定数据结构的文件)提供了很大的灵活性。但是,在从一个文件读取数据并将数据写入另一个文件的简单情况下,可以使用一个由字符数组组成的缓冲区。

你可以使用 fwrite 函数将缓冲区中的数据写入到另一个文件。这使用了与 fread 函数有相似的一组选项:要从中读取数据的数组或内存缓冲区的指针,要读取的最小对象的大小,要读取对象的个数以及要写入的文件。

  1. size_t fwrite(const void *ptr, size_t size, size_t nmemb, FILE *stream);

如果程序将文件读入缓冲区,然后将该缓冲区写入另一个文件,则数组(ptr)可以是固定大小的数组。例如,你可以使用长度为 200 个字符的字符数组作为缓冲区。

在该假设下,你需要更改 cp 程序中的循环,以将数据从文件读取到缓冲区中,然后将该缓冲区写入另一个文件中:

  1. while (!feof(infile)) {
  2. buffer_length = fread(buffer, sizeof(char), 200, infile);
  3. fwrite(buffer, sizeof(char), buffer_length, outfile);
  4. }

这是更新后的 cp 程序的完整源代码,该程序现在使用缓冲区读取和写入数据:

  1. #include <stdio.h>
  2.  
  3. int
  4. main(int argc, char **argv)
  5. {
  6. FILE *infile;
  7. FILE *outfile;
  8. char buffer[200];
  9. size_t buffer_length;
  10.  
  11. /* parse the command line */
  12.  
  13. /* usage: cp infile outfile */
  14.  
  15. if (argc != 3) {
  16. fprintf(stderr, "Incorrect usage\n");
  17. fprintf(stderr, "Usage: cp infile outfile\n");
  18. return 1;
  19. }
  20.  
  21. /* open the input file */
  22.  
  23. infile = fopen(argv[1], "r");
  24. if (infile == NULL) {
  25. fprintf(stderr, "Cannot open file for reading: %s\n", argv[1]);
  26. return 2;
  27. }
  28.  
  29. /* open the output file */
  30.  
  31. outfile = fopen(argv[2], "w");
  32. if (outfile == NULL) {
  33. fprintf(stderr, "Cannot open file for writing: %s\n", argv[2]);
  34. fclose(infile);
  35. return 3;
  36. }
  37.  
  38. /* copy one file to the other */
  39.  
  40. /* use fread and fwrite */
  41.  
  42. while (!feof(infile)) {
  43. buffer_length = fread(buffer, sizeof(char), 200, infile);
  44. fwrite(buffer, sizeof(char), buffer_length, outfile);
  45. }
  46.  
  47. /* done */
  48.  
  49. fclose(infile);
  50. fclose(outfile);
  51.  
  52. return 0;
  53. }

由于你想将此程序与其他程序进行比较,因此请将此源代码另存为 cp2.c。你可以使用 gcc 编译程序:

  1. $ gcc -Wall -o cp2 cp2.c

和之前一样,-o cp2 选项告诉编译器将编译后的程序保存到 cp2 程序文件中。-Wall 选项告诉编译器打开所有警告。如果你没有看到任何警告,则表示一切正常。

是的,这真的更快了

使用缓冲区读取和写入数据是实现此版本 cp 程序更好的方法。由于它可以一次将文件的多个数据读取到内存中,因此该程序不需要频繁读取数据。在小文件中,你可能没有注意到使用这两种方案的区别,但是如果你需要复制大文件,或者在较慢的介质(例如通过网络连接)上复制数据时,会发现明显的差距。

我使用 Linux time 命令进行了比较。此命令可以运行另一个程序,然后告诉你该程序花费了多长时间。对于我的测试,我希望了解所花费时间的差距,因此我复制了系统上的 628 MB CD-ROM 镜像文件。

我首先使用标准的 Linux 的 cp 命令复制了映像文件,以查看所需多长时间。一开始通过运行 Linux 的 cp 命令,同时我还避免使用 Linux 内置的文件缓存系统,使其不会给程序带来误导性能提升的可能性。使用 Linux cp 进行的测试,总计花费不到一秒钟的时间:

  1. $ time cp FD13LIVE.iso tmpfile
  2.  
  3. real 0m0.040s
  4. user 0m0.001s
  5. sys 0m0.003s

运行我自己实现的 cp 命令版本,复制同一文件要花费更长的时间。每次读写一个字符则花了将近五秒钟来复制文件:

  1. $ time ./cp FD13LIVE.iso tmpfile
  2.  
  3. real 0m4.823s
  4. user 0m4.100s
  5. sys 0m0.571s

从输入读取数据到缓冲区,然后将该缓冲区写入输出文件则要快得多。使用此方法复制文件花不到一秒钟:

  1. $ time ./cp2 FD13LIVE.iso tmpfile
  2.  
  3. real 0m0.944s
  4. user 0m0.224s
  5. sys 0m0.608s

我演示的 cp 程序使用了 200 个字符大小的缓冲区。我确信如果一次将更多文件数据读入内存,该程序将运行得更快。但是,通过这种比较,即使只有 200 个字符的缓冲区,你也已经看到了性能上的巨大差异。 

责任编辑:庞桂玉 来源: Linux中国
相关推荐

2024-11-20 10:00:00

Python文件读写

2021-04-12 15:34:33

C语言printfscanf

2009-12-17 11:36:55

Ruby输入输出

2010-02-06 14:28:38

C++标准输入输出

2010-02-03 15:35:00

C++输入输出汉字

2016-11-16 15:05:42

情感分析

2020-01-10 17:45:06

Git共享文件开源

2011-11-28 09:25:36

Java输入输出

2021-05-07 20:01:23

IO输入输出

2020-09-04 11:02:47

Java技巧参数

2014-09-04 11:39:43

Linux

2011-07-11 11:05:09

Windows控制台

2016-12-14 09:32:49

FileChanne文件复制

2011-09-01 18:54:29

WifiGoodReader

2009-12-23 10:57:20

nohup命令

2023-10-30 08:53:36

Python输入输出

2018-03-27 13:33:48

百度

2020-09-24 16:05:44

C语言sqlite3函数

2010-03-12 19:29:15

python svn脚

2021-04-04 08:00:39

C++编程语言软件开发
点赞
收藏

51CTO技术栈公众号