我们将所有的 C 语言要素放置到一份易读的备忘录上。
1972 年,丹尼斯·里奇任职于贝尔实验室,在几年前,他和他的团队成员发明了 Unix 。在创建了一个经久不衰的操作系统(至今仍在使用)之后,他需要一种好的方法来对这些 Unix 计算机编程,以便它们可用执行新的任务。在现在看来,这很奇怪,但在当时,编程语言相对较少,Fortran、Lisp、Algol 以及 B 语言都很流行,但是,对于贝尔实验室的研究员们想要做的事情来说,它们还是远远不够的。丹尼斯·里奇表现出一种后来被称为程序员的主要特征的特质:创造了他自己的解决方案。他称之为 C 语言,并且在近 50 年后,它仍在广泛的使用。
为什么你应该学习 C 语言
今天,有很多语言为程序员提供了比 C 语言更多的特性。最明显的是 C++ 语言,这是一种以相当露骨的方式命名的语言,它构建在 C 语言之上,创建了一种很好的面向对象语言。不过,许多其它语言的存在是有充分理由的。计算机擅长一致的重复,因此任何可预见的东西都可以构建在编程语言中,对程序员来说这意味着更少的工作量。为什么在 C++ 语言中用一行语句就可以将一个 int
转换为一个 long
时(long x = long(n);
),还要在 C 语言用两行语句呢?
然而,C 语言在今天仍然有用。
首先,C 语言是一种相当简约和直接的语言。除了编程的基础知识之外,并没有很高级的概念,这很大程度上是因为 C 语言实际上就是现代编程语言的基础之一。例如,C 语言的特性之一是数组,但是它不提供字典(除非你自己写一个)。当你学习 C 语言时,你会学习编程的基础组成部分,它可以帮助你认识到如今的编程语言的改进及其的精心设计。
因为 C 语言是一种最小化的编程语言,你的应用程序很可能会获得性能上的提升,这在其它许多编程语言中是看不到的。当你考虑你的代码可以执行多快的时候,很容易陷入锱铢必较的境地,因此,重要的是要问清楚你是否需要为某一特定任务提供更多的速度。与 Python 或 Java 相比,使用 C 语言,你在每行代码中需要纠结的地方更少。C 语言程序运行很快。这是 Linux 内核使用 C 语言编写的一个很好的理由。
最后,C 语言很容易入门,特别是,如果你正在运行 Linux,就已经能运行 C 语言代码了,因为 Linux 系统包含 GNU C 库(glibc
)。为了编写和构建 C 语言程序,你需要做的全部工作就是安装一个编译器,打开一个文本编辑器,开始编码。
开始学习 C 语言
如果你正在运行 Linux ,你可以使用你的软件包管理器安装一个 C 编译器。在 Fedora 或 RHEL 上:
$ sudo dnf install gcc
在 Debian 及其衍生系统上:
$ sudo apt install build-essential
在 macOS 上,你可以 安装 Homebrew ,并使用它来安装 GCC:
$ brew install gcc
在 Windows 上, 你可以使用 MinGW 安装一套最小的包含 GCC 的 GNU 实用程序集。
在 Linux 或 macOS 上验证你已经安装的 GCC:
$ gcc --version
gcc (GCC) x.y.z
Copyright (C) 20XX Free Software Foundation, Inc.
在 Windows 上,提供 EXE 文件的完整路径:
PS> C:\MinGW\bin\gcc.exe --version
gcc.exe (MinGW.org GCC Build-2) x.y.z
Copyright (C) 20XX Free Software Foundation, Inc.
C 语法
C 语言不是一种脚本语言。它是一种编译型语言,这意味着它由 C 编译器处理来产生一个二进制可执行文件。这不同于脚本语言(如 Bash)或混合型语言(如 Python)。
在 C 语言中,你可以创建函数来执行你希望做到的任务。默认情况下,执行的是一个名为 main
的函数。
这里是一个使用 C 语言写的简单的 “hello world” 程序:
#include <stdio.h>
int main() {
printf("Hello world");
return 0;
}
第一行包含一个被称为 stdio.h
(标准输入和输出)的 头文件,它基本上是自由使用的、非常初级的 C 语言代码,你可以在你自己的程序中重复使用它。然后创建了一个由一条基本的输出语句构成的名为 main
的函数。保存这些文本到一个被称为 hello.c
的文件中,然后使用 GCC 编译它:
$ gcc hello.c --output hello
尝试运行你的 C 语言程序:
$ ./hello
Hello world$
返回值
这是 Unix 哲学的一部分,一个函数在执行后“返回”一些东西:在成功时不返回任何东西,在失败时返回其它的一些东西(例如,一个错误信息)。这些返回的内容通常使用数字(确切地说是整数)表示:0
表示没有错误,任何大于 0
的数字都表示一些不成功的状态。
Unix 和 Linux 被设计成在运行成功时保持沉默是很明智的。这是为了让你在执行一系列命令时,假设没有任何错误或警告会妨碍你的工作,从而可以始终为成功执行做准备。类似地,在 C 语言中的函数在设计上也预期不出现错误。
你可以通过一个小的修改,让你的程序看起来是失败的,就可以看到这一点:
include <stdio.h>
int main() {
printf("Hello world");
return 1;
}
编译它:
$ gcc hello.c --output failer
现在使用一个内置的 Linux 测试方式来运行它。仅在成功时,&&
操作符才会执行一个命令的第二部分。例如:
$ echo "success" && echo "it worked"
success
it worked
在失败时,||
测试会执行一个命令的第二部分。
$ ls blah || echo "it did not work"
ls: cannot access 'blah': No such file or directory
it did not work
现在,尝试你的程序,在成功时,它不返回 0
;而是返回 1
:
$ ./failer && echo "it worked"
String is: hello
这个程序成功地执行了,但是没有触发第二个命令。
变量和类型
在一些语言中,你可以创建变量而不具体指定变量所包含的数据的类型。这些语言如此设计使得解释器需要对一个变量运行一些测试来视图发现变量是什么样的数据类型。例如,var=1
定义了一个整型数,当你创建一个表达式将 var
与某些东西相加时,Python 知道显然它是一个整型数。它同样知道当你连接 hello
和 world
时,单词 world
是一个字符串。
C 语言不会为你做任何这些识别和调查;你必须自己定义你的变量类型。这里有几种变量类型,包括整型(int
),字符型(char
),浮点型(float
),布尔型(boolean
)。
你可能也注意到这里没有字符串类型。与 Python 和 Java 和 Lua 以及其它的编程语言不同,C 语言没有字符串类型,而是将字符串看作一个字符数组。
这里是一些简单的代码,它建立了一个 char
数组变量,然后使用 printf 将数组变量和一段简单的信息打印到你的屏幕上:
#include <stdio.h>
int main() {
char var[6] = "hello";
printf("Your string is: %s\r\n",var);
}
你可能会注意到,这个代码示例向一个由五个字母组成的单词提供了六个字符的空间。这是因为在字符串的结尾有处一个隐藏的终止符,它占用了数组中的一个字节。你可以通过编译和执行代码来运行它:
$ gcc hello.c --output hello
$ ./hello
hello
函数
和其它的编程语言一样,C 函数也接受可选的参数。你可以通过定义你希望函数接受的数据类型,来将参数从一个函数传递到另一个函数:
#include <stdio.h>
int printmsg(char a[]) {
printf("String is: %s\r\n",a);
}
int main() {
char a[6] = "hello";
printmsg(a);
return 0;
}
简单地将一个函数分解为两个函数的这种方法并不是非常有用,但是它演示了默认运行 main
函数以及如何在函数之间传递数据。
条件语句
在真实的编程中,你通常希望你的代码根据数据做出判断。这是使用条件语句完成的,if
语句是其中最基础的一个语句。
为了使这个示例程序更具动态性,你可以包含 string.h
头文件,顾名思义,它包含用于检查字符串的代码。尝试使用来自 string.h
文件中的 strlen
函数测试传递给 printmsg
函数的字符串是否大于 0
:
#include <stdio.h>
#include <string.h>
int printmsg(char a[]) {
size_t len = strlen(a);
if ( len > 0) {
printf("String is: %s\r\n",a);
}
}
int main() {
char a[6] = "hello";
printmsg(a);
return 1;
}
正如在这个示例中所实现的,该条件永远都不会是非真的,因为所提供的字符串总是 hello
,它的长度总是大于 0
。这个不够认真的重新实现的 echo
命令的最后一点要做是接受来自用户的输入。
命令参数
stdio.h
文件包含的代码在每次程序启动时提供了两个参数: 一个是命令中包含多少项的计数(argc
),一个是包含每个项的数组(argv
)。例如, 假设你发出这个虚构的命令:
$ foo -i bar
argc
是 3
,argv
的内容是:
argv[0] = foo
argv[1] = -i
argv[2] = bar
你可以修改示例 C 语言程序来以字符串方式接受 argv[2]
,而不是默认的 hello
吗?
命令式编程语言
C 语言是一种命令式编程语言。它不是面向对象的,也没有类结构。使用 C 语言的经验可以教你很多关于如何处理数据,以及如何更好地管理你的代码运行时生成的数据。多使用 C 语言,你最后能够编写出其它语言(例如 Python 和 Lua)可以使用的库。
想要了解更多关于 C 的知识,你需要使用它。在 /usr/include/
中查找有用的 C 语言头文件,并且看看你可以做什么小任务来使 C 语言对你有用。在学习的过程中,使用来自 FreeDOS 的 Jim Hall 编写的 C 语言忘备录。它在一张双面纸忘备录上放置了所有的基本要素,所以在你练习时,可以立即访问 C 语言语法的所有要素。