无法在循环中声明变量,固执的Linux之父终于决定升级C语言版本

系统 Linux 新闻
Linux开源社区宣布,未来会把内核C语言版本升级到C11。

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

还在使用89年版C语言的Linux内核,现在终于要做出改变了。

今天,Linux开源社区宣布,未来会把内核C语言版本升级到C11,预计5.18版之后生效,也就是今年5月。

这个决定很突然,从发起问题到官方声明,不过才一个星期,要知道说服固执的Linux之父 Linus Torvalds可不是件容易的事。

事情的原因,说起来还有那么一点偶然的因素。

一个bug的连锁反应

问题的起源是来自上周的一次Linux社区讨论。

一位名叫Jakob Koschel的博士生,在研究阻止与内核链表primitive相关的预测执行漏洞时,发现了这样一个问题。

Linux内核广泛使用由struct list_head定义的双向链表:

struct list_head {
struct list_head *next, *prev;
};

这种结构通常嵌入到其他结构中。通过这种方式,可以使用任何相关的结构类型制作链表。

除此之外,内核还提供大量可用于遍历和操作链表的函数和宏。list_for_each_entry()就是其中之一,这是伪装成一种控制结构的宏。

问题就出在这个宏上。

假设内核包含如下结构:

struct foo {
int fooness;
struct list_head list;
};

list中的元素可用于创建foo结构的双向链表。

假设有一个叫做 foo_list的结构声明作为此类链表的头,使用以下代码可以遍历此链表:

struct foo *iterator;


list_for_each_entry(iterator, &foo_list, list) {
do_something_with(iterator);
}
/* Should not use iterator here */

list参数告诉宏在foo结构中list_head结构的名称。这个循环将为列表中的每个元素执行一次, 迭代器指向该元素。

由此导致了USB子系统中的一个bug:传递给该宏的迭代器在退出宏后还能被使用。

这是一件危险的事情,所以Koschel提交了一个修复补丁,在循环后停止使用迭代器搞定了bug。

说服Linus

但是Linus Torvalds本人并不太喜欢这个补丁,也没有看到它与预测执行漏洞的关系。在Koschel详细解释后,Linus承认这只是一个普通的bug。

然而事情并没有那么简单,Linus不久后意识到了真正的根源:

传递给链表遍历宏的迭代器,必须在循环本身之外的范围内声明。

这种非预测性bug发生的原因是,C89中没有“在循环中声明变量”。

像list_for_each_entry()这样的宏,从根本上总是将最后一个HEAD入口泄漏到循环之外,仅仅是因为我们不能在循环本身中声明迭代器变量。

如果可以编写一个可以声明自己的迭代器列表遍历宏,那么迭代器在循环之外将不可见,并且不会出现此类问题。

但是,由于内核停留在C89标准上,因此无法在循环中声明变量。

Linus决定,那咱们还是升级吧,也许是时候转向C99标准了。

虽然它也有20多年的历史,但至少比C89新,可以在循环中声明变量。

既然C89如此陈旧,这么多年还没做出改变呢?Linus说,那是因为我们在一些古老的gcc编译器版本中遇到了一些奇怪的问题,不能随便升级。

但是,现在Linux内核已将gcc的最低要求提升至5.1版,因此过去那些奇怪的bug应该不会有了。

而另一位核心开发者Arnd Bergmann认为,咱们完全可以升级到C11甚至更高版本。但如果升级到C17或C2x,会破坏对gcc-5/6/7的支持,因此升级到C11更容易实现。

最终,Torvalds赞成这个想法:“好的,请提醒我,让我们在5.18合并窗口的早期尝试一下。”

接下来迁移到C11可能会导致一些意想不到的bug,但如果一切顺利,下一个Linus内核版本将正式转向C11。

责任编辑:张燕妮 来源: 量子位
相关推荐

2022-02-25 15:49:08

Linux开源社区C语言C11

2022-02-25 14:51:39

LinuxC语言Linux 内核

2021-01-13 10:52:29

C语言Linux计算机领域

2023-02-08 07:05:44

2022-04-22 18:48:46

LinuxLinux 内核C 语言

2013-06-03 09:34:14

崩溃程序程序算法

2016-03-30 09:56:07

c语言变量声明objectivec

2021-12-28 15:10:01

线程池C语言编程语言

2022-07-31 23:05:55

Go语言短变量

2021-04-08 11:10:07

C语言版本Cmake

2024-01-05 08:31:08

C语言

2013-04-09 12:18:45

socket.ioC服务器

2018-09-20 17:30:01

2011-05-31 13:41:00

C语言

2021-04-20 11:48:59

LinuxLinux内核C++

2010-07-28 15:18:10

编程语言函数式编程

2010-01-11 15:29:13

引用C++语言

2020-10-29 07:07:38

循环体外Java

2011-10-20 13:09:19

JavaC

2010-09-09 16:26:51

SQL循环For
点赞
收藏

51CTO技术栈公众号