Unix内核开发不是洪水猛兽。一旦你了解到其中的规则,你就会发现,跟开发应用程序一样;两者区别在于要遵守的规则集合不一样。Linux是Unix家族的一员,而且其Unix内核源代码唾手可得,因此这里用其来作说明。
规则上,与应用程序(运行于用户空间)的开发不同,主要表现在:
没有C库
用GNU C编程(对于Linux内核而言)
没有内存保护
在Unix内核中很难使用浮点数
内核栈大小固定且很小
由于异步中断、抢占以及支持SMP,需要额外小心同步和并发
移植性问题
Unix内核没有链接任何C库。这里面涉及到很多问题,比如鸡生蛋还是蛋生鸡的问题:因为C库都会包裹一些系统调用,可是没有Unix内核时就没有系统调用,那么……呵呵,明白了吧?另一个问题就是大小问题。
任何一个C库,甚至其一个子集,对于内核来说都太大了。不过,不要着急,很多常用的库函数在内核中都有实现。
这里面涉及到一个著名的函数:printf(),Unix内核提供了一个替代品:printk()。如果你要做内核开发,就会频繁使用该函数。记住:Linus本人不允许在Unix内核中嵌入调试器(这是另外的话题,有兴趣的可以自己去google一下),因此很多情况下要依靠printk()。
毫无疑问,Linux的内核是用C语言写的。但所用的C并不是ANSI C,而是经过GNU扩展之后的C,这就是为什么Linux内核对于gcc编译器的依赖程度如此之高。GNU对C的扩展中就包括:内联函数(inline functions),分支预测和内联汇编(inline assembly)。分支预测用于判断哪些情况是几乎永远不可能发生的,或者哪些情况几乎永远都会发生——unlikely()和likely()。
当用户空间的代码访问非法地址时,Unix内核能够捕获该错误,然后向进程发送SIGSEGV并终止进程。在Unix世界,人们总是说kill/杀掉进程,其实,kill仅仅是用来向进程发送信号的,并不是杀掉它——太残忍了。
这是题外话了,呵呵。那么,当内核代码访问非法地址时,谁来照顾Unix内核呢?只能自己照顾自己了。非法的地址访问将导致oops,这是重大的问题,没人会告诉你访问了非法地址,但是你可以通过日志来查询/调试。
另外,内核内存是不分页,因此你没申请一个字节,物理内存就少掉一个字节。小心了!这里,我们对Unix内核的讲解先告一段落,我们以后会有更多的讲解。
【编辑推荐】