大家好,我是轩辕。
前几天,读者群里有人聊起了一个问题:计算机为什么死机,死机的时候CPU在干什么?
我想起之前写过这方面的文章,想着估计有不少新粉没有看过,就挖个坟给大家看看,这个有趣又能涨知识的问题。
电脑死机,应该每个接触计算机的小伙伴都经历过吧。
尤其是早些年,电脑配置还没现在这么高的时候,多开几个重量级应用程序,死机就能如约而至,就算你把键盘上的CTRL+ALT+DELETE按烂了,任务管理器也出不来,最后只能默默含泪长按关机按钮,强制关机。
那么,你有没有想过,电脑在死机的时候,它到底在干嘛呢?
众所周知,计算机的核心中枢是中央处理器CPU。上过计算机基础课程的同学都被教导过:CPU是一根筋死脑筋,只知道不断的取出指令来一条条执行,直到关机方休。
所以理论上,死机分为两种,一种是CPU罢工不干了,不再执行下一条指令了,这属于硬件死机,不过这种情况基本不会发生。
更多的是软件层面的死机,也就是CPU被困在了某个地方出不来了,导致本该执行的程序得不到执行,看起来就是死机了一般。
聪明的你可能马上想到,如果写一个死循环,把CPU陷在里面出不去,是不是就能死机了?比如这样:
void dead_loop() {
while (1) {
...
}
}
你可以试一下,会发现为CPU降温的风扇可能会转起来,但计算机依旧能正常工作,并没有死机。
死循环,CPU不是应该一直在这里转圈吗?难道不会死机?
这就不得不提到一个概念:中断。
中断
中断这个概念,绝对是计算机史上最伟大的发明之一。
中断,顾名思义,用于打断CPU正常的工作,让它去执行别处的指令程序。
操作系统之所以能够掌控全局,就得益于它启动时给CPU安插的一系列的中断处理函数(比如我们最常见的时钟中断),好让操作系统能周期性的收回CPU的执行权,调度别的线程来执行。
所以,即便你某个线程进入了死循环,在你的时间片用完之后,也得乖乖交出CPU,让别的程序来执行。
想用一个死循环就把电脑搞死机,那自然是不可能的。
其实想来也是,如果这么容易就给你搞死机了,那这操作系统也太菜了吧,新手如果刚学编程,还不得一天强制重起电脑十几回?
退一万步讲,就算不考虑中断的影响,现在的CPU大都是多核,一个线程进入死循环,但还有别的核可以参与系统调度,也依然不会死机。
那么回到开始的问题,那到底CPU被困在了哪里出不来,连中断都拿它没办法呢?
其实有两种情况:
1、中断确实拿它没办法
很多人都知道中断的概念,但很多人不知道,中断也是有优先级的。
这很容易理解,比如CPU正在执行程序,突然发生了一个中断事件。CPU保存好当前执行的上下文,转头去处理这个中断事件,但刚处理到一半儿,这时又有一个新的中断事件来了,那CPU怎么办?要不要响应?
所以中断也有优先级之分,低优先级的中断无法打断高优先级的中断。
有了这个前提来试想一下,如果由于操作系统内核代码写的不当,在处理某个中断的时候陷入了死循环,比如自旋锁,会发生什么?
因为在处理中断的时候,CPU运行在一个很高的优先级上,一般的中断是无法把执行权抢过去的,这就导致这颗CPU核心成为了“植物人”,怎么叫它都没反应了。
2、中断能抢到CPU,但发现没有线程可以调度
程序员们对死锁这个概念应该不陌生,两个线程A等待B,B等待A,两个线程互相等待对方让步(释放锁),形成僵持局面,最后成为死锁。
如果死锁发生在应用层面,那问题不大,最多就是两个程序死了。但如果发生在内核呢?
比如在Windows操作系统内核中,就有大量的全局性的锁,一个不小心造成死锁,其他想要的线程都得进入等待队列,那就凉凉了。
引用一段另一位大神Tim Chen的描述(我觉得特别形象):