最近操作系统不可谓不火,无论是华为的鸿蒙,还是腾讯的嵌入式操作系统,都激起不少水花。今天,我们来分享一个操作系统的底层技术,页缓存。
背景
我们都知道,在冯诺依曼计算机架构体系中,存储器有着举足轻重的作用,相对于计算单元,存储器的读写速度明显慢很多。无论是机械硬盘,固态硬盘还是最新的Flash闪存,其读写速度都比内存慢很多。一旦一个应用需要读写磁盘,那么瓶颈经常就会在磁盘读写。
页缓存
为了解决这个问题,操作系统一般会使用页缓存来解决,我们也称之为磁盘缓存。当进程访问磁盘的时候,操作系统首先会进行检查磁盘缓存,如果发现缓存上面有数据,那么直接返回缓存上的内容,大大减少了磁盘被访问的次数,提高了操作系统的性能。
那么,磁盘的内容是如何被缓存起来的呢?当进程访问磁盘的时候,如果页缓存上没有对应的信息,那么会在磁盘中把当页读取出来,并往后预读若干页放入缓存,如果后面这个缓存被命中,就会预读更多缓存页,这也是我们对一个文件连续访问,会感觉到比较快的原因。
写数据的时候,如果数据已经在缓存页,那么会优先把数据更新在缓存页。这里心细的同学可能会问,那岂不是磁盘中的是脏数据?的确如此,操作系统会会有一定策略把页缓存的数据再统一写进磁盘,在Linux操作系统中,默认是脏页达到一定比例就会写入。有些操作系统,则会可以选择脏页达到一定数量,或者间隔一定时间。所以,当我们机器发生掉电的时候,是有一定的风险会丢失数据的。即便如此,我们也不会关闭页缓存来使数据每次都能落盘成功。所以,假如我们的服务要做到高可用,强一致,使用分布式将数据写到多个机器上进行备份才是硬道理。
总结
操作系统是计算机软件中最核心的软件之一,这里面有非常多地干货值得我们学习,既有算法数据结构的,也有一些关乎底层物理硬件的设计思想,如果有兴趣,欢迎关注我,我们一起学习共同进步。