在之前的《Linux内存管理》文章中,我们大致讲解了Linux内存管理的体系架构和映射过程。当然内存管理是一个复杂的模块。它涉及到硬件的交互和复杂的软件算法。本片文章我们就来讲解下硬件原理和分页管理。
CPU如果访问内存?
答案很简单,通过内存管理单元(MMU),我们先看一张很简单的CPU访问内存的流程图:
TLB:转换lookaside 缓存,有了它可以让虚拟地址到物理地址转换速度大增。
从上图中我们可以清楚的知道了,CPU,DDR,MMU它们三者之间的关系。CPU在MMU开启的情况下,访问的都是虚拟地址。首先通过MMU将虚拟地址转换为物理地址,然后再通过总线上去访问内存(我们都知道内存是挂在总线上的)。
那MMU是怎么将虚拟地址转换为物理地址呢?当然之前的文章也讲过了,是通过页表的方式。MMU从页表中查出虚拟地址对应的物理地址是什么,然后就去访问物理内存了。
所以搞懂了上面的问题,也就解决了标题的问题:《CPU如何访问内存的?》
页表是什么?页表就是一种特殊的数据结构,它保存的是逻辑页和物理页帧的映射关系,而且每一个进程都各自拥有自己的页表。
虚拟地址在我们看来是一个整体,其实不然,它是可以拆分的。可以分为:
- p(页号),它可以存储页表的索引;
- d(偏移),可以在页内进行地址偏移
我们假设页大小为4KB,而且页表只有一级,也就是一级页表。那虚拟地址的拆分后的样子是这样的:
下面我们来看下CPU,虚拟地址,页表和物理地址之间的关系。看下图:
很简单的吧,应该看懂了吧。我们可以发现如果采用一级页表的话,每个进程需要维护一个4MB大小的页表(我们可以算下,如果是32位平台,地址空间大小为4GB,页面大小为4KB,每个页表项占用4字节,所以4GB/4KB*4=4MB)。
因为每个进程都有自己的页表,所以在多进程的情况下,内存消耗简直惊人。所以一级页表是不合理的。那有没有优化的办法呢?答案是有的,就是利用多级页表,可以节省内存。
二级页表就是将页表再次分页。再次举例,将逻辑地址分为10位页码p1+10位页码p2+12位页偏移。我们直接看图吧。
访问过程如下图: