计算机程序的Bug千奇百怪,要想能顺利的解决疑难杂症,必须对计算机的底层原理非常熟悉。比如在实际生产中不光我们的应用会出问题,操作系统也可能有Bug,硬件也可能有Bug。因此,只有更加深入的理解了原理,才能更加方便我们解决问题。
本文对计算机的体系结构底层原理进行简要的介绍。这些知识对于帮助我们解决疑难问题会有很大的帮助。做程序开发应该深入原理,不仅要知其然,还要知其所以然。
计算机的工作模式
- 对于一个计算机来说,最核心的是CPU,CPU是计算机的大脑,所有设备都围绕其展开
- CPU通过总线(Bus)与其他设备连接,在这些设备中,最为重要的是内存(Memory)
- 单靠CPU是无法完成计算任务的,很多复杂的计算任务都需要将中间结果保存下来,然后基于中间结果进行下一步的计算
- CPU和内存是完成计算的核心组件
CPU本身无法保存这么多的中间结果,因此需要依赖于内存
CPU
- CPU包含三部分:运算单元、数据单元和控制单元
- 运算单元只管计算,但它不知道应该算哪些数据,运算结果应该放在哪里
- 运算单元计算的数据如果每次都要经过总线,直接到内存里面现拿,速度会很慢,因此出现了数据单元
- 数据单元包括CPU内部的缓存和寄存器组,空间很小,但速度很快
- 控制单元是一个统一的指挥中心,可以获得下一条指令,然后执行这条指令
这个指令会指导运算单元取出数据单元中的某几个数据,计算出结果,然后放在数据单元的某个地方
计算过程
1. 每个进程都有一个程序放在硬盘上,是二进制的,在里面存储的是一行一行的指令,这些指令会操作一些数据
2. 进程开始运行,会有独立的内存空间,相互隔离但不连续 - 程序会分别加载到进程A和进程B的内存空间里面,形成各自的代码段
3. 程序在运行过程中要操作的数据和产生的计算结果,都会放在数据段(内存)里
4. 在CPU的控制单元里面,有一个指令指针寄存器,记录的是下一条指令在内存中的地址 - 控制单元会不停地将代码段的指令拿进来,先放入指令寄存器
5. 指令的组成部分:做什么操作 + 操作哪些数据 - 要执行指令,需要将***部分交给运算单元,将第二部分交给数据单元
6. 数据单元根据数据的地址,从数据段里读取数据到数据寄存器,最终会有指令将数据写回到内存中的数据段
7. CPU里有两个寄存器,专门保存当前处理进程的代码段起始地址和数据段起始地址,图中的当前进程为进程A
8. CPU和内存通过总线传输数据,总线上有两类数据 - 地址总线(Address Bus):地址数据,位数决定了能访问的地址有多广 - 数据总线(Data Bus):真正的数据,位数决定了一次性能拿多少数据
x86架构
型号
8086的原理
通用寄存器
- 为了暂存数据,8086处理器内部有8个16位的通用寄存器,属于CPU内部的数据单元
- 分别是AX、BX、CX、DX、SP、BP、SI和DI
- 其中AX、BX、CX和DX可以分成两个8位的寄存器来使用,其中H就是High,L就是Low
- 这样,比较长的数据也能暂存,比较短的数据也能暂存
控制单元
- IP寄存器(Instruction Pointer Register)即指令指针寄存器
- 指向代码段中下一条指令的位置
- CPU会根据IP寄存器不断地将指令从内存的代码段中,加载到CPU的指令队列中,然后交给运算单元去执行
- 切换进程
- 每个进程都分为代码段和数据段
- 为了指向不同进程的地址空间,有4个16位的段寄存器,分别是CS、DS、SS和ES
- CS(Code Segment Register)是代码段寄存器,通过它可以找到代码在内存中的位置
- DS(Data Segment Register)是数据段寄存器,通过它可以找到数据在内存中的位置
- SS(Stack Segment Register)是栈寄存器,但凡与函数调用相关的操作,都与栈紧密相关
- A调用B,B调用C
- 当A调用B的时候,要执行B函数的逻辑,因而A运行的相关信息会被push到栈里
- 当B调用C的时候,同理,B运行的相关信息会被push到栈里,然后才运行C函数的逻辑
- 当C运行完毕后,先pop出来的是B,B接着调用C函数之后的指令运行下去
- B运行完毕后,再pop出来的是A,A接着运行,直至结束
加载内存数据
- 如果需要加载内存中的数据,可以通过DS找到内存中的数据,加载到通用寄存器
- 对于一个段,有一个起始地址,而段内的具体位置,称为偏移量
- CS和DS都存放着一个段的起始地址
- 代码段的偏移量放在IP寄存器
- 数据段的偏移量放在通用寄存器
- CS和DS都是16位的(起始地址),IP寄存器和通用寄存器也都是16位的(偏移量),但8086的地址总线是20位的
- 凑20位:起始地址 << 4 + 偏移量
- 无论真正的内存有多大,对于只有20位地址总线的8086来说,能够区分的地址也就2^20=1M(寻址单位为Byte)
- 如果想访问1M+X的地方,在总线上超过20位的部分根本发不出去,***访问的还是1M内的X位置
- 偏移量只有16位的,所以一个段的***大小为2^16=64K
- 因此对于8086的CPU来说,最多只能访问1M的内存空间,还要分成多个段,每个段***为64K
32位处理器
- 在32位的CPU中,有32根地址总线,可以访问2^32=4G的内存
- x86架构是开放的,因此32位的CPU需要兼容原来的架构
兼容
1. 通用寄存器 - 将8个16位的通用寄存器扩展到8个32位的通用寄存器,但依然保留16位和8位的使用方式 - 高16位不能分成两个8位使用,因为这是不兼容的
2. IP寄存器 - 指向下一条指令的指令指针寄存器IP,会扩展成32位的,同样兼容16位
3. 段寄存器(Segment Register) - CS、DS、SS和ES仍然是16位,但不再是段的起始地址,段的起始地址放在内存的某个地方(表格)
- 表格中的一项是段描述符(Segment Descriptor),里面才是段真正的起始地址 - 而段寄存器里面保存的是这个表格中的某一项,称为选择子(Selector)
- 获取段起始地址的流程:先间接地从段寄存器中找到表格中的一项,再从表格中的一项拿到段真正的起始地址
- 为了快速拿到段的起始地址,段寄存器会从内存中拿到CPU的描述符高速缓存器中
- 这种模式与8086的模式不兼容,但非常灵活,可以保持未来的兼容性
实模式 VS 保护模式
- 在32位的架构下,将前一种模式称为实模式(Real Pattern),后一种模式称为保护模式(Protected Pattern)
- 系统刚刚启动的时候,CPU处于实模式,此时和原来的模式是兼容的。即32位的CPU,也支持在原来的模式下运行,速度会快一点
- 当需要更多内存时,可以遵循一定的规则,进行一系列的操作,然后切换到保护模式,就能够用到32位CPU更强大的能力
- 如果不能无缝兼容,但通过切换模式兼容,也是可以接受的
系统交互
常用汇编指令
mov, call, jmp, int, ret, add, or, xor, shl, shr, push, pop, inc, dec, sub, cmp