编程是门艺术,大多数开发者实际工作中只是开发App,正常来说是不会接触到汇编的,主要有两大原因,一来编译语言不容易学习,二来,日常生活中比较少用到。
汇编语言是最古老的编程语言,在所有的语言中,它与原生机器语言最为接近。它能直接访问计算机硬件,要求用户了解计算机架构和操作系统。学习汇编最大的用处就是可以帮助我们更好地理解高级语言,因此还是很有必要的,
本文使用RISC-V 为例来向大家展示,来如何使用编写语言设计程序逻辑,并最终将程序逻辑转换为汇编语言的程序。
用合适的语言设计逻辑
这是最难的一步,许多学生想直接编写完整的功能模块的软件包。但是,如果你不喜欢汇编,那么这是一种注定要失败的方法,相反,为了把逻辑从语言中分离出来,我们必须用我们能理解的语言来写。
如果一个学生不懂C语言或一些低级语言,那么我建议他们用伪代码来写。太高级的语言编译困难,而太低级的语言又会讲逻辑设计困难,所以,推荐使用C/C++或其他类似的语言。
在翻译时,有些编辑器可以把它们并排放在一起,这是很有帮助的。因为在大脑中保留一份指令列表是很困难的,特别是当你在编译一个复杂的程序时。
一步一个脚印
许多学生试图从头到尾编写整个程序,而中间没有测试任何内容。如果是初学者,我建议用增量式编程,关键是在完成一部分逻辑时进行测试。这可以像完成一个for循环就进行测试。
测试的一种方法是将C/C++程序与汇编程序连接在一起,你可以通过在C++中创建函数程序集的原型并在两者之间切换来实现这一点。你需要确保两者是不同的,否则链接会出错,按照一般的做法通常会在C函数前面加上一个“c”来区分。我们可以调用Show来运行汇编语言编写的函数:
- extern "C" { // Turn off name mangling
- void show(int *x);
- }
extern " C "将告诉c++函数遵循C的"调用约定"。我们真正关心的是关闭名称修改,这样我们就可以创建一个名为“show”的标签,并拥有我们的函数。
了解汇编语言的功能定位
正如巨石强森(Dwayne Johnson)常说的那样:“认清自己的角色”。知道C/ C++为我们做了什么和程序集没有为我们做什么是很重要的。。例如,4 + 3 * 4将自动将运算排序为先执行乘法,再执行加法。然而,在汇编中,我们必须先选择乘法指令,然后再选择加法指令。
知道如何调用函数
大多数ISA架构都会附带调用约定手册,比如ARM和RISC-V。这些只是为在所有语言中调用函数制定了一些基本规则。不过幸运的是RISC-V寄存器的 “ABI” 命名规则,有助于程序员理解它们的含义。比如:
- 整数参数在寄存器 A0-A7 中,浮点参数在寄存器 FA0-FA7 中
- 通过对堆栈指针的 sub 操作去分配函数堆栈。在调用完成后使用 add 操作进行销毁
- 堆栈大小必须以 8 的整数倍形式分配
- 所有参数和临时寄存器必须在函数调用后,被视为销毁态
- 在函数调用之后,已保存寄存器才能被显式保存。如果使用了任何已保存的寄存器,则必须在函数返回之前还原它们的原始值
- 通过 a0 寄存器做为返回值,将数据返回给调用方。
- .global main
- main:
- addi sp, sp, -8
- sd ra, 0(sp)
- la a0, test_solve
- call solve
- mv a0, zero
- ld ra, 0(sp)
- addi sp, sp, 8
- ret
你可以从上面的代码中看到,我们首先分配我们的堆栈框架,保存所有需要保存的寄存器,执行,然后在返回之前撤消的所有寄存器。
文档
用C或其他语言编写汇编代码会让你为每一行C代码编写多行汇编代码。如果你试图调试程序,这可能会让你有些难度,所以,我总是写C代码作为汇编的注释,然后把它拆开,并展示我做它的每一步。
你可以从上面的代码中看到,我有原始的C代码(第一个注释),然后对每个片段进行内联注释。这样的方式使我们能够保证程序可以正确地执行每一步。