从0学ARM-什么是位置无关码?

存储 存储软件
uboot搬移到DRAM中,然后跳转到DRAM继续运行uboot剩下的代码,那么在搬移之前的这段代码必须是位置无关,而且不能使用绝对寻址指令,否则寻址就会出错。

 [[375631]]

一、为什么需要位置无关码?

首先我们需要了解一下ARM板子的启动流程。

1. exynos 4412启动流程

首先看一下 exynos 4412 memory map :

可知:iROM基地址是0x00000000 iRAM基地址是0x02020000

这两块内存都在 SOC中。

查看exynos 4412 Booting Sequence:

位于第五章。

上图是exynos4412上电复位时的启动流程,大致如下:

<1>执行内部只读存储器iROM中的一段代码(厂家固化在里面的),这段代码主要是初始化一些系统的基本配置,比如初步时钟配置、堆栈、启动模式(对应图中的标志①)。

<2>iROM中的代码根据阶段一获取的启动模式(OM_STAT寄存器),从相应的存储介质中拷贝BL1镜像到内部静态随机存储器SRAM,BL1主要是完善系统时钟的初始化工作、内存控制器一些时序的配置。做完这些工作后把OS镜像拷贝到内存中(对应图中标志②③)。

<3>跳转到OS中执行。

SRAM只有256KB,而uboot镜像一般是超过这个大小的,也就是说它不能把完整的uboot镜像拷贝到SRAM中,因此,推测这里的拷贝方式应该还是:「BL1拷贝的仅仅是uboot的一部分」,这一部分除了能设置好基本的硬件运行环境外,「还能把其自身(uboot镜像)完整的拷贝到内存中」,然后uboot在内存中运行,完成OS镜像的拷贝和引导

一般情况下两者的地址并不相同,程序在DRAM中的地址重定位过程必须由程序员来完成。

这样就有了「位置无关代码」的概念,指代码不在连接时指定的运行地址空间,也可以执行,它一段加载到任意地址空间都能执行的特殊代码。

uboot搬移到DRAM中,然后跳转到DRAM继续运行uboot剩下的代码,那么在搬移之前的这段代码必须是位置无关,而且不能使用绝对寻址指令,否则寻址就会出错。

二、怎么实现位置无关码?

1. 什么是《编译地址》?什么是《运行地址》?「编译地址:」

32位的处理器,它的每一条指令是4个字节,以4个字节存储顺序,进行顺序执行,CPU是顺序执行的,只要没发生什么跳转,它会顺序进行执行, 编译器会对每一条指令分配一个编译地址,这是编译器分配的,在编译过程中分配的地址,我们称之为编译地址。

「运行地址:」

是指程序指令真正运行的地址,是由用户指定的,用户将运行地址烧录到哪里,哪里就是运行的地址。比如有一个指令的编译地址是0x40008000,实际运行的地址是0x40008000,如果用户将指令烧到0x60000000上,那么这条指令的运行地址就是0x60000000。

当编译地址和运行地址不同的时候会出现什么结果?结果是不能跳转,编译后会产生跳转地址,如果实际地址和编译后产生的地址不相等,那么就不能跳转。

「C语言编译地址:」

都希望把编译地址和实际运行地址放在一起的,但是汇编代码因为不需要做C语言到汇编的转换,可以直接的去写地址,所以直接写的就是他的运行地址,这就是为什么任何bootloader刚开始会有一段汇编代码,因为起始代码编译地址和实际地址不相等,这段代码和汇编无关,跳转用的运行地址。

2. 举例

实现位置无关码主要考虑以下两个方面:

  1. 1. 位置无关的函数跳转 
  2. 2. 位置无关的常量访问 

代码

编译代码使用的连接文件「map.lds」如下:

  1. OUTPUT_FORMAT("elf32-littlearm""elf32-littlearm""elf32-littlearm"
  2. /*OUTPUT_FORMAT("elf32-arm""elf32-arm""elf32-arm")*/ 
  3. OUTPUT_ARCH(arm) 
  4. ENTRY(_start) 
  5. SECTIONS 
  6.  . = 0x40008000; 
  7.  . = ALIGN(4); 
  8.  .text      : 
  9.  { 
  10.   gcd.o(.text) 
  11.   *(.text) 
  12.  } 
  13.  . = ALIGN(4); 
  14.     .rodata :  
  15.  { *(.rodata) } 
  16.     . = ALIGN(4); 
  17.     .data :  
  18.  { *(.data) } 
  19.     . = ALIGN(4); 
  20.     .bss : 
  21.      { *(.bss) } 

如文件map.lds所示:「0x40008000」就是链接地址,

其他源文件如下:「gcd.s」

  1. .text 
  2. .global _start 
  3. _start: 
  4.   ldr  sp,=0x70000000         /*get stack top pointer*/ 
  5.   bl func 
  6.   ldr pc,=func 
  7.   b  main 
  8. func: 
  9.  mv pc,lr 

「main.c」

  1. /* 
  2.  * main.c 
  3.  * 
  4.  *  Created on: 2020-12-12 
  5.  *      Author: 一口Linux 
  6.  */ 
  7. int aaaa=0;  
  8. int main(void) 
  9.  aaaa = 0x11; 
  10.  while(1); 
  11.     return 0; 

「Makefile」

  1. TARGET=gcd 
  2. TARGETC=main 
  3. all
  4.  arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGETC).o  $(TARGETC).c 
  5.  arm-none-linux-gnueabi-gcc -O1 -g -c -o $(TARGET).o $(TARGET).s 
  6.  arm-none-linux-gnueabi-gcc -O1 -g -S -o $(TARGETC).s  $(TARGETC).c 
  7.  arm-none-linux-gnueabi-ld $(TARGETC).o $(TARGET).o -Tmap.lds  -o  $(TARGET).elf  
  8.  arm-none-linux-gnueabi-objcopy -O binary -S $(TARGET).elf $(TARGET).bin 
  9.  arm-none-linux-gnueabi-objdump -D $(TARGET).elf > $(TARGET).dis 
  10.  
  11. clean: 
  12.  rm -rf *.o *.elf *.dis *.bin 

反汇编文件「gcd.dis」

如上图所示:

  1. _start对应的链接地址是0x40008000
  2. 9行 bl func对应的指令
  3. 10行 ldr pc,=pc对应的指令
  4. func的链接地址0x40008010
  5. 全局变量aaaa对应的内存位于bss段0x4000802c
  6. 19行 aaaa = 0x11 赋值语句对应的机器码

如果我们将生成的bin文件拷贝到内存0x40008000位置运行必然没有问题,

bl func 和 ldr pc,=func 都能跳转到func函数,而19行代码,也能访问到全局变量aaaa。

如果我们将该程序拷贝到其他地址是否能正常运行呢?

假定我们拷贝到0地址运行,那么程序的执行地址需要从0开始重新编排,即_start对应0地址,main对应0x18。

拷贝到0地址后内存布局:

拷贝到0地址运行后,**内存中指令(机器码)**的内容还和以前一样, pc的值会根据实际运行地址重新修正。

1.首先看bl func

对应的汇编代码是 第9行;该指令的机器码是0xeb000001, 我们在《4. 从0开始学ARM-ARM指令,移位、数据处理、BL、机器码》讲过该机器码格式 是从pc的位置向前偏移1条指令 因为三级流水线,所以应该往下偏移3条指令,即func的位置, 所以bl仍然可以正确找到func这个函数。

bl func

2.ldr pc,=func 对应的汇编代码是 第10行;

我们可以看到是从pc值+4位置取出对应的内存的值,pc值+4是14,该位置对应15行, 即将40008010写入到pc,

而我们的bin文件只有44个字节大小,所以此时内存40008010并没有我们编写的任何代码。所以ldr pc,=func 无法跳转到func。

3.c访问全局变量aaaa

对应的汇编代码是 第19行;

c访问全局变量aaaa

我们可以看到是从pc值+4位置取出对应的内存的值,pc值+4是28,该位置对应22行, 即将4000802c写入到r3,然后20行会将r2中值写入到0x4000802c这个地址, 而此时该地址并不是全局变量aaaa, 所以此指令是无法找到bss段的aaaa变量的内存。

四、总结

1. 位置无关码:CPU取指时用相对地址取指令(比如pc +4),只要其相对地址没有变,都能够取指并运行。即该段代码无论放在内存的哪个地址,都能正确运行。究其原因,是因为代码里没有使用绝对地址,都是相对地址。

2. 位置相关码:利用绝对地址取指并运行,这就需要你存放程序(链接过程中)需要按照连接脚本的要求那样执行(Makefile里面有 -Ttext xxx指定或连接脚本)。即它的地址与代码处于的位置相关,是绝对地址,如:mov PC ,#0xff;ldr pc,=0xffff等。

3. 位置无关码的应用:1). 程序在运行期间动态加载到内存;

2). 程序在不同场合与不同程序组合后加载到内存(共享的动态链接库);

3). 在运行期间不同地址相互之间的映射(如bootloader)

4. 结论

  • 使用「mov pc ,xxx ; ldr pc ,xxx」等就是位置相关码。这些使用绝对指令寻址。
  • 而使用「bl ,b ,adr,ldr」一般为位置无关码。
  • 在使用「b, bl」调用C语言中的函数里「不要使用全局变量」,因为C中全局变量的地址「也是根据链接地址生成」的。
  • 使用=和不使用=号是有很大区别的。「无=号:取该标号处的值,位置无关 有=号:取该标号的地址,位置相关」

【考一考】 考一考大家为什么uboot的异常向量表的reset异常,指令是b reset,而其他异常却是我们本文所说的位置相关码,ldr pc,XXXXXX?

arm对应的uboot异常向量表如下:

  1. arch/arm/cpu/armv7/start.S 

本文转载自微信公众号「 一口Linux」,可以通过以下二维码关注。转载本文请联系 一口Linux公众号。

 

责任编辑:武晓燕 来源: 一口Linux
相关推荐

2020-12-11 09:05:04

ARMMDKGNU

2020-12-10 08:13:15

ARM架构 嵌入式

2021-01-08 12:06:59

WDT定时装置

2021-05-25 11:50:32

ARMuboot网络协议栈

2021-01-16 11:40:28

ARM嵌入式开发ADC应用

2022-10-31 07:33:05

Javafor循环

2022-09-30 07:32:48

循环while循环体

2022-11-26 00:34:57

数组Java程序

2022-10-30 10:14:43

Java循环语句

2022-09-22 07:31:14

Java变量计算

2022-09-16 07:32:15

编程计算机命令

2022-10-28 07:38:06

Javawhile循环

2022-09-30 07:32:39

架构

2019-01-29 14:29:03

微服务路由

2020-08-14 10:42:37

For循环Python代码

2021-07-09 06:48:29

数组存储内存

2022-06-27 15:42:23

区块链

2020-06-12 14:17:26

开源协议ARM

2017-05-18 13:23:06

机器学习强化学习分类问题

2014-02-01 21:25:08

Python数组
点赞
收藏

51CTO技术栈公众号