腾讯三面:什么是 JVM 字节码?它是如何工作的?

开发
本文,我们分析了什么是JVM​字节码,如何查看JVM​字节码以及JVM如何执行字节码。

作为 Java程序员都知道 Java是跨平台的语言,编译一次到处运行,这得益于 JVM字节码,这篇文章,我们将一起分析什么是JVM字节码?如何查看 JVM字节码?JVM字节码是如何工作的?

什么 JVM 字节码?

Java 源代码经过编译器编译后,就会生成 JVM 字节码,它是一种基于栈的低级、中立于平台的指令架构,每个字节码指令都会在 JVM 上执行一系列的操作,如加载、存储、运算、跳转等。它使用基于操作数栈和局部变量表的执行模型。

JVM 字节码具有以下特点:

  • 独立于具体的硬件和操作系统,不同平台上的 JVM 可以解释和执行相同的字节码文件。
  • 相对于机器码和源代码,JVM 字节码是一种更高级别的抽象,并且比机器码更容易阅读和编写。
  • JVM 字节码通过运行时的即时编译器或解释器执行。

因此,只要在不同平台上安装相应的 JVM,就能在这些平台上运行相同的字节码,这种特性为 Java 程序提供了很高的可移植性和兼容性。值得注意的是,其他编程语言也可以编译成 JVM 字节码,利用 JVM 的优势。这些编程语言叫做基于 JVM 的语言,例如 Kotlin、Groovy 等。

如何查看 JVM 字节码?

通过 javap -c ClassName指令就可以查看 JVM字节码,为了更好的说明,下面通过一个简单的 Java程序和对应的 JVM字节码示例来进行演示:

1.示例代码

如下代码,在控制台输出“Hello, World”:

public class HelloWorld {
    public static void main(String[] args) {
        System.out.println("Hello, World!");
    }
}

使用 javac 命令编译上述 Java 源代码后会生成一个 HelloWorld.class 文件,然后使用javap -c HelloWorld命令查看字节码,内容如下:

Compiled from "HelloWorld.java"
public class HelloWorld {
  public HelloWorld();
    Code:
       0: aload_0
       1: invokespecial #1      // Method java/lang/Object."<init>":()V
       4: return

  public static void main(java.lang.String[]);
    Code:
       0: getstatic     #2     // Field java/lang/System.out:Ljava/io/PrintStream;
       3: ldc           #3     // String Hello, World!
       5: invokevirtual #4     // Method java/io/PrintStream.println:(Ljava/lang/String;)V
       8: return
}

2.字节码解释

(1) 构造方法 HelloWorld()

  • aload_0: 加载局部变量表中第一个变量(即this引用)。
  • invokespecial #1: 调用父类(java/lang/Object)的构造方法。
  • return: 从构造方法返回。

(2) main方法

  • getstatic #2: 获取静态字段java/lang/System.out,它是一个 PrintStream 对象。
  • ldc #3: 将常量池中索引为3的项(即字符串"Hello, World!")加载到操作数栈。
  • invokevirtual #4: 调用 PrintStream 的 println 方法,参数是栈顶的字符串。
  • return: 从main方法返回。

(3) 关键字节码指令解析

  • aload_0: 加载局部变量表中索引为 0的引用类型变量到操作数栈。
  • invokespecial: 调用实例初始化方法和私有方法。
  • getstatic: 获取静态字段的值并将其压入操作数栈。
  • ldc: 将常量池中的常量加载到操作数栈。
  • invokevirtual: 调用对象的实例方法,方法的选择是基于对象的运行时类型。

通过这个示例,我们可以看到 Java源代码被编译成 JVM 字节码后是什么样子。

JVM字节码指令集

通过上述查看 JVM字节码的示例,我们可以看到很多 JVM内部的指令,比如加载、存储、运算、跳转等。JVM字节码指令集(Bytecode Instruction Set)是 JVM用来执行 Java 程序的指令集合,每条字节码指令由一个字节的操作码(opcode)和可选的操作数组成。

以下是 JVM 字节码指令集的一些主要类别和具体指令:

1.加载和存储指令

加载和存储指令,全称 Load and Store Instructions,包含以下几个指令:

  • aload: 从局部变量表加载引用类型变量到操作数栈。
  • astore: 将操作数栈顶的引用类型变量存储到局部变量表。
  • iload: 从局部变量表加载整数类型变量到操作数栈。
  • istore: 将操作数栈顶的整数类型变量存储到局部变量表。
  • dload, fload, lload: 加载双精度浮点数、单精度浮点数和长整数类型变量。
  • dstore, fstore, lstore: 存储双精度浮点数、单精度浮点数和长整数类型变量。

2.算术运算指令

算术运算指令,全称 Arithmetic Instructions,包含以下几个指令:

  • iadd: 对栈顶的两个整数进行加法运算。
  • isub: 对栈顶的两个整数进行减法运算。
  • imul: 对栈顶的两个整数进行乘法运算。
  • idiv: 对栈顶的两个整数进行除法运算。
  • iinc: 对局部变量表中的整数变量进行自增。
  • dadd, fadd, ladd: 加法运算(双精度浮点数、单精度浮点数、长整数)。
  • dsub, fsub, lsub: 减法运算(双精度浮点数、单精度浮点数、长整数)。

3.类型转换指令

类型转换指令,全称 Type Conversion Instructions,包含以下几个指令:

  • i2d: 整数转双精度浮点数。
  • i2f: 整数转单精度浮点数。
  • i2l: 整数转长整数。
  • d2i, f2i, l2i: 转换为整数。

4.对象操作指令

对象操作指令,全称 Object Manipulation Instructions,包含以下几个指令:

  • new: 创建一个新的对象实例。
  • newarray: 创建一个新的数组。
  • anewarray: 创建一个新的引用类型数组。
  • checkcast: 检查对象是否为某一类型的实例。
  • instanceof: 判断对象是否是某一类型的实例。

5.方法调用和返回指令

方法调用和返回指令,全称 Method Invocation and Return Instructions,包含以下几个指令:

  • invokestatic: 调用静态方法。
  • invokevirtual: 调用实例方法,根据对象的实际类型进行分派。
  • invokespecial: 调用实例初始化方法、私有方法和父类方法。
  • invokeinterface: 调用接口方法。
  • return: 从方法返回(无返回值)。
  • ireturn, dreturn, freturn, lreturn, areturn: 从方法返回(返回值为整数、双精度浮点数、单精度浮点数、长整数、引用类型)。

6.控制流指令

控制流指令,全称 Control Flow Instructions,包含以下几个指令:

  • goto: 无条件跳转。
  • ifeq: 如果栈顶整数为0,则跳转。
  • ifne: 如果栈顶整数不为0,则跳转。
  • iflt, ifge, ifgt, ifle: 比较栈顶整数,并根据结果跳转。
  • tableswitch: 用于switch语句的多路分支跳转。
  • lookupswitch: 用于switch语句的查找表跳转。

7.异常处理指令

异常处理指令,全称 Exception Handling Instructions,包含以下几个指令:

  • athrow: 抛出异常或错误。
  • try-catch块:通过异常表实现,不是具体的字节码指令。

8.同步指令

同步指令,全称 Synchronization Instructions,包含以下几个指令:

  • monitorenter: 获取对象的监视器锁。
  • monitorexit: 释放对象的监视器锁。

9.栈操作指令

栈操作指令,全称 Stack Operations Instructions,包含以下几个指令:

  • pop: 弹出栈顶的一个元素。
  • dup: 复制栈顶的一个元素。
  • swap: 交换栈顶的两个元素。

JVM 如何执行字节码?

JVM 字节码的执行过程主要依赖于 Java 虚拟机的解释器和即时编译器(Just-In-Time Compiler,简称JIT)。JVM会将字节码读取到内存中,并逐条解释执行,或者将热点代码编译为机器码来提高执行效率。

为了更好地说明 JVM 字节码的执行过程,我们还是通过一个具体的示例来进行说明。

1.示例代码

这里以 a + b 求和为例,代码如下:

public class Sum {
    public static int add(int a, int b) {
        return a + b;
    }
}

使用 javap -c Sum 命令获取字节码,具体信息如下:

Compiled from "Sum.java"
public class Sum {
  public Sum();
    Code:
       0: aload_0
       1: invokespecial #1     // Method java/lang/Object."<init>":()V
       4: return

  public static int add(int, int);
    Code:
       0: iload_0
       1: iload_1
       2: iadd
       3: ireturn
}

2.字节码解释

(1) 构造方法 Sum()

  • aload_0: 加载局部变量表中第一个变量(即this引用)。
  • invokespecial #1: 调用父类(java/lang/Object)的构造方法。
  • return: 从构造方法返回。

(2) add()方法

  • iload_0: 加载局部变量表中索引为0的整数(即参数a)到操作数栈。
  • iload_1: 加载局部变量表中索引为1的整数(即参数b)到操作数栈。
  • iadd: 弹出操作数栈顶的两个整数,进行加法运算,并将结果压入操作数栈。
  • ireturn: 从方法返回,并将操作数栈顶的整数作为返回值。

3.执行过程

假设我们在另一个类中调用Sum.add(2, 3),执行过程如下:

  • JVM将参数 2和 3压入局部变量表,iload_0指令将参数 2加载到操作数栈。
  • iload_1指令将参数 3加载到操作数栈。
  • iadd指令弹出操作数栈顶的两个值(2和3),进行加法运算,将结果5压入操作数栈。
  • ireturn指令将操作数栈顶的值(5)作为返回值返回给调用者。

总结

本文,我们分析了什么是JVM字节码,如何查看JVM字节码以及JVM如何执行字节码,掌握这些底层不但可以帮助我们更好的理解,为什么 Java可以编译一次,到处运行,还可以帮助我们更好的了解 Java的运行机制以及理解 Java的编程精髓。

责任编辑:赵宁宁 来源: 猿java
相关推荐

2024-09-29 09:50:05

2020-09-11 08:41:50

域名系统DNS网络

2024-08-19 00:25:00

2024-09-03 10:15:21

2024-09-27 16:33:44

2023-07-03 14:36:07

物联网IoT

2021-12-08 09:53:50

腾讯QQ号码重复

2022-11-22 11:30:53

2023-07-26 13:29:43

高性能短链系统

2021-08-27 09:00:00

CDC数据库技术

2020-04-21 12:09:47

JVM消化字节码

2022-01-17 14:24:09

共享字节面试

2023-10-07 08:41:42

JavaJVM

2020-10-13 12:29:38

Linux包管理器

2024-04-08 14:29:45

AI工厂数据中心

2024-06-03 14:03:35

2022-03-30 10:10:17

字节码栈空间

2020-04-23 16:22:21

互联网骨干网网络

2021-06-30 17:38:03

Trie 树字符Java

2021-03-01 11:53:15

面试伪共享CPU
点赞
收藏

51CTO技术栈公众号