程序员最不缺的就是对象,每天都会给自己创建成百上千的对象。可是你真的了解你的对象吗?比如以下类代码:
上面代码,在main方法中通过 new 关键字创建了Foo类的实例对象,并且通过引用 foo 指向这个对象。那么它们以及静态变量staticValue和实例变量localValue都是被保存在内存中什么位置,以及它们是以何种方式存在的呢?
Java OOP-Klass 模型
JVM本身是用C艹实现的,一个Java对象在是如何映射到C层的对象呢?
最简单的做法是为每个Java类生成一个结构相同c++类与之对应。
但HotSpot JVM并没有这么做,而是设计了一个OOP-Klass Model。这里的 OOP 指的是 Ordinary Object Pointer (普通对象指针),它用来表示对象的实例信息。而 Klass 则包含元数据和方法信息,用来描述Java类。
之所以采用这个模型是因为HotSopt JVM的设计者不想让每个对象中都含有一个vtable(虚函数表),所以就把对象模型拆成klass和oop,其中oop中不含有任何虚函数,而Klass就含有虚函数表,可以进行method dispatch。
OOP-Klass模型 分为OOP框架和Klass框架
Klass 包含元数据和方法信息,用来描述Java类。
Klass是用来表示class的元数据,包括常量池、字段、方法、类名、父类等。Klass 对象中含有虚函数表vtbl 以及父类虚函数表klass_vtbl, 因此可以根据java对象的实例类型方法的分发。
JVM 在加载class字节码文件时,会在方法区创建Klass对象,其中 instanceKlass 可以认为是 java.lang.Class 的VM级别的表示,但它们并不等价,其结构如下图所示,
上图中的所有全局变量会在class字节码解析阶段完成赋值,主要是将常量池中的符号引用转换为直接引用,即运行时实际内存地址。
OOP 指的是普通对象指针,用来表示对象的实例信息
所有的 OOP 类的共同基类为 oopDesc 类。它的结构如下:
当在Java中使用 new guan'jian创建一个对象时,就会在JVM中创建一个 instanceOopDesc 实例对象。Foo中的localValue就是保存在这个对象当中。
我们经常说Java对象在内存中的布局分为:对象头、实例数据、对其填充。其实这3部分就是对应上面图中的 oopDesc 对象。
_mark和_metadata 一起组成了对象头部分:
- Mark Word:instanceOopDesc 中的 _mark 成员,允许压缩。它用于存储对象的运行时记录信息,如哈希值、GC 分代年龄(Age)、锁状态标志(偏向锁、轻量级锁、重量级锁)、线程持有的锁、偏向线程 ID、偏向时间戳等。
- 元数据指针:instanceOopDesc 中的 _metadata 成员,它是联合体,可以表示未压缩的 Klass 指针(_klass)和压缩的 Klass 指针。对应的 klass 指针指向一个存储类的元数据的 Klass 对象。
在对象头之后,JVM会继续填充Java对象中的具体实例数据,比如Foo中的localValue。
Foo具体分析
接下来重新回到文章开头的实例代码,Foo.java中包含两个变量staticValue和localValue,但是只有staticValue会在类加载阶段由JVM分配内存并初始化默认值,因此当代码执行到第7行时,内存中只会在方法区创建Klass对象,用来描述Foo信息以及staticValue值,如下图所示:
可以看出,此时堆内存中并没有创建Foo对应的instanceOopDesc实例对象。
当代码执行到第9行,调用 new 创建Foo时,JVM 就会创建一个 instanceOopDesc 对象表示这个对象的实例,然后进行 Mark Word 的填充,将元数据指针指向刚才在方法区创建的 Klass 对象,并填充实例变量。并且因为方法是在main方法中执行,所有foo指针会被保存在虚拟机栈中,并指向创建的 instanceOopDesc 对象。具体过程如下:
可以看出 localValue 是被保存在堆中的。
综上所述:
- foo是一个局部方法中的引用,被保存在虚拟机栈中
- staticValue静态变量在类加载阶段被保存在方法区,并被赋值
- localValue 实例变量是在创建对象时才会被创建并赋值
- 一个Java对象在JVM中被分成2部分:OOP和Klass。其中OOP对象保存对象里实例数据,Klass用来描述类相关信息以及保存静态变量。