聊聊Unsafe的一些使用技巧

开发 后端
sun.misc.Unsafe 是 JDK 原生提供的一个工具类,包含了很多在 Java 语言看来很 cool 的操作,例如内存分配与回收、CAS 操作、类实例化、内存屏障等。

[[428449]]

本文转载自微信公众号「Kirito的技术分享」,作者kiritomoe 。转载本文请联系Kirito的技术分享公众号。

前言

记得初学 Java 那会,刚学完语法基础,就接触到了反射这个 Java 提供的特性,尽管在现在看来,这是非常基础的知识点,但那时候无疑是兴奋的,瞬间觉得自己脱离了“Java 初学者”的队伍。随着工作经验的积累,我也逐渐学习到了很多类似的让我为之而兴奋的知识点,Unsafe 的使用技巧无疑便是其中一个。

sun.misc.Unsafe 是 JDK 原生提供的一个工具类,包含了很多在 Java 语言看来很 cool 的操作,例如内存分配与回收、CAS 操作、类实例化、内存屏障等。正如其命名一样,由于其可以直接操作内存,执行底层系统调用,其提供的操作也是比较危险的。Unsafe 在扩展 Java 语言表达能力、便于在更高层(Java层)代码里实现原本要在更低层(C层)实现的核心库功能上起到了很大的作用。

从 JDK9 开始,Java 模块化设计的限制,使得非标准库的模块都无法访问到 sun.misc.Unsafe。但在 JDK8 中,我们仍然可以直接操作 Unsafe,再不学习,后面可能就没机会了。

使用 Unsafe

Unsafe 被设计的初衷,并不是希望被一般开发者调用,所以我们不能通过 new 或者工厂方法去实例化 Unsafe 对象,通常可以采用反射的方法获取到 Unsafe 实例:

  1. public static final Unsafe unsafe = getUnsafe(); 
  2.  
  3. static sun.misc.Unsafe getUnsafe() { 
  4.     try { 
  5.         Field field = Unsafe.class.getDeclaredField("theUnsafe"); 
  6.         field.setAccessible(true); 
  7.         return  (Unsafe) field.get(null); 
  8.     } catch (Exception e) { 
  9.         throw new RuntimeException(e); 
  10.     } 

拿到之后,便可以用这个全局的单例对象去为所欲为了。

功能概览

图片来源于网络,我直接借用过来了。上图包含了 Unsafe 的众多功能,还算全面。如果全部介绍,文章篇幅会过长,形式难免会流水账,我打算结合我的一些项目经验以及一些比赛经验,从实践角度聊聊 Unsafe 的一些使用技巧。

内存分配&存取

Java 其实也可以像 C++ 那样直接操作内存,借助 Unsafe 就可以。让我们先来看一个 ByteBuffer 的示例,我们将会开辟一个 16 字节的内存空间,先后写入并读取 4 个 int 类型的数据。

  1. public static void testByteBuffer() { 
  2.     ByteBuffer directBuffer = ByteBuffer.allocateDirect(16); 
  3.     directBuffer.putInt(1); 
  4.     directBuffer.putInt(2); 
  5.     directBuffer.putInt(3); 
  6.     directBuffer.putInt(4); 
  7.     directBuffer.flip(); 
  8.     System.out.println(directBuffer.getInt()); 
  9.     System.out.println(directBuffer.getInt()); 
  10.     System.out.println(directBuffer.getInt()); 
  11.     System.out.println(directBuffer.getInt()); 

熟悉 nio 操作的同学对上面的示例应该不会感到陌生,这是很基础也是很标准的内存使用方式。那换做是 Unsafe 怎么实现同样的效果的?

  1. public static void testUnsafe0() { 
  2.     Unsafe unsafe = Util.unsafe; 
  3.     long address = unsafe.allocateMemory(16); 
  4.     unsafe.putInt(address, 1); 
  5.     unsafe.putInt(address + 4, 2); 
  6.     unsafe.putInt(address + 8, 3); 
  7.     unsafe.putInt(address + 12, 4); 
  8.  
  9.     System.out.println(unsafe.getInt(address)); 
  10.     System.out.println(unsafe.getInt(address + 4)); 
  11.     System.out.println(unsafe.getInt(address + 8)); 
  12.     System.out.println(unsafe.getInt(address + 12)); 

两段代码输出结果一致:

下面针对使用到的 Unsafe 的 API,逐个介绍:

  1. public native long allocateMemory(long var1); 

这个 native 方法分配的是堆外内存,返回的 long 类型数值,便是内存的首地址,可以作为 Unsafe 其他 API 的入参。你如果见过 DirectByteBuffer 的源码,会发现其实它内部就是使用 Unsafe 封装的。说到 DirectByteBuffer,这里额外提一句,ByteBuffer.allocateDirect 分配的堆外内存会受到 -XX:MaxDirectMemorySize 的限制,而 Unsafe 分配的堆外内存则不会受到限制,当然啦,也不会受到 -Xmx 的限制。如果你正在参加什么比赛并且受到了什么启发,可以把“爷懂了”打在公屏上。

看到另外两个 API putInt 和 getInt ,你应当会意识到,肯定会有其他字节操作的 API,例如 putByte/putShort/putLong ,当然 put 和 get 也是成对出现的。这一系列 API 里面也有注意点,建议需要成对的使用,否则可能会因为字节序问题,导致解析失败。可以看下面的例子:

  1. public static void testUnsafe1() { 
  2.     ByteBuffer directBuffer = ByteBuffer.allocateDirect(4); 
  3.     long directBufferAddress = ((DirectBuffer)directBuffer).address(); 
  4.     System.out.println("Unsafe.putInt(1)"); 
  5.     Util.unsafe.putInt(directBufferAddress, 1); 
  6.     System.out.println("Unsafe.getInt() == " + Util.unsafe.getInt(directBufferAddress)); 
  7.     directBuffer.position(0); 
  8.     directBuffer.limit(4); 
  9.     System.out.println("ByteBuffer.getInt() == " + directBuffer.getInt()); 
  10.     directBuffer.position(0); 
  11.     directBuffer.limit(4); 
  12.     System.out.println("ByteBuffer.getInt() reverseBytes == " + Integer.reverseBytes(directBuffer.getInt())); 

输出如下:

  1. Unsafe.putInt(1) 
  2. Unsafe.getInt() == 1 
  3. ByteBuffer.getInt() == 16777216 
  4. ByteBuffer.getInt() reverseBytes == 1 

可以发现当我们使用 Unsafe 进行 putInt,再使用 ByteBuffer 进行 getInt,结果会不符合预期,需要对结果进行字节序变化之后,才恢复正确。这其实是因为,ByteBuffer 内部判断了当前操作系统的字节序,对于 int 这种多字节的数据类型,我的测试机器使用大端序存储,而 Unsafe 默认以小短序存储导致。如果你拿捏不准,建议配套使用写入和读取 API,以避免字节序问题。对字节序不了解的同学可以参考我的另外一篇文章:《“字节序”是个什么鬼》。

内存复制

内存复制在实际应用场景中还是很常见的需求,例如上一篇文章我刚介绍过的,堆内内存写入磁盘时,需要先复制到堆外内存,再例如我们做内存聚合时,需要缓冲一部分数据,也会涉及到内存复制。你当然也可以通过 ByteBuffer 或者 set/get 去进行操作,但肯定不如 native 方法来的高效。Unsafe 提供了内存拷贝的 native 方法,可以实现堆内到堆内、堆外到堆外、堆外和堆内互相拷贝,总之就是哪儿到哪儿都可以拷贝。

  1. public native void copyMemory(Object src, long offset, Object dst ,long dstOffset, long size); 

对于堆内内存来说,我们可以直接给 src 传入对象数组的首地址,并且指定 offset 为对应数组类型的偏移量,可以通过 arrayBaseOffset 方法获取堆内内存存储对象的偏移量

  1. public native int arrayBaseOffset(Class<?> var1); 

例如获取 byte[] 的固定偏移量可以这样操作:unsafe.arrayBaseOffset(byte[].class)

对于堆外内存来说,会更加直观一点,dst 设为 null,dstOffset 设置为 Unsafe 获取的内存地址即可。

堆内内存复制到堆外内存的示例代码:

  1. public static void unsafeCopyMemory()  { 
  2.     ByteBuffer heapBuffer = ByteBuffer.allocate(4); 
  3.     ByteBuffer directBuffer = ByteBuffer.allocateDirect(4); 
  4.     heapBuffer.putInt(1234); 
  5.     long address = ((DirectBuffer)directBuffer).address(); 
  6.  
  7.     Util.unsafe.copyMemory(heapBuffer.array(), 16, null, address, 4); 
  8.  
  9.     directBuffer.position(0); 
  10.     directBuffer.limit(4); 
  11.  
  12.     System.out.println(directBuffer.getInt()); 

在实际应用中,大多数 ByteBuffer 相关的源码在涉及到内存复制时,都使用了 copyMemory 方法。

非常规实例化对象

在 JDK9 模块化之前,如果不希望将一些类开放给其他用户使用,或者避免被随意实例化(单例模式),通常有两个常见做法

案例一:私有化构造器

  1. public class PrivateConstructorFoo { 
  2.  
  3.     private PrivateConstructorFoo() { 
  4.         System.out.println("constructor method is invoked"); 
  5.     } 
  6.  
  7.     public void hello() { 
  8.         System.out.println("hello world"); 
  9.     } 
  10.  

如果希望实例化该对象,第一时间想到的可能是反射创建

  1. public static void reflectConstruction() { 
  2.   PrivateConstructorFoo privateConstructorFoo = PrivateConstructorFoo.class.newInstance(); 
  3.   privateConstructorFoo.hello(); 

不出所料,我们获得了一个异常

  1. java.lang.IllegalAccessException: Class io.openmessaging.Main can not access a member of class moe.cnkirito.PrivateConstructorFoo with modifiers "private" 

稍作调整,调用构造器创建实例

  1. public static void reflectConstruction2() { 
  2.    Constructor<PrivateConstructorFoo> constructor = PrivateConstructorFoo.class.getDeclaredConstructor(); 
  3.    constructor.setAccessible(true); 
  4.    PrivateConstructorFoo privateConstructorFoo = constructor.newInstance(); 
  5.    privateConstructorFoo.hello(); 

it works!输出如下:

  1. constructor method is invoked 
  2. hello world 

当然,Unsafe 也提供了 allocateInstance 方法

  1. public native Object allocateInstance(Class<?> var1) throws InstantiationException; 

也可以实现实例化,而且更为直观

  1. public static void allocateInstance() throws InstantiationException { 
  2.     PrivateConstructorFoo privateConstructorFoo = (PrivateConstructorFoo) Util.unsafe.allocateInstance(PrivateConstructorFoo.class); 
  3.     privateConstructorFoo.hello(); 

同样 works!输出如下:

  1. hello world 

注意这里有一个细节,allocateInstance 没有触发构造方法。

案例二:package level 实例

  1. package moe.cnkirito; 
  2.  
  3. class PackageFoo { 
  4.  
  5.     public void hello() { 
  6.         System.out.println("hello world"); 
  7.     } 
  8.  

注意,这里我定义了一个 package 级别可访问的对象 PackageFoo,只有 moe.cnkirito 包下的类可以访问。

我们同样先尝试使用反射

  1. package com.bellamm; 
  2.  
  3. public static void reflectConstruction() { 
  4.   Class<?> aClass = Class.forName("moe.cnkirito.PackageFoo"); 
  5.   aClass.newInstance(); 

得到了意料之中的报错:

  1. java.lang.IllegalAccessException: Class io.openmessaging.Main can not access a member of class moe.cnkirito.PackageFoo with modifiers "" 

再试试 Unsafe 呢?

  1. package com.bellamm; 
  2.  
  3. public static void allocateInstance() throws Exception{ 
  4.     Class<?> fooClass = Class.forName("moe.cnkirito.PackageFoo"); 
  5.     Object foo = Util.unsafe.allocateInstance(fooClass); 
  6.     Method helloMethod = fooClass.getDeclaredMethod("hello"); 
  7.     helloMethod.setAccessible(true); 
  8.     helloMethod.invoke(foo); 

由于在 com.bellamm 包下,我们甚至无法在编译期定义 PackageFoo 类,只能通过反射机制在运行时,获取 moe.cnkirito.PackageFoo 的方法,配合 Unsafe 实例化,最终实现调用,成功输出 hello world。

我们花了这么大的篇幅进行实验来说明了两种限制案例,以及 Unsafe 的解决方案,还需要有实际的应用场景佐证 Unsafe#allocateInstance 的价值。我简单列举两个场景:

  1. 序列化框架在使用反射无法创建对象时,可以尝试使用 Unsafe 创建,作为兜底逻辑。
  2. 获取包级别保护的类,再借助于反射机制,可以魔改一些源码实现或者调用一些 native 方法,此法慎用,不建议在生产使用。

示例代码:动态修改堆外内存限制,覆盖 JVM 启动参数:-XX:MaxDirectMemorySize

  1. private void hackMaxDirectMemorySize() { 
  2.      try { 
  3.          Field directMemoryField = VM.class.getDeclaredField("directMemory"); 
  4.          directMemoryField.setAccessible(true); 
  5.          directMemoryField.set(new VM(), 8L * 1024 * 1024 * 1024); 
  6.  
  7.          Object bits = Util.unsafe.allocateInstance(Class.forName("java.nio.Bits")); 
  8.          Field maxMemory = bits.getClass().getDeclaredField("maxMemory"); 
  9.          maxMemory.setAccessible(true); 
  10.          maxMemory.set(bits, 8L * 1024 * 1024 * 1024); 
  11.  
  12.      } catch (Exception e) { 
  13.          throw new RuntimeException(e); 
  14.      } 
  15.  
  16.      System.out.println(VM.maxDirectMemory()); 
  17.  
  18.  } 

总结

先大概介绍这三个 Unsafe 用法吧,已经是我个人认为比较常用的几个 Unsafe 案例了。

Unsafe 这个东西,会用的人基本都知道不能瞎用;不会用的话,看个热闹,知道 Java 有这个机制总比不知道强对吧。当然,本文也介绍了一些实际场景可能必须得用 Unsafe,但更多还是出现在各个底层源码之中。

 

如果还有读者想看到更多骚操作的话,欢迎转发本文,阅读过 1500,继续加更一期,一键三连,这次一定。

 

责任编辑:武晓燕 来源: Kirito的技术分享
相关推荐

2021-06-08 06:13:16

React开发开发技术

2011-06-01 16:50:21

JAVA

2015-08-17 15:53:58

Linux桌面

2012-05-21 10:13:05

XCode调试技巧

2013-03-29 13:17:53

XCode调试技巧iOS开发

2011-07-19 18:11:09

iPhone 开发

2020-11-25 07:43:07

Java

2009-11-30 13:51:28

VS2003 Acti

2015-11-26 11:33:54

扫描器

2011-10-26 20:55:43

ssh 安全

2011-07-12 09:47:53

WebService

2011-05-23 18:06:24

站内优化SEO

2022-12-02 14:58:27

JavaScript技巧编程

2021-10-26 13:55:53

搞定系统设计

2020-04-08 10:21:58

bash脚本语言

2009-11-26 10:32:57

PHP代码优化

2020-04-14 09:22:47

bash脚本技巧

2017-09-20 15:07:32

数据库SQL注入技巧分享

2017-05-10 15:30:30

skynet崩溃程序

2022-02-17 13:58:38

Linux技巧文件
点赞
收藏

51CTO技术栈公众号