Java热更新
在持续交付的时代,重新部署一个新的版本只需要点击一下按钮。但在有的情况下,重新部署过程可能比较复杂,停机是不被允许的。所以JVM提供了另外一种选择:在不重启应用的前提下进行小幅改动,又称热更新。
对于某些大型的应用来说,每次的重启都需要花费大量的时间成本,所以,如果能在不重启虚拟机的情况下更新一个类,在某些业务场景下变得十分重要。比如很多脚本语言就支持热替换,例如服务器端PHP,只要替换了PHP源文件,这种改动就会立即生效,无需重启服务器。
在Java开发领域,热更新一直是一个难以解决的问题,目前的Java虚拟机只能实现方法级别的热更新,对于整个类的结构修改,仍然需要重启虚拟机。
热更新的方法
Java热更新一直不断地改进。
1.4开始JPDA引入了hotSwap机制(JPDA Enhancements),实现了debug时的method body的动态性。
1.5开始通过JVMTI实现的java.lang.instrument(Java Platform SE 8)的premain方式,实现了agent方式的动态性(JVM启动时指定agent)。
1.6增加了agentmain方式,实现了运行时动态性(通过The Attach API 绑定到具体VM)。其基本实现是通过JVMTI的retransformClass/redefineClass进行函数体级别的字节码更新,ASM、CGLib之类基本都是围绕这些在做动态性。
1.定义不同的classloader
在了解JVM ClassLoader之后(可以点击查看《Java类加载及对象创建过程详解》),可以通过定义不同的ClassLoader,监听文件变化后,通过新的ClassLoader加载新文件,然后做好相应的状态恢复,对旧ClassLoader进行卸载等动作。(旧classloader及加载的class类在没有实例引用的情况下,full gc时会被回收掉)
Tomcat的动态部署就是监听war变化,然后调用StandardContext.reload(),用新的WebContextClassLoader实例来加载war,然后初始化servlet来实现。类似的实现还有OSGi等。
这种热更新的流程如下:
重新加载类的过程
2.agentmain
笔者的项目目前采用的这种形式,虽然笔者造过好多轮子,但笔者更看好Arthas这样的开源产品。。。
agentmain热更新的原理
为了实现Java进程A与进程B之间的本地通信,热更新的JVM进程使用VirutalMachine.attach(pid)来连接需要热更新的JVM进程,然后使用virtualMachine.loadAgent加载自定义的agent(笔者查看了Arthas源码,原理也大致相同)。这个通信通道成功建立之后,那么进程A就能通知进程B去执行某些操作,从而达到监控进程B或者控制进程B的某些行为的目的。如jstack、jmap等JDK自带的工具,基本都是通过Attach机制去达成各自想要的目的的。
JVM启动的时候,在JVM内部启动了一个监听线程,这个线程的名字叫“Signal Dispatcher”,该线程的作用是,监听并处理OS的信号。
信号是一种进程通信。如平常我们用的最多的就是 kill -9 ${pid}来杀死某个进程,kill进程通过向${pid}的进程发送一个编号为“9”号的信号,来通知系统强制结束${pid}的生命周期。)
至于attach实现,在Linux下时使用文件Socket进行进程通信(对同一个文件进行读写操作,以达到信息的交互和共享)。
更详细的原理,JVM大神寒泉子有篇文章《JVM源码分析之javaagent原理完全解读》,如点击无法跳转,请查看笔者CSDN博客原文来点击超链接。
3.Arthas
Arthas是阿里巴巴最近开源出来的一个针对java的工具,主要是针对java的问题进行诊断。
跳转官网地址
这个工具可以协助完成下面这些事情(转自官网):
- 这个类是从哪个jar包加载而来的?
- 为什么会报各种类相关的Exception?
- 线上遇到问题无法debug好蛋疼,难道只能反复通过增加System.out或通过加日志再重新发布吗?
- 线上的代码为什么没有执行到这里?是由于代码没有commit?还是搞错了分支?
- 线上遇到某个用户的数据处理有问题,但线上同样无法 debug,线下无法重现。
- 是否有一个全局视角来查看系统的运行状况?
- 有什么办法可以监控到JVM的实时运行状态?
Arthas采用命令行交互模式,同时提供丰富的Tab自动补全功能,进一步方便进行问题的定位和诊断。
Arthas提供在线教程,相比一般的开源产品,上手真的很赞。
arthas实现热更新
使用Arthas三个命令就可以搞定热更新
- jad --source-only com.example.demo.arthas.user.UserController > /tmp/UserController.java
- mc /tmp/UserController.java -d /tmp
- redefine /tmp/com/example/demo/arthas/user/UserController.class
- jad命令反编译,然后可以用其它编译器,比如vim来修改源码
- mc命令来内存编译修改过的代码
- 用redefine命令加载新的字节码
JVM热更新的局限
基于Attach机制实现的热更新,更新类需要与原来的类在包名,类名,修饰符上完全一致,否则在classRedefine过程中会产生classname don't match 的异常。
例如显示这样的报错:redefineClasses exception class redefinition failed: attempted to delete a method.
具体来说,JVM热更新局限总结:
- 函数参数格式不能修改,只能修改函数内部的逻辑
- 不能增加类的函数或变量
- 函数必须能够退出,如果有函数在死循环中,无法执行更新类(笔者实验发现,死循环跳出之后,再执行类的时候,才会是更新类)
最后,限于笔者经验水平有限,欢迎读者就文中的观点提出宝贵的建议和意见。