今天和小伙伴们来聊一个稍微新一点的技术话题---CRaC。
CRaC(Coordinated Restore at Checkpoint,检查点协调恢复)是一个 OpenJDK 项目,旨在解决 Java 应用程序启动和预热时间过长的问题。
Java 应用程序启动和预热时间过长是一个老大难的问题,目前来看各方也都提出了一些不同的解决思路,之前松哥和大家聊过的 AOT 也能从一定程度上解决启动慢的问题,今天的 CRaC 算是另外一种解决思路。
一、CRaC是什么
CRaC 允许对运行中的 JVM 进行“快照”,并将其状态(包括应用)存储到磁盘中。
之后,在另一个时间点,可以将 JVM 从保存的检查点恢复到内存中。
这个功能意味着你可以启动应用程序、预热并创建检查点,然后从这个检查点快速恢复,从而显著减少启动时间。
二、CRaC的原理
CRaC 的工作原理基于用户空间检查点和恢复(CRIU),这是一个为 Linux 实现检查点和恢复功能的项目。
CRIU 允许冻结容器或单个应用程序并从保存的检查点文件中恢复它。
CRaC 采用了 CRIU 的通用方法,并增加了一些增强和调整,使其适用于 Java 应用程序。
一般来说,CRaC 的执行步骤如下:
- 创建检查点:在应用程序运行并达到稳定状态后,可以创建一个检查点,这个检查点包含了 JVM 的状态和应用程序的数据。
- 存储检查点:检查点数据被存储到磁盘上,以便之后可以从中恢复。
- 恢复检查点:当需要启动应用程序时,可以直接从检查点恢复,而不是从头开始启动和预热 JVM。
这个感觉就有点类似于大伙平时使用的 VMWare 的快照功能,在某个时间点为系统拍摄一个快照,下次可以直接从快照启动,就比从头开始启动要快很多。CRaC 所拍快照中不仅包含 JVM,也可以包含你的应用信息。
三、CRaC 的应用场景
CRaC 特别适用于需要快速启动和恢复的场景,比如:
- 云原生环境:在微服务和无服务器架构中,服务可能需要频繁地启动和停止,CRaC 可以显著减少服务的启动时间。
- 开发和测试环境:开发者可以在开发和测试过程中快速恢复应用程序到某个已知状态,提高开发效率。
- 灾难恢复:在系统发生故障时,可以快速从最近的检查点恢复服务,减少系统停机时间。
四、支持版本
从 Spring Boot3.2/Spring6.1 开始对 CRaC 的提供支持,所以如果大伙想体验 CRaC,需要选择合适的 SpringBoot 版本。
同时,由于前文提到的 CRaC 依赖于 Linux 特有的 CRIU,因此 CRaC 目前仅在Linux操作系统上支持。Windows 和 Mac 则不支持。
五、实践
首先我们需要安装支持 CRaC 的 JDK,目前主要有以下两种 JDK 支持 CRaC:
- Azul Zulu 21.0.1 + CRaC 版本支持 CRaC,适用于 x64 和 aarch64 CPU 架构,包括 JDK17 和 JDK21。
选择支持 CRaC 的 JDK
- Liberica JDK 17 和 Liberica JDK 21 提供了对 CRaC 的支持。
接下来在项目中添加 CRaC 依赖:
<dependency>
<groupId>org.crac</groupId>
<artifactId>crac</artifactId>
<version>1.5.0</version>
</dependency>
OK,如此之后,我们的准备工作就算完成了。
接下来我们需要在项目启动的时候,指定检查点的位置,并给出生成检查点的时机:
java -Dspring.context.checkpoint=onRefresh -XX:CRaCCheckpointTo=./tmp_checkpoint -jar javaboy-crac-3.3.5.jar
在上面的启动脚本中,我们通过设置 JVM 系统属性 -Dspring.context.checkpoint=onRefresh 来启用自动检查点。这个属性会在 Spring 的 LifecycleProcessor.onRefresh 阶段自动创建检查点,这个阶段在所有非延迟初始化的 Singleton 实例化和 InitializingBean#afterPropertiesSet 回调调用之后,但在生命周期启动和 ContextRefreshedEvent 发布之前。也就是说在这个时机创建检查点(拍摄快照)。
当然,如果你想等应用程序完全启动之后再拍摄快照,也是可以的。
先用如下命令启动应用程序:
java -XX:CRaCCheckpointTo=./tmp_checkpoint -jar javaboy-crac-3.3.5.jar
等待应用程序完全启动后,在另一个终端执行以下命令来手动触发检查点:
jcmd <pid> JDK.checkpoint
其中 <pid> 是应用程序的进程ID,这将创建检查点并关闭应用程序。检查点文件将存储在指定的文件夹中。
手动执行检查点生成的好处是,这个检查点包含了框架代码和应用程序代码,因此启动速度会更快,因为框架已经加载并启动了应用程序。
无论哪种方式生成检查点,只要有了检查点,最后一步就是使用这个检查点了。
我们可以利用检查点生成的文件来快速拉起应用程序,相关命令如下:
java -XX:CRaCRestoreFrom=./tmp_checkpoint
总结下就是,自动检查点适合快速实现和无需代码更改的场景,而手动检查点提供了更大的灵活性,允许在应用程序完全预热后创建检查点,从而可能实现更快的启动时间。
好啦,感兴趣的小伙伴可以去尝试下,记得选择合适的操作系统、JDK 版本以及 Spring Boot 版本哦~