大家好,我是君哥。今天分享一道面试题。
面试官:有一个场景,如果一个子任务的执行,要依赖两个父任务执行完成后才能执行,该怎么设计?
我:可以设置两个父任务的信号,父任务执行完成后更新信号已完成。子任务被触发时判断两个父任务是否执行完成,只有两个父任务都执行完成,子任务才会执行。如果条件不满足,就先挂起。下面是一段示例代码:
private static AtomicInteger parentTask1 = new AtomicInteger(0);
private static AtomicInteger parentTask2 = new AtomicInteger(0);
private static Object locker = new Object();
public static void main(String[] args) throws InterruptedException {
Thread childThread = new Thread(() -> {
while (true) {
try {
synchronized (locker) {
if (parentTask1.get() == 1 && parentTask2.get() == 1) {
//doSomething
break;
}
locker.wait();
}
} catch (InterruptedException e) {
e.printStackTrace();
}
}
});
childThread.start();
Thread parentThread1 = new Thread(() -> {
parentTask1.incrementAndGet();
synchronized (locker){
locker.notifyAll();
}
});
parentThread1.start();
}
父任务执行完成后唤醒子任务。
面试官:有其他方法吗?
我:也可以使用 CompletableFuture,使用任务依赖来控制任务执行,下面是一个示例代码:
CompletableFuture<Boolean> parentTask1 = CompletableFuture.supplyAsync(() -> {
System.out.println("doParentTask1");
return true;
});
CompletableFuture<Boolean> parentTask2 = CompletableFuture.supplyAsync(() -> {
System.out.println("doParentTask2");
return true;
});
CompletableFuture childTask = CompletableFuture.allOf(parentTask1, parentTask2);
childTask.thenApply(c -> {
try {
if (parentTask1.get() && parentTask2.get()){
System.out.println("doChildTask");
}
} catch(Exception e) {
e.printStackTrace();
} finally {
System.out.println("child task do error");
}
return c;
});
childTask.join();
面试官:那在分布式场景或集群环境下,前面说的方案可以解决问题吗?
我:分布式场景或者集群环境下,肯定是不能使用上面的线程调度方案的,因为多个任务可能跑在不同进程里。
面试官:现在开源的分布式任务调度框架有很多,比如 xxl-job、PowerJob,有这个场景相关的调度方案吗?
我:目前的任务调度框架支持子任务配置,但是还没有子任务依赖两个父任务执行结果这个场景的配置。
面试官:那有什么方案可以解决分布式场景下的问题吗?
我:我想到一个简单的方案,可以在数据库或缓存中维护一个父任务的状态标志,比如一张状态表保存 parentTask1、parentTask2 这两个任务状态,每当子任务被触发时先查一下这两个状态是否都被更新成 1,如果是再执行业务逻辑,否则直接退出任务。
面试官:你说的这个方案,如果只跑一次,还可以,如果任务执行比较频繁,比如两个父任务每分钟跑一次,子任务也会每分钟都会被触发。你这个方案能满足要求吗?
我:一分钟频率太高了,需要记录每次父任务的状态,而且同一个父任务每分钟执行的状态要能区分开。因为可能有极端的情况,parentTask1 上一分钟的还没有跑完,但 parentTask2 下一分钟的已经跑完了,父子任务关联会出现混乱,如果子任务依赖父任务跑批产生的数据,就会出问题。
面试官:嗯,你说的这个情况是存在的,如果让你设计,你会怎么解决呢
我:可以给父子任务赋值一个 taskId,根据这个 taskId 来做关联。比如 parentTask1 的 taskId 是 P202409100000011,parentTask2 配套的 taskId 是 P202409100000012,子任务配套的 taskId 是 P202409100000013。子任务被触发时,根据 P202409100000013 来判断 P202409100000011 和 P202409100000012 是否执行完成。子任务下一次触发时,taskId 就是 P202409100000023,下下次就是 P202409100000033,每次子任务 Id 都是根据父任务 taskId 计算出来。
面试官:这个 taskId 怎么生成和关联,有思路吗?
我:这个还是有点难度的。我说一个思路,不一定好。我们定义一张表,如下图:
图片
给这个场景定义一个自增 id,这个 id 由 parentTask1 来获取,获取后先进行记录再执行任务。parentTask2 启动时,找到 parentTask1 有值但是 parentTask2 为空的记录。先根据 parentTask1 的记录taskId 计算出自己的 taskId,然后保存数据库。而子任务被触发时,从表里查询已经有 parent_task1_id 和 parent_task2_id 并且两个状态都为 1,但是没有 child_task_id 的记录,更新 child_task_id 字段,然后执行任务逻辑。
面试官:恭喜你进入下一轮。