NacosSync双向复制源码分析

开发 前端
通过开源同步工具NacosSync的分析,对我们实现自定义的同步工具提供参考。文本就同步任务分发与Nacos集群之间、从zk到Nacos的同步源码做个分析。

[[421895]]

引言

通过开源同步工具NacosSync的分析,对我们实现自定义的同步工具提供参考。文本就同步任务分发与Nacos集群之间、从zk到Nacos的同步源码做个分析。

一、内容提要

任务和配置入库

  • 集群配置入库
  • 同步任务入库

同步任务分发

  • 每三秒调度一次任务列表
  • 新增任务发布同步任务事件SyncTaskEvent并由listenerSyncTaskEvent处理
  • 删除任务发布删除任务事件DeleteTaskEvent并由listenerDeleteTaskEvent处理
  • 任务的发布和订阅使用Guava的EventBus

Nacos集群之间同步逻辑

  • 两个Nacos集群之间进行同步,同步任务在Service维度(AppId)建立
  • 对源集群注册监听获取注册节点列表,通过剔除无效节点后,将新的节点注册到目标集群

从zk集群同步到Nacos集群

  • NacosSync从zk集群同步到Nacos只支持dubbo路径
  • 第一次先同步所有节点过去,再监听源集群路径变化,同步到目标集群

二、任务和配置入库

入库部分比较简单,只列出入口和处理类。

集群配置入库

请求入口:ClusterApi#clusterAdd

入库处理:ClusterAddProcessor#process

  1. clusterAccessService.insert(clusterDO); 

同步任务入库

请求入口:TaskApi#taskAdd

入库处理:TaskAccessService#addTask

  1. taskAccessService.addTask(taskDO); 

三、同步任务分发

同步任务入库了,紧着需要任务进行分发。代码翻到QuerySyncTaskTimer实现了springboot的CommandLineRunner接口。

定时任务调度

  1. public void run(String... args) { 
  2.  scheduledExecutorService.scheduleWithFixedDelay(new CheckRunningStatusThread(), 0, 3000, 
  3.  TimeUnit.MILLISECONDS); 

备注: 定时任务每3秒钟调度一次。

调度任务执行

  1. private class CheckRunningStatusThread implements Runnable { 
  2.  
  3.     @Override 
  4.     public void run() { 
  5.  
  6.         Long start = System.currentTimeMillis(); 
  7.         try { 
  8.            // 注解@1 
  9.             Iterable<TaskDO> taskDOS = taskAccessService.findAll(); 
  10.             taskDOS.forEach(taskDO -> { 
  11.                // 注解@2  
  12.                 if ((null != skyWalkerCacheServices.getFinishedTask(taskDO))) { 
  13.                     return
  14.                 } 
  15.                // 注解@3 
  16.                 if (TaskStatusEnum.SYNC.getCode().equals(taskDO.getTaskStatus())) { 
  17.                     eventBus.post(new SyncTaskEvent(taskDO)); 
  18.                     log.info("从数据库中查询到一个同步任务,发出一个同步事件:" + taskDO); 
  19.                 } 
  20.         // 注解@4 
  21.                 if (TaskStatusEnum.DELETE.getCode().equals(taskDO.getTaskStatus())) { 
  22.                     eventBus.post(new DeleteTaskEvent(taskDO)); 
  23.                     log.info("从数据库中查询到一个删除任务,发出一个同步事件:" + taskDO); 
  24.                 } 
  25.             }); 
  26.  
  27.         } catch (Exception e) { 
  28.             log.warn("CheckRunningStatusThread Exception", e); 
  29.         } 
  30.     // 注解@5 
  31.         metricsManager.record(MetricsStatisticsType.DISPATCHER_TASK, System.currentTimeMillis() - start); 
  32.     } 

注解@1 查询所有同步任务

注解@2 过滤已完成的任务

注解@3 发布一个同步任务事件SyncTaskEvent

注解@4 发布一个删除任务事件DeleteTaskEvent

注解@5 通过metric统计本次调度任务执行的耗时情况

小结: 当有新增任务或者删除任务时通过Guava的EventBus发布一个同步事件或删除事件,该检测3秒执行一次。

四、同步事件处理

代码EventListener#listenerSyncTaskEvent订阅了同步事件SyncTaskEvent。

  1. @Subscribe 
  2. public void listenerSyncTaskEvent(SyncTaskEvent syncTaskEvent) { 
  3.  
  4.     try { 
  5.         long start = System.currentTimeMillis(); 
  6.        // 注解@6 
  7.         if (syncManagerService.sync(syncTaskEvent.getTaskDO())) {     
  8.            // 注解@7 
  9.             skyWalkerCacheServices.addFinishedTask(syncTaskEvent.getTaskDO()); 
  10.            // 注解@8 
  11.             metricsManager.record(MetricsStatisticsType.SYNC_TASK_RT, System.currentTimeMillis() - start); 
  12.         } else { 
  13.             log.warn("listenerSyncTaskEvent sync failure"); 
  14.         }                 
  15.     } catch (Exception e) { 
  16.         log.warn("listenerSyncTaskEvent process error", e); 
  17.     } 
  18.  

注解@6 执行同步任务

注解@7 标记该同步任务完成

注解@8 记录任务执行时间

代码EventListener#listenerDeleteTaskEvent订阅了删除任务事件DeleteTaskEvent。

  1. @Subscribe 
  2. public void listenerDeleteTaskEvent(DeleteTaskEvent deleteTaskEvent) { 
  3.  
  4.     try { 
  5.         long start = System.currentTimeMillis(); 
  6.         if (syncManagerService.delete(deleteTaskEvent.getTaskDO())) { 
  7.             skyWalkerCacheServices.addFinishedTask(deleteTaskEvent.getTaskDO()); 
  8.             metricsManager.record(MetricsStatisticsType.DELETE_TASK_RT, System.currentTimeMillis() - start); 
  9.         } else { 
  10.             log.warn("listenerDeleteTaskEvent delete failure"); 
  11.         }                 
  12.     } catch (Exception e) { 
  13.         log.warn("listenerDeleteTaskEvent process error", e); 
  14.     } 
  15.  

小结: listenerSyncTaskEvent和listenerDeleteTaskEvent代码结构一致,执行任务逻辑,执行完缓存已完成任务,最后记录耗时情况。

五、Nacos集群之间同步逻辑

先看下Nacos集群之间的同步,代码在NacosSyncToNacosServiceImpl#sync部分。

执行同步逻辑

  1. @Override 
  2. public boolean sync(TaskDO taskDO) { 
  3.   String taskId = taskDO.getTaskId(); 
  4.   try { 
  5.     // 注解@7 
  6.     NamingService sourceNamingService = 
  7.       nacosServerHolder.get(taskDO.getSourceClusterId(), taskDO.getNameSpace()); 
  8.  
  9.     // 注解@8 
  10.     NamingService destNamingService = nacosServerHolder.get(taskDO.getDestClusterId(), taskDO.getNameSpace()); 
  11.  
  12.  
  13.     this.listenerMap.putIfAbsent(taskId, event -> { 
  14.       if (event instanceof NamingEvent) { 
  15.         try { 
  16.           // 注解@9 
  17.           List<Instance> sourceInstances = sourceNamingService.getAllInstances(taskDO.getServiceName(), 
  18.                                                                                getGroupNameOrDefault(taskDO.getGroupName()), new ArrayList<>(), true); 
  19.  
  20.           // 注解@10 
  21.           this.removeInvalidInstance(taskDO, destNamingService, sourceInstances); 
  22.  
  23.           // 注解@11 
  24.           if (sourceInstances.isEmpty()) { 
  25.             sourceInstanceSnapshot.remove(taskId); 
  26.             return
  27.           } 
  28.  
  29.           // 注解@12 
  30.           this.syncNewInstance(taskDO, destNamingService, sourceInstances); 
  31.         } catch (Exception e) { 
  32.           log.error("event process fail, taskId:{}", taskId, e); 
  33.           metricsManager.recordError(MetricsStatisticsType.SYNC_ERROR); 
  34.         } 
  35.       } 
  36.     }); 
  37.  
  38.     sourceNamingService.subscribe(taskDO.getServiceName(), getGroupNameOrDefault(taskDO.getGroupName()), 
  39.                                   listenerMap.get(taskId)); 
  40.   } catch (Exception e) { 
  41.     log.error("sync task from nacos to nacos was failed, taskId:{}", taskId, e); 
  42.     metricsManager.recordError(MetricsStatisticsType.SYNC_ERROR); 
  43.     return false
  44.   } 
  45.   return true

注解@7 创建源集群的NameService

注解@8 创建目标集群的NameService

注解@9 获取服务注册的实例

注解@10 先删除已失效的节点

  1. private void removeInvalidInstance(TaskDO taskDO, NamingService destNamingService, 
  2.     List<Instance> sourceInstances) throws NacosException { 
  3.  
  4.     String taskId = taskDO.getTaskId(); 
  5.     if (this.sourceInstanceSnapshot.containsKey(taskId)) { 
  6.         // 注解@10.1 
  7.         Set<String> oldInstanceKeys = this.sourceInstanceSnapshot.get(taskId); 
  8.         List<String> newInstanceKeys = sourceInstances.stream().map(this::composeInstanceKey) 
  9.             .collect(Collectors.toList()); 
  10.         // 注解@10.2 
  11.         Collection<String> instanceKeys = Collections.subtract(oldInstanceKeys, newInstanceKeys); 
  12.         for (String instanceKey : instanceKeys) { 
  13.             log.info("任务Id:{},移除无效同步实例:{}", taskId, instanceKey); 
  14.             String[] split = instanceKey.split(":", -1); 
  15.             // 注解@10.3 
  16.             destNamingService 
  17.                 .deregisterInstance(taskDO.getServiceName(), getGroupNameOrDefault(taskDO.getGroupName()), split[0], 
  18.                     Integer.parseInt(split[1])); 
  19.  
  20.         } 
  21.     } 

注解@10.1 缓存的旧节点信息

注解@10.2 从旧节点中剥离出废弃无效的节点

注解@10.3 将废弃无效节点注销

注解@11 如果同步实例已经为空代表该服务所有实例已经下线,清除本地持有快照

注解@12 同步新节实例到目标集群并更新缓存

  1. private void syncNewInstance(TaskDO taskDO, NamingService destNamingService, 
  2.     List<Instance> sourceInstances) throws NacosException { 
  3.     Set<String> latestSyncInstance = new TreeSet<>(); 
  4.     // 再次添加新实例 
  5.     String taskId = taskDO.getTaskId(); 
  6.     // 注解@12.1 
  7.     Set<String> instanceKeys = sourceInstanceSnapshot.get(taskId); 
  8.     // 注解@12.2 
  9.     for (Instance instance : sourceInstances) { 
  10.         if (needSync(instance.getMetadata())) { 
  11.             String instanceKey = composeInstanceKey(instance); 
  12.             // 注解@12.3 
  13.             if (CollectionUtils.isEmpty(instanceKeys) || !instanceKeys.contains(instanceKey)) { 
  14.                 destNamingService.registerInstance(taskDO.getServiceName(), 
  15.                     getGroupNameOrDefault(taskDO.getGroupName()), 
  16.                     buildSyncInstance(instance, taskDO)); 
  17.             } 
  18.             // 注解@12.4 
  19.             latestSyncInstance.add(instanceKey); 
  20.         } 
  21.     } 
  22.     if (CollectionUtils.isNotEmpty(latestSyncInstance)) { 
  23.  
  24.         log.info("任务Id:{},已同步实例个数:{}", taskId, latestSyncInstance.size()); 
  25.         // 注解@12.5 
  26.         sourceInstanceSnapshot.put(taskId, latestSyncInstance); 
  27.     } 

注解@12.1 缓存的旧节点信息

注解@12.2 遍历新节点信息

注解@12.3 当新节点信息不为空并且旧节点不存在,则注册到目标集群

注解@12.4 收集新节点

注解@12.5 更新缓存节点信息

小结: 在两个Nacos集群之间进行同步,同步任务在Service维度(AppId)建立。通过对源集群注册监听获取注册节点列表,通过剔除无效节点后,将新的节点注册到目标集群的过程。

执行删除任务逻辑

代码翻到NacosSyncToNacosServiceImpl#delete部分

  1. public boolean delete(TaskDO taskDO) { 
  2.     try { 
  3.         NamingService sourceNamingService = 
  4.             nacosServerHolder.get(taskDO.getSourceClusterId(), taskDO.getNameSpace()); 
  5.         NamingService destNamingService = nacosServerHolder.get(taskDO.getDestClusterId(), taskDO.getNameSpace()); 
  6.         // 注解@13 
  7.         sourceNamingService 
  8.             .unsubscribe(taskDO.getServiceName(), getGroupNameOrDefault(taskDO.getGroupName()), 
  9.                 listenerMap.remove(taskDO.getTaskId())); 
  10.         sourceInstanceSnapshot.remove(taskDO.getTaskId()); 
  11.  
  12.         // 注解@14 
  13.         List<Instance> sourceInstances = sourceNamingService 
  14.             .getAllInstances(taskDO.getServiceName(), getGroupNameOrDefault(taskDO.getGroupName()), 
  15.                 new ArrayList<>(), false); 
  16.         for (Instance instance : sourceInstances) { 
  17.             if (needSync(instance.getMetadata())) { 
  18.                // 注销操作 
  19.                 destNamingService 
  20.                     .deregisterInstance(taskDO.getServiceName(), getGroupNameOrDefault(taskDO.getGroupName()), 
  21.                         instance.getIp(), 
  22.                         instance.getPort()); 
  23.             } 
  24.         } 
  25.     } catch (Exception e) { 
  26.         log.error("delete task from nacos to nacos was failed, taskId:{}", taskDO.getTaskId(), e); 
  27.         metricsManager.recordError(MetricsStatisticsType.DELETE_ERROR); 
  28.         return false
  29.     } 
  30.     return true

注解@13 移除该任务(service)源集群订阅

注解@14 删除目标集群中同步的实例列表

小结: 删除逻辑比较简单,取消源集群订阅,将目标集群的注册节点移除。

六、从zk集群同步到Nacos集群

再看从zk集群同步到Nacos集群,代码翻到ZookeeperSyncToNacosServiceImpl#sync()

  1. @Override 
  2. public boolean sync(TaskDO taskDO) { 
  3.     try { 
  4.         if (treeCacheMap.containsKey(taskDO.getTaskId())) { 
  5.             return true
  6.         } 
  7.         // 注解@1 
  8.         TreeCache treeCache = getTreeCache(taskDO); 
  9.         // 注解@2 
  10.         NamingService destNamingService = nacosServerHolder.get(taskDO.getDestClusterId(), null); 
  11.         // 注解@3 
  12.         registerAllInstances(taskDO, destNamingService); 
  13.         // 注解@4 
  14.         Objects.requireNonNull(treeCache).getListenable().addListener((client, event) -> { 
  15.             try { 
  16.                 String path = event.getData().getPath(); 
  17.                 Map<String, String> queryParam = parseQueryString(path); 
  18.                 if (isMatch(taskDO, queryParam) && needSync(queryParam)) { 
  19.                     processEvent(taskDO, destNamingService, event, path, queryParam); 
  20.                 } 
  21.             } catch (Exception e) { 
  22.                 // ... 
  23.             } 
  24.         }); 
  25.     } catch (Exception e) { 
  26.         // ... 
  27.         metricsManager.recordError(MetricsStatisticsType.SYNC_ERROR); 
  28.         return false
  29.     } 
  30.     return true

注解@1 监听zk源集群 路径为「/dubbo」

注解@2 目标Nacos集群构建

注解@3 初次执行任务统一注册所有实例

  1. private void registerAllInstances(TaskDO taskDO, NamingService destNamingService) throws Exception { 
  2.     CuratorFramework zk =  zookeeperServerHolder.get(taskDO.getSourceClusterId(), ""); 
  3.     // 注解@3.1 
  4.     if(!ALL_SERVICE_NAME_PATTERN.equals(taskDO.getServiceName())) { 
  5.         registerALLInstances0(taskDO, destNamingService, zk, taskDO.getServiceName()); 
  6.     } else { 
  7.         // 注解@3.2 
  8.         List<String> serviceList = zk.getChildren().forPath(DUBBO_ROOT_PATH); 
  9.         for(String serviceName : serviceList) { 
  10.             registerALLInstances0(taskDO, destNamingService, zk, serviceName); 
  11.         } 
  12.     } 

注解@3.1 同步特定服务注册节点(Dubbo)

注解@3.2 同步全部所有的zk节点到Nacos

注解@4 注册zk监听监听新增和更新的同步

  1. private void processEvent(TaskDO taskDO, NamingService destNamingService, TreeCacheEvent event, String path, 
  2.                           Map<String, String> queryParam) throws NacosException { 
  3.     if(!com.alibaba.nacossync.util.StringUtils.isDubboProviderPath(path)) { 
  4.         return
  5.     } 
  6.  
  7.     Map<String, String> ipAndPortParam = parseIpAndPortString(path); 
  8.     Instance instance = buildSyncInstance(queryParam, ipAndPortParam, taskDO); 
  9.     String serviceName = queryParam.get(INTERFACE_KEY); 
  10.     switch (event.getType()) { 
  11.         case NODE_ADDED: 
  12.         case NODE_UPDATED: 
  13.             // 注解@4.1 
  14.             destNamingService.registerInstance( 
  15.                 getServiceNameFromCache(serviceName, queryParam), instance); 
  16.             break; 
  17.         case NODE_REMOVED: 
  18.             // 注解@4.2 
  19.             destNamingService.deregisterInstance( 
  20.                 getServiceNameFromCache(serviceName, queryParam), 
  21.                 ipAndPortParam.get(INSTANCE_IP_KEY), 
  22.                 Integer.parseInt(ipAndPortParam.get(INSTANCE_PORT_KEY))); 
  23.             nacosServiceNameMap.remove(serviceName); 
  24.             break; 
  25.         default
  26.             break; 
  27.     } 

注解@4.1 同步节点新增更新到目标集群

注解@4.2 源集群节点被删除同步注销目标集群

小结: NacosSync从zk集群同步到Nacos只支持dubbo路径,可参考基于二次改造。第一次先同步所有节点过去,再监听源集群路径变化,同步到目标集群。

本文转载自微信公众号「瓜农老梁」,可以通过以下二维码关注。转载本文请联系瓜农老梁公众号。

 

责任编辑:武晓燕 来源: 瓜农老梁
相关推荐

2021-08-30 07:49:32

NacosSync双向复制

2010-05-24 15:21:37

MySQL双向

2021-01-22 09:47:22

鸿蒙HarmonyOS应用开发

2009-03-16 13:44:29

双向复制实例MySQL

2021-04-30 15:06:34

鸿蒙HarmonyOS应用

2023-10-17 17:13:14

内存程序源码

2014-08-26 11:11:57

AsyncHttpCl源码分析

2011-03-15 11:33:18

iptables

2011-05-26 10:05:48

MongoDB

2024-11-04 06:00:00

redis双向链表

2021-11-11 17:40:08

WatchdogAndroid源码分析

2011-05-26 16:18:51

Mongodb

2020-11-19 07:41:51

ArrayBlocki

2011-08-16 09:34:34

Nginx

2021-03-23 09:17:58

SpringMVCHttpServletJavaEE

2021-05-17 09:50:06

Kubebuilde源码CURD

2021-08-09 07:58:36

Nacos 服务注册源码分析

2024-06-13 07:55:19

2021-07-06 09:29:38

Cobar源码AST

2020-11-25 14:28:56

DelayedWork
点赞
收藏

51CTO技术栈公众号