基于SpringBoot实现让日志像诗一样有韵律

开发 架构
在传统系统中,如果能够提供日志输出,基本上已经能够满足需求的。但一旦将系统拆分成两套及以上的系统,再加上负载均衡等,调用链路就变得复杂起来。

 [[392965]]

前言

在传统系统中,如果能够提供日志输出,基本上已经能够满足需求的。但一旦将系统拆分成两套及以上的系统,再加上负载均衡等,调用链路就变得复杂起来。

特别是进一步向微服务方向演化,如果没有日志的合理规划、链路追踪,那么排查日志将变得异常困难。

比如系统A、B、C,调用链路为A -> B -> C,如果每套服务都是双活,则调用路径有2的三次方种可能性。如果系统更多,服务更多,调用链路则会成指数增长。

因此,无论是几个简单的内部服务调用,还是复杂的微服务系统,都需要通过一个机制来实现日志的链路追踪。让你系统的日志输出,像诗一样有形式美,又有和谐的韵律。

日志追踪其实已经有很多现成的框架了,比如Sleuth、Zipkin等组件。但这不是我们要讲的重点,本文重点基于Spring Boot、LogBack来手写实现一个简单的日志调用链路追踪功能。基于此实现模式,大家可以更细粒度的去实现。

Spring Boot中集成Logback

Spring Boot本身就内置了日志功能,这里使用logback日志框架,并对输出结果进行格式化。先来看一下SpringBoot对Logback的内置集成,依赖关系如下。当项目中引入了:

  1. <dependency> 
  2.     <groupId>org.springframework.boot</groupId> 
  3.     <artifactId>spring-boot-starter-web</artifactId> 
  4. </dependency> 

spring-boot-starter-web中间接引入了:

  1. <dependency> 
  2.   <groupId>org.springframework.boot</groupId> 
  3.   <artifactId>spring-boot-starter</artifactId> 
  4. </dependency> 

spring-boot-starter又引入了logging的starter:

  1. <dependency> 
  2.   <groupId>org.springframework.boot</groupId> 
  3.   <artifactId>spring-boot-starter-logging</artifactId> 
  4. </dependency> 

在logging中真正引入了所需的logback包:

  1. <dependency> 
  2.   <groupId>ch.qos.logback</groupId> 
  3.   <artifactId>logback-classic</artifactId> 
  4. </dependency> 
  5. <dependency> 
  6.   <groupId>org.apache.logging.log4j</groupId> 
  7.   <artifactId>log4j-to-slf4j</artifactId> 
  8. </dependency> 
  9. <dependency> 
  10.   <groupId>org.slf4j</groupId> 
  11.   <artifactId>jul-to-slf4j</artifactId> 
  12. </dependency> 

因此,我们使用时,只需将logback-spring.xml配置文件放在resources目录下即可。理论上配置文件命名为logback.xml也是支持的,但Spring Boot官网推荐使用的名称为:logback-spring.xml。

然后,在logback-spring.xml中进行日志输出的配置即可。这里不贴全部代码了,只贴出来相关日志输出格式部分,以控制台输出为例:

在value属性的表达式中,我们新增了自定义的变量值requestId,通过“[%X{requestId}]”的形式来展示。

这个requestId便是我们用来追踪日志的唯一标识。如果一个请求,从头到尾都使用了同一个requestId便可以把整个请求链路串联起来。如果系统还基于EKL等日志搜集工具进行统一收集,就可以更方便的查看整个日志的调用链路了。

那么,这个requestId变量是如何来的,又存储在何处呢?要了解这个,我们要先来了解一下日志框架提供的MDC功能。

什么是MDC?

MDC(Mapped Diagnostic Contexts) 是一个线程安全的存放诊断日志的容器。MDC是slf4j提供的适配其他具体日志实现包的工具类,目前只有logback和log4j支持此功能。

MDC是线程独立、线程安全的,通常无论是HTTP还是RPC请求,都是在各自独立的线程中完成的,这与MDC的机制可以很好地契合。

在使用MDC功能时,我们主要使用是put方法,该方法间接的调用了MDCAdapter接口的put方法。

看一下接口MDCAdapter其中一个实现类BasicMDCAdapter中的代码来:

  1. public class BasicMDCAdapter implements MDCAdapter { 
  2.  
  3.     private InheritableThreadLocal<Map<String, String>> inheritableThreadLocal = new InheritableThreadLocal<Map<String, String>>() { 
  4.         @Override 
  5.         protected Map<String, String> childValue(Map<String, String> parentValue) { 
  6.             if (parentValue == null) { 
  7.                 return null
  8.             } 
  9.             return new HashMap<String, String>(parentValue); 
  10.         } 
  11.     }; 
  12.  
  13.     public void put(String key, String val) { 
  14.         if (key == null) { 
  15.             throw new IllegalArgumentException("key cannot be null"); 
  16.         } 
  17.         Map<String, String> map = inheritableThreadLocal.get(); 
  18.         if (map == null) { 
  19.             map = new HashMap<String, String>(); 
  20.             inheritableThreadLocal.set(map); 
  21.         } 
  22.         map.put(key, val); 
  23.     } 
  24.     // ... 

通过源码可以看出内部持有一个InheritableThreadLocal的实例,该实例中通过HashMap来保存context数据。

此外,MDC提供了put/get/clear等几个核心接口,用于操作ThreadLocal中存储的数据。而在logback.xml中,可在layout中通过声明“%X{requestId}”这种形式来获得MDC中存储的数据,并进行打印此信息。

基于MDC的这些特性,因此它经常被用来做日志链路跟踪、动态配置用户自定义信息(比如requestId、sessionId等)等场景。

实战使用

上面了解了一些基础的原理知识,下面我们就来看看如何基于日志框架的MDC功能实现日志的追踪。

工具类准备

首先定义一些工具类,这个强烈建议大家将一些操作通过工具类的形式进行实现,这是写出优雅代码的一部分,也避免后期修改时每个地方都需要改。

TraceID(我们定义参数名为requestId)的生成类,这里采用UUID进行生成,当然可根据你的场景和需要,通过其他方式进行生成。

  1. public class TraceIdUtils { 
  2.  
  3.     /** 
  4.      * 生成traceId 
  5.      * 
  6.      * @return TraceId 基于UUID 
  7.      */ 
  8.     public static String getTraceId() { 
  9.         return UUID.randomUUID().toString().replace("-"""); 
  10.     } 

对Context内容的操作工具类TraceIdContext:

  1. public class TraceIdContext { 
  2.  
  3.     public static final String TRACE_ID_KEY = "requestId"
  4.  
  5.     public static void setTraceId(String traceId) { 
  6.         if (StringLocalUtil.isNotEmpty(traceId)) { 
  7.             MDC.put(TRACE_ID_KEY, traceId); 
  8.         } 
  9.     } 
  10.  
  11.     public static String getTraceId() { 
  12.         String traceId = MDC.get(TRACE_ID_KEY); 
  13.         return traceId == null ? "" : traceId; 
  14.     } 
  15.  
  16.     public static void removeTraceId() { 
  17.         MDC.remove(TRACE_ID_KEY); 
  18.     } 
  19.  
  20.     public static void clearTraceId() { 
  21.         MDC.clear(); 
  22.     } 
  23.  

通过工具类,方便所有服务统一使用,比如requestId可以统一定义,避免每处都不一样。这里不仅提供了set方法,还提供了移除和清理的方法。

需要注意的是,MDC.clear()方法的使用。如果所有的线程都是通过new Thread方法建立的,线程消亡之后,存储的数据也随之消亡,这倒没什么。但如果采用的是线程池的情况时,线程是可以被重复利用的,如果之前线程的MDC内容没有清除掉,再次从线程池中获取这个线程,会取出之前的数据(脏数据),会导致一些不可预期的错误,所以当前线程结束后一定要清掉。

Filter拦截

既然我们要实现日志链路的追踪,最直观的思路就是在访问的源头生成一个请求ID,然后一路传下去,直到这个请求完成。这里以Http为例,通过Filter来拦截请求,并将数据通过Http的Header来存储和传递数据。涉及到系统之间调用时,调用方设置requestId到Header中,被调用方从Header中取即可。

Filter的定义:

  1. public class TraceIdRequestLoggingFilter extends AbstractRequestLoggingFilter { 
  2.  
  3.     @Override 
  4.     protected void beforeRequest(HttpServletRequest request, String message) { 
  5.         String requestId = request.getHeader(TraceIdContext.TRACE_ID_KEY); 
  6.         if (StringLocalUtil.isNotEmpty(requestId)) { 
  7.             TraceIdContext.setTraceId(requestId); 
  8.         } else { 
  9.             TraceIdContext.setTraceId(TraceIdUtils.getTraceId()); 
  10.         } 
  11.     } 
  12.  
  13.     @Override 
  14.     protected void afterRequest(HttpServletRequest request, String message) { 
  15.         TraceIdContext.removeTraceId(); 
  16.     } 

在beforeRequest方法中,从Header中获取requestId,如果获取不到则视为“源头”,生成一个requestId,设置到MDC当中。当这个请求完成时,将设置的requestId移除,防止上面说到的线程池问题。系统中每个服务都可以通过上述方式实现,整个请求链路就串起来了。

当然,上面定义的Filter是需要进行初始化的,在Spring Boot中实例化方法如下:

  1. @Configuration 
  2. public class TraceIdConfig { 
  3.  
  4.     @Bean 
  5.     public TraceIdRequestLoggingFilter traceIdRequestLoggingFilter() { 
  6.         return new TraceIdRequestLoggingFilter(); 
  7.     } 

针对普通的系统调用,上述方式基本上已经能满足了,实践中可根据自己的需要在此基础上进行扩展。这里使用的是Filter,也可以通过拦截器、Spring的AOP等方式进行实现。

微服务中的Feign

如果你的系统是基于Spring Cloud中的Feign组件进行调用,则可通过实现RequestInterceptor拦截器来达到添加requestId效果。具体实现如下:

  1. @Configuration 
  2. public class FeignConfig implements RequestInterceptor { 
  3.  
  4.     @Override 
  5.     public void apply(RequestTemplate requestTemplate) { 
  6.         requestTemplate.header(TraceIdContext.TRACE_ID_KEY, TraceIdContext.getTraceId()); 
  7.     } 
  8.  

结果验证

当完成上述操作之后,对一个Controller进行请求,会打印如下的日志:

  1. 2021-04-13 10:58:31.092 cloud-sevice-consumer-demo [http-nio-7199-exec-1] INFO  [ef76526ca96242bc8e646cdef3ab31e6] c.b.demo.controller.CityController - getCity 
  2. 2021-04-13 10:58:31.185 cloud-sevice-consumer-demo [http-nio-7199-exec-1] WARN  [ef76526ca96242bc8e646cdef3ab31e6] o.s.c.o.l.FeignBlockingLoadBalancerClient - 

可以看到requestID已经被成功添加。当我们排查日志时,只需找到请求的关键信息,然后根据关键信息日志中的requestId值就可以把整个日志串联起来。

小结

最后,我们来回顾一下日志追踪的整个过程:当请求到达第一个服务器,服务检查requestId是否存在,如果不存在,则创建一个,放入MDC当中;服务调用其他服务时,再通过Header将requestId进行传递;而每个服务的logback配置requestId的输出。从而达到从头到尾将日志串联的效果。

在学习本文,如果你只学到了日志追踪,那是一种损失,因为文中还涉及到了SpringBoot对logback的集成、MDC的底层实现及坑、过滤器的使用、Feign的请求拦截器等。如果感兴趣,每个都可以发散一下,学习到更多的知识点。

责任编辑:武晓燕 来源: 程序新视界
相关推荐

2017-05-22 10:33:14

PythonJuliaCython

2011-10-24 13:07:00

2009-12-08 18:06:12

戴尔存储动车组

2009-12-08 14:26:13

大型网络运维

2023-04-05 14:19:07

FlinkRedisNoSQL

2021-10-02 10:36:00

YAML编程语言软件开发

2012-10-26 12:33:58

视频会议视频通信华为

2022-07-28 14:46:01

人工智能机器人计算机科学

2013-12-31 09:19:23

Python调试

2022-12-21 15:56:23

代码文档工具

2023-05-23 13:59:41

RustPython程序

2013-12-17 09:02:03

Python调试

2015-11-06 16:20:36

107

2015-11-09 10:07:11

107

2013-07-05 14:59:50

程序员GPU

2022-12-30 10:48:27

2020-03-09 10:00:35

人工智能机器学习技术

2021-04-23 15:13:16

算法模型技术

2021-05-20 08:37:32

multiprocesPython线程

2013-08-22 10:17:51

Google大数据业务价值
点赞
收藏

51CTO技术栈公众号