C++的全链路追踪方案,稍微有点高端

开发 后端
本文的知识点还是值得了解一下的,大家或许会用得到。在研究的过程中我也发现了一个基于此种方案的开源项目(call-stack-logger),感兴趣的也可以去了解了解。

背景:本人主要在做C++ SDK的开发,需要给到业务端去集成,在集成的过程中可能会出现某些功能性bug,即没有得到想要的结果。那怎么调试?

分析:这种问题其实调试起来稍微有点困难,它不像crash,当发生crash时还能拿到堆栈信息去分析,然而功能性bug没有crash,也就没法捕捉对应到当时的堆栈信息。因为不是在本地,也没法用编译器debug。那思路就剩log了,一种方式是考虑在SDK内部的关键路径下打印详细的log,当出现问题时拿到log去分析。然而总有漏的时候,谁能保证log一定打的很全面,很有可能问题就出现在没有log的函数中。

解决:基于上面的背景和问题分析,考虑是否能做一个全链路追踪的方案,把打印出整个SDK的调用路径,从哪个函数进入,从哪个函数退出等。

想法1:可以考虑在SDK的每个接口都加一个context结构体参数,记录下来函数的调用路径,这可能是比较通用有效的方案,但是SDK接口已经固定了,更改接口要面临的困难很大,业务端基本不会同意,所以这种方案不适合我们现有情况,当然一个从0开始建设的中间件和SDK可以考虑考虑。

想法2:有没有一种不用改接口,还能追踪到函数调用路径的方案?

继续沿着这个思路继续调研,我找到了gcc和clang编译器的一个编译参数:-finstrument-functions,编译时添加此参数会在函数的入口和出口处触发一个固定的回调函数,即:

  1. __cyg_profile_func_enter(void *callee, void *caller); 
  2. __cyg_profile_func_exit(void *callee, void *caller); 

参数就是callee和caller的地址,那怎么将地址解析成对应函数名?可以使用dladdr函数:

  1. int dladdr(const void *addr, Dl_info *info); 

看下下面的代码:

  1. // tracing.cc 
  2.  
  3. #include <cxxabi.h> 
  4. #include <dlfcn.h>  // for dladdr 
  5. #include <stdio.h> 
  6. #include <stdlib.h> 
  7. #include <string.h> 
  8.  
  9. #ifndef NO_INSTRUMENT 
  10. #define NO_INSTRUMENT __attribute__((no_instrument_function)) 
  11. #endif 
  12.  
  13. extern "C" __attribute__((no_instrument_function)) void __cyg_profile_func_enter(void *callee, void *caller) { 
  14.     Dl_info info; 
  15.     if (dladdr(callee, &info)) { 
  16.         int status; 
  17.         const char *name
  18.         char *demangled = abi::__cxa_demangle(info.dli_sname, NULL, 0, &status); 
  19.         if (status == 0) { 
  20.             name = demangled ? demangled : "[not demangled]"
  21.         } else { 
  22.             name = info.dli_sname ? info.dli_sname : "[no dli_sname nd std]"
  23.         } 
  24.  
  25.         printf("enter %s (%s)\n"name, info.dli_fname); 
  26.  
  27.         if (demangled) { 
  28.             free(demangled); 
  29.             demangled = NULL
  30.         } 
  31.     } 
  32.  
  33. extern "C" __attribute__((no_instrument_function)) void __cyg_profile_func_exit(void *callee, void *caller) { 
  34.     Dl_info info; 
  35.     if (dladdr(callee, &info)) { 
  36.         int status; 
  37.         const char *name
  38.         char *demangled = abi::__cxa_demangle(info.dli_sname, NULL, 0, &status); 
  39.         if (status == 0) { 
  40.             name = demangled ? demangled : "[not demangled]"
  41.         } else { 
  42.             name = info.dli_sname ? info.dli_sname : "[no dli_sname and std]"
  43.         } 
  44.         printf("exit %s (%s)\n"name, info.dli_fname); 
  45.  
  46.         if (demangled) { 
  47.             free((void *)demangled); 
  48.             demangled = NULL
  49.         } 
  50.     } 

这是测试文件:

  1. // test_trace.cc 
  2. void func1() {} 
  3.  
  4. void func() { func1(); } 
  5.  
  6. int main() { func(); } 
  7. 将test_trace.cc和tracing.cc文件同时编译链接,即可达到链路追踪的目的: 
  8. g++ test_trace.cc tracing.cc -std=c++14 -finstrument-functions -rdynamic -ldl;./a.out 
  9. 输出:enter main (./a.out
  10. enter func() (./a.out
  11. enter func1() (./a.out
  12. exit func1() (./a.out
  13. exit func() (./a.out
  14. exit main (./a.out

如果在func()中调用了一些其他的函数呢?

  1. #include <iostream> 
  2. #include <vector> 
  3.  
  4. void func1() {} 
  5.  
  6. void func() { 
  7.     std::vector<int> v{1, 2, 3}; 
  8.     std::cout << v.size(); 
  9.     func1(); 
  10.  
  11. int main() { func(); } 

再重新编译后输出会是这样:

  1. enter [no dli_sname nd std] (./a.out
  2. enter [no dli_sname nd std] (./a.out
  3. exit [no dli_sname and std] (./a.out
  4. exit [no dli_sname and std] (./a.out
  5. enter main (./a.out
  6. enter func() (./a.out
  7. enter std::allocator<int>::allocator() (./a.out
  8. enter __gnu_cxx::new_allocator<int>::new_allocator() (./a.out
  9. exit __gnu_cxx::new_allocator<int>::new_allocator() (./a.out
  10. exit std::allocator<int>::allocator() (./a.out
  11. enter std::vector<int, std::allocator<int> >::vector(std::initializer_list<int>, std::allocator<int> const&) (./a.out
  12. enter std::_Vector_base<int, std::allocator<int> >::_Vector_base(std::allocator<int> const&) (./a.out
  13. enter std::_Vector_base<int, std::allocator<int> >::_Vector_impl::_Vector_impl(std::allocator<int> const&) (./a.out
  14. enter std::allocator<int>::allocator(std::allocator<int> const&) (./a.out
  15. enter __gnu_cxx::new_allocator<int>::new_allocator(__gnu_cxx::new_allocator<int> const&) (./a.out
  16. exit __gnu_cxx::new_allocator<int>::new_allocator(__gnu_cxx::new_allocator<int> const&) (./a.out
  17. exit std::allocator<int>::allocator(std::allocator<int> const&) (./a.out
  18. exit std::_Vector_base<int, std::allocator<int> >::_Vector_impl::_Vector_impl(std::allocator<int> const&) (./a.out
  19. exit std::_Vector_base<int, std::allocator<int> >::_Vector_base(std::allocator<int> const&) (./a.out

上面我只贴出了部分信息,这显然不是我们想要的,我们只想要显示自定义的函数调用路径,其他的都想要过滤掉,怎么办?

这里可以将自定义的函数都加一个统一的前缀,在打印时只打印含有前缀的符号,这种个人认为是比较通用的方案。

下面是我过滤掉std和gnu子串的代码:

  1. if (!strcasestr(name"std") && !strcasestr(name"gnu")) { 
  2.     printf("enter %s (%s)\n"name, info.dli_fname); 
  3.  
  4. if (!strcasestr(name"std") && !strcasestr(name"gnu")) { 
  5.     printf("exit %s (%s)\n"name, info.dli_fname); 

重新编译后就会输出我想要的结果:

  1. g++ test_trace.cc tracing.cc -std=c++14 -finstrument-functions -rdynamic -ldl;./a.out 
  2. 输出:enter main (./a.out
  3. enter func() (./a.out
  4. enter func1() (./a.out
  5. exit func1() (./a.out
  6. exit func() (./a.out
  7. exit main (./a.out

还有一种方式是在编译时使用下面的参数:

  1. -finstrument-functions-exclude-file-list 

它可以排除不想要做trace的文件,但是这个参数只在gcc中可用,在clang中却不支持 ,所以上面的字符串过滤方式更通用一些。

上面只能拿到函数的名字,不能定位到具体的文件和行号,如果想要获得更多信息,需要结合bfd系列参数(bfd_find_nearest_line)和libunwind一起使用,大家可以继续研究。。。

tips1:这是一篇抛砖引玉的文章,本人不是后端开发,据我所知后端C++中有很多成熟的trace方案,大家有更好的方案可以留言,分享一波。

tips2:上面的方案可以达到链路追踪的目的,但本人最后没有应用到项目中,因为本人在做的项目对性能要求较高,使用此种方案会使整个SDK性能下降严重,无法满足需求正常运行。于是暂时放弃了链路追踪的这个想法。

本文的知识点还是值得了解一下的,大家或许会用得到。在研究的过程中我也发现了一个基于此种方案的开源项目(call-stack-logger),感兴趣的也可以去了解了解。

 

责任编辑:武晓燕 来源: 程序喵大人
相关推荐

2023-10-16 23:43:52

云原生可观测性

2023-01-30 22:34:44

Node.js前端

2022-07-22 07:59:17

日志方案

2022-05-23 08:23:24

链路追踪SleuthSpring

2022-05-19 13:33:39

系统客户端链路追踪

2024-09-06 12:24:19

2022-05-25 08:23:32

ZipKinTwitter开源项目

2021-11-18 10:01:00

Istio 全链路灰度微服务框架

2022-12-05 19:15:12

得物云原生全链路

2018-07-03 15:56:59

腾讯

2022-09-15 10:03:42

Jaeger分布式追踪系统

2023-08-24 22:13:31

2020-12-16 09:24:18

Skywalking分布式链路追踪

2024-06-07 13:04:31

2024-01-05 00:29:36

全链路灰度发布云原生

2023-08-09 08:18:22

2024-01-26 07:49:49

Go分布式链路

2023-11-13 10:41:44

Spring微服务

2020-09-11 09:44:04

微服务分布式链路

2023-02-15 18:31:48

数据存储隔离
点赞
收藏

51CTO技术栈公众号