本文转载自微信公众号「程序喵大人」,作者程序喵大人。转载本文请联系程序喵大人公众号。
大家好,我是程序喵,众所周知,前两天,小破站又上市了,慷慨的宣布要给员工加鸡腿,激动的喵哥一夜没睡好,万万妹想到啊,人算不如天算,公司真的发了鸡腿,没错,就是你想的那个。
鸡腿啥的不想了,我还是安心肝文章吧。。。
前一段时间在知乎上看到个问题:Linux如何优化可执行程序的体积?
在我们的日常工作中,一般对程序的体积都有严格的要求,有时候仅仅因为几字节的代码段体积或者多了几十毫秒的运行时间,整个项目就达不到验收标准,甚至不能成功上线。这里我抛砖引玉先提出几个思路,大家如果有好的优化策略欢迎打在评论区。
大体思路有这些:
- 好好写代码,减小代码段体积,别人300代码的逻辑我们50行搞定,程序体积肯定有机会更小一些,这个就得考验开发者自己的编程功底了
- 如果是C++程序,可以尽量减少模板的使用,模板实例化可能会导致代码膨胀
- 不用引用没有用的头文件
- 使用strip,像脱衣服一样,移除程序的所有符号,这也是很多开发者常用的方式
- strip只会清除普通符号,不会动态符号表中的符号,某些动态符号其实也可以隐藏掉,进而来减小库的体积,可以使用-fvisibility=hidden命令
- 巧用.bss段,未初始化的全局变量和局部静态变量会存在.bss段中,这些变量不占用程序空间
- inline-limit:内联过多会导致代码段体积较大,可以通过此优化选项减少内联的数量
- 开启Os编译,这是产生较小代码体积的优化选项
- 适当使用编译选项-fdata-sections和-ffunction-sections
- 考虑链接动态库而非静态库
以上说的太笼统了?贴心如我早就准备好了,不谢~
strip使用
在Linux中可以使用man strip查看strip使用方法,最主要的就是移除所有符号的-s参数,用于清除所有的符号信息:
- strip -s xxx
在使用strip之前先使用nm查看下可执行程序的符号信息:
- ~/test$ nm a.out
- 0000000000200da0 d _DYNAMIC
- 0000000000200fa0 d _GLOBAL_OFFSET_TABLE_
- 000000000000089b t _GLOBAL__sub_I__Z4funcPc
- 0000000000000930 R _IO_stdin_used
- w _ITM_deregisterTMCloneTable
- w _ITM_registerTMCloneTable
- 0000000000000852 t _Z41__static_initialization_and_destruction_0ii
- 00000000000007fa T _Z4funcPc
- 000000000000081c T _Z4funci
- U _ZNSt8ios_base4InitC1Ev@@GLIBCXX_3.4
- U _ZNSt8ios_base4InitD1Ev@@GLIBCXX_3.4
- 0000000000201020 B _ZSt4cout@@GLIBCXX_3.4
- 0000000000000934 r _ZStL19piecewise_construct
- 0000000000201131 b _ZStL8__ioinit
- U _ZStlsISt11char_traitsIcEERSt13basic_ostreamIcT_ES5_PKc@@GLIBCXX_3.4
- 0000000000000b24 r __FRAME_END__
- 0000000000000940 r __GNU_EH_FRAME_HDR
- 0000000000201010 D __TMC_END__
- 0000000000201010 B __bss_start
- U __cxa_atexit@@GLIBC_2.2.5
- w __cxa_finalize@@GLIBC_2.2.5
- 0000000000201000 D __data_start
- 00000000000007b0 t __do_global_dtors_aux
- 0000000000200d98 t __do_global_dtors_aux_fini_array_entry
- 0000000000201008 D __dso_handle
- 0000000000200d88 t __frame_dummy_init_array_entry
- w __gmon_start__
- 0000000000200d98 t __init_array_end
- 0000000000200d88 t __init_array_start
- 0000000000000920 T __libc_csu_fini
- 00000000000008b0 T __libc_csu_init
- U __libc_start_main@@GLIBC_2.2.5
- 0000000000201010 D _edata
- 0000000000201138 B _end
- 0000000000000924 T _fini
- 0000000000000688 T _init
- 00000000000006f0 T _start
- 0000000000201130 b completed.7698
- 0000000000201000 W data_start
- 0000000000000720 t deregister_tm_clones
- 00000000000007f0 t frame_dummy
- 000000000000083d T main
- 0000000000000760 t register_tm_clones
当前这个可执行程序的文件大小是8840字节:
- -rwxrwxrwx 1 a a 8840 Nov 29 14:54 a.out
使用strip清除符号信息:
- ~/test$ strip -s a.out
strip后再查看可执行文件的符号信息:
- ~/test$ nm a.out nm: a.out: no symbols
发现什么符号都没有了,但还是可以执行。
strip后的可执行程序文件大小是6120字节:
- -rwxrwxrwx 1 a a 6120 Nov 29 14:54 a.out
具体可以看我这篇文章:《Linux有一个命令你一定要知道》
-fvisibility=hidden可以这样使用:
- $ g++ -fvisibility=hidden -c layer.cxx -o layer.o
巧用.bss段:
看下面代码:
- #include <stdio.h>
- int a[1000];
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
我们查看下文件大小和各个段大小:
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 12368 May 30 08:48 test
- $ size test
- text data bss dec hex filename
- 1512 4616 4032 10160 27b0 test
再看这段初始化的代码:
- #include <stdio.h>
- int a[1000] = {1};
- int b[1000] = {1};
- int main() {
- printf("程序喵\n");
- return 0;
- }
再查看下文件大小和各个段大小:
- $ gcc testlink.c -o test
- $ ls -l test
- -rwxrwxrwx 1 wzq wzq 16368 May 30 08:49 test
- $ size test
- text data bss dec hex filename
- 1512 8616 8 10136 2798 test
可以看到仅仅是做了一次初始化,文件大小就从12368变成了16368,正好是初始化了的那a[1000]的大小,这4000字节从.bss段移动到了.data段,程序大小增加了,这里可以看出.bss段不占据磁盘空间。
巧用-fdata-sections和-ffunction-sections:
现在的程序和库通常来讲都很大,一个目标文件可能包含成百上千个函数或变量,当需要用到某个目标文件的任意一个函数或变量时,就需要把它整个目标文件都链接进来,也就是说那些没有用到的函数也会被链接进去,这会导致链接输出文件变的很大,造成空间浪费。
有一个编译选项叫函数级别链接,可以使得某个函数或变量单独保存在一个段里面,都链接器需要用到某个函数时,就将它合并到输出文件中,对于没用到的函数则将他们抛弃,减少空间浪费,但这会减慢编译和链接过程,GCC编译器的编译选项是:
- -ffunction-sections -fdata-sections