本文转载自微信公众号「程序喵大人」,作者程序喵大人。转载本文请联系程序喵大人公众号。
大家好,我是程序喵。
不知不觉又到周一了,你是不是还在床上?看到这条推送的时候,如果你已起床,请在评论区扣1,让程序喵看看有多少人和我一样勤奋!最近C++技术交流群发现了很多水平很高的朋友,欢迎大家来加喵哥微信,进群一起讨论计算机知识!
近期我会推出一系列C++优化文章,可能因为要过年的原因,发现最近阅读量明显下降,所以硬核系列文章会在年后更新,这篇文章先吊一吊大家胃口,作为引言吧。
我们平时编写工程程序时,除了功能可用性外,性能也是最主要的考虑因素。编写功能可用的代码很容易,往往难到我们的不是实现某个功能,困难的永远是保证功能可用的同时又能满足对性能的要求。
一般公司对程序的体积以及运行速度都有严格的要求,有时候因为几字节的代码段体积或者多了几十毫秒的运行时间,整个项目就达不到验收标准,导致不能成功上线。说了这么多只是为了突出性能优化的重要性。如何做好优化才能体现一个C++程序员的真正水平。
关于性能优化,有三个概念我们需要了解:
1. 性能指标要靠测量,不能靠猜:
我做过一段时间的SDK开发工作,每当我们发版SDK时候,都要附带着SDK使用文档以及性能测试报告,性能测试报告里面有很详细的指标测试数据,这个数据当然不能是自己猜测出来的,一定要进行测试。
2. 帕累托法则
帕累托法则,也称二八原则,80%的执行时间花在大约20%代码身上,80%的内存被大约20%的代码使用,80%的维护成本花在20%的代码上面。我们做程序优化也是如此,多数情况下也许我们只需要找到那20%代码,对其进行深度优化,基本上就可以满足性能要求。
3. 阿姆达尔定律
SPRING
阿姆达尔定律:有一个公式,公式中:St表示优化后整体性能提升的比例,P表示被优化部分运行时间占总运行时间的比例,Sp表示被优化部分性能提升的比例。
举个例子:
1. 程序运行时间100s,其中有90s调用函数func,func优化后性能提升30%,即P=90/100=0.9,Sp=1+30%=1.3,则程序整体效率为St=1/((1-0.9)+0.9/1.3)=1.26214,程序整体性能提升了26%。
2. 程序运行时间100s,其中有10s调用函数func,func优化后性能提升80%,即P=10/100=0.1,Sp=1+80%=1.8,则程序整体效率为St=1/((1-0.1)+0.1/1.8)=1.04651,程序整体性能提升了4%。
该定律其实也间接验证了帕累托法则的正确性,去优化那些至关重要的部分吧。
聊完了性能优化的原则,再来说下我的优化系列规划吧,目前打算优化大体分为以下几个专题:
1. 测量分析专题:例如使用什么函数来测量函数耗时,使用什么代码分析工具来动态和静态的分析代码。例如:
2. 编码规范专题:分析C++各种操作的效率,包括不同类型变量的存储效率,使用智能指针、循环、函数参数、虚函数、数组等的效率,以及如何更好的利用他们进行代码优化。例如各个操作占用的时钟周期:
3. 编译优化专题:各种编译器性能分析,理解常见的编译优化选项,分析编译器是如何对代码进行优化的,都做了什么优化,以及编译器优化的障碍(它不能做什么),如何充分利用好编译器的优化选项。例如优化编译器优化级别介绍:
O0(默认选项):不开启优化,方便功能调试
Og:方便调试的优化选项(比O1更保守)
O1:保守的优化选项,打开了四十多个优化选项
Os:产生较小代码体积的优化选项(比O2更保守)
O2:常用的发布优化选项,在O1的基础上额外打开了四十多个优化选项,包括自动内联等规则
O3:较为激进的优化选项(对错误编码容忍度最低),在O2的基础上额外打开了十多个优化选项
Ofast:打开可导致不符合IEEE浮点数等标准的性能优化选项。
如图:
4. 内存优化专题:内存使用情况往往是影响程序性能的关键因素,该专题会介绍如何有效利用缓存,如何操作缓存,优化内存访问速度,如何使用更少的内存,如何防止内存抖动,内存对齐等等。
5. 多线程优化专题:如何充分利用CPU,如何做好线程同步,如何使用锁,使用什么锁,理解和调试上下文切换,如何使关键线程运行效率更高等等。
6. 乱序执行专题:理解CPU的乱序执行策略,如何利用此特性写出高效代码。
7. 矢量运算专题:理解CPU的矢量运算以及各种指令集、寄存器以及内置函数,提高数据计算的效率。
8. 特殊的优化编码技巧:这里会介绍很多高效的编码技巧,如何降低分支预测率,如何优化低效的除法操作,如何更好的进行数据边界检查,介绍一些高效的数学函数库等等。
9.模板元编程的编码技巧:如何利用模板编程来优化程序运行效率。
10.大杂烩:其它一些实用小技巧。
介绍到这里,向大家推荐个好用的网站链接,第一个是:https://godbolt.org/
点击查看高清图片
如图,输入C++代码,在右半部分会显示编译器编译后的汇编代码,通过查看高级语言背后的汇编指令我们可以更好的分析代码的性能。网站更强大的功能是它支持市面上几乎所有的编译器,而且各个版本都有。
如果我们看汇编代码比较吃力,那可以上这个网站:
https://cppinsights.io/
如图,该网站右半部分会展示编译器眼中的代码,对于我们分析程序也有很大帮助。