编译 | 伊风
出品 | 51CTO技术栈(微信号:blog51cto)
能量使用数据是否能告诉我们编程语言的质量?
图片
去年,来自葡萄牙三所不同大学的六名研究人员决定调查这个问题,最终发布了一篇题为《编程语言的能效》的论文。他们在运行用27种不同语言编写的10个编程问题的解决方案时,监测了每种语言使用的电量、速度和内存使用情况。
图片
更具体的说,他们使用了计算机语言基准游戏(Computer Language Benchmarks Game)的10个问题,这是一个用于比较性能的自由软件项目,包括一组标准的简单算法问题以及运行测试的框架。(以前被称为“大计算机语言对决”。)“这使我们能够获得一个可比较、有代表性且广泛的程序集……以及编译/执行选项和编译器版本。”
进行各种基准测试是重要的,因为他们的结果最终取决于执行的测试。例如,总体上C语言被证明是最快且最节能的。但在涉及扫描DNA数据库中特定基因序列的基准测试中,Rust是最节能的——而C排在第三位。
然而,即使在同一测试中,“最佳”语言也取决于你的标准。在该测试中,C也是第二快的语言(再一次排在Rust之后)。但如果按内存使用情况排序,Rust下降了整整九位。而Fortran是该测试中第二节能的语言,但按执行时间排序时也下降了六位。
更快的语言并不总是最节能的。
研究人员指出,他们“严格遵循”CLBG项目关于编译器版本和最佳优化标志的指南。使用Intel的Running Average Power Limit工具测量功耗,每个程序不仅执行一次,而是执行了10次,“以减少冷启动和缓存效应的影响,并能够分析测量结果的一致性,避免异常值。”(因此,他们报告说,“测量结果相当一致。”)为了增加一致性,所有测试都在运行Linux Ubuntu Server 16.10(内核版本4.8.0-22-generic)的台式机上进行,配有16GB RAM和3.20GHz Haswell Intel Core i5-4460 CPU。
在他们的论文中,研究人员指出了一些有趣的结果。
“平均而言,Lisp消耗的能量是C的2.27倍(131.34J),执行时间是C的2.44倍(4926.99ms),所需内存是Pascal的1.92倍(126.64Mb)。”
他们还比较了编译语言与解释语言的结果(还有一个单独的类别是运行在虚拟机上的语言)。论文还包括了不同编程范式的比较——包括函数式编程和命令式编程,以及面向对象编程和脚本编程。
1.更快的语言是否更绿色?
论文仔细研究了一个常见的假设,即更快的程序总是使用更少的能量,指出这并不像物理定律那样简单:E(能量)= T(时间)x P(功率)。研究人员指出,这部分是因为功率不是以一致的速率消耗的,这可能影响了其他研究人员关于程序运行时间是否影响能量消耗的工作。(“关于这个问题的结论有时会有所不同……”)在他们的一个基准测试中,一个Chapel程序比一个等效的Pascal程序执行时间减少了55%,但该Pascal程序使用的能量却少了10%。
因此,尽管人们普遍认为程序运行得更快能量消耗会减少,研究人员明确表示,“更快的语言并不总是最节能的。”
这可能是一个难以回答的问题,因为功耗受多种因素的影响(包括编译器的质量和使用的库)。但最终,研究人员甚至能够根据功耗是由CPU还是DRAM消耗来分解能量消耗——得出结论,平均而言,无论基准程序是编译的、解释的还是在虚拟机上运行的,CPU消耗的功率大约占88%。
有趣的是,解释语言显示出比较大的变化,CPU有时消耗的功率高达92.90%,有时低至81.57%。
在研究结果后,研究人员还得出结论,DRAM峰值使用与能量消耗之间的关系“几乎不存在”。
这项研究为一个长期存在的问题提供了一些见解:更快的语言是否更绿色?是的,事实是,“在前五个最节能的语言中,它们在按执行时间排序时保持了它们的排名,且能量和时间值之间的差异非常小。”
实际上,对于10个基准问题中的9个,最高得分(无论是速度还是能效)都来自于三种总体最快和最节能的语言之一——这并没有让研究人员感到惊讶。“众所周知,这三种顶级语言(C、C++和Rust)被认为是高度优化且执行性能高效的,正如我们的数据所示。”
但当你按运行时间对其他24种语言进行排序时,你不会看到相同的顺序,而按能效排序时也不会。“只有四种语言在能量和时间排名中保持一致(OCaml、Haskell、Racket和Python),而其余的则完全被打乱。”
即使在单个基准测试中,也有快速执行的语言并不是最节能的情况。
2.编译语言:又快又节能
还有其他有趣的结果。编译语言“往往”是最节能和运行最快的——他们的论文甚至可以用一个数字量化这一差异。“平均而言,编译语言执行解决方案所需的能量为120J,而对于虚拟机和解释语言,这一值分别为576J和2365J。”
研究人员在比较执行时间时也应用了同样的精确度,得出结论,平均而言,“编译语言需要5103ms,虚拟机语言需要20623ms,解释语言需要87614ms。”
在这两个类别中,前五名语言中的四个是编译的。(例外是Java。)
图片
最慢的五种语言都是解释的(interpreted):Lua、Python、Perl、Ruby和Typescript。而消耗能量最多的五种语言也是解释的:Perl、Python、Ruby、JRuby和Lua。
对于Google的新编程语言Carbon使用了多少能量,目前还没有定论。
但与此同时,在使用正则表达式操作字符串时,五种最节能的语言中有三种是解释语言(TypeScript、JavaScript和PHP),尽管在其他场景中它们往往不太节能。
编译语言还占据了所需内存空间最少的前五个位置。
图片
“平均而言,编译语言需要125Mb,虚拟机语言需要285Mb,解释语言需要426Mb,”研究人员报告说。与此同时,解释语言占据了内存空间消耗最多的五个位置中的四个:JRuby、Dart、Lua和Perl。(尽管Erlang不是一种解释语言,但它也会出现在最底层五个位置中,介于Dart和Lua之间)。
“如果按其编程范式排序,命令式语言需要116Mb,面向对象语言需要249Mb,函数式语言需要251Mb,而脚本语言需要421Mb。”
实际上,在比较不同的范式时,命令式编程往往表现最佳。其基准程序平均使用的能量更少——运行速度也更快——比面向对象、函数式和脚本范式的基准程序。
图片
但需要考虑的因素有很多。“显然,不同的编程范式,甚至是同一范式内的语言,对能量消耗、时间和内存的影响完全不同,”研究人员写道。然而,哪个因素最重要将取决于你的场景。(例如,后台任务不总是需要最快的运行时间。)
而且有些应用程序需要考虑两个因素——例如,能量使用和执行时间。在这种情况下,“C是最佳解决方案,因为它在单一目标中都占优势,”研究人员写道。如果你想节省时间同时使用更少的内存,C、Pascal和Go“是等效的”——如果你关注所有三个变量(时间、能量使用和内存使用),也是如此。但如果你只是想节省能量同时使用更少的内存,你最好的选择是C或Pascal。
图片
3.写在最后
在论文的最后,研究人员补充说,进一步的研究希望能够检查总内存使用随时间的变化是否与能量消耗更好地相关联。
他们在网上共享了他们的数据,建议这可以让未来的研究人员更容易比较.NET语言或JVM语言。对于使用移动应用程序、物联网系统或其他从有限电源中汲取能量的应用程序的开发人员来说,功耗是一个主要关注点。
但最终,这项研究可能也会让程序员们感到他们最讨厌的东西:模糊性。研究人员报告说,如果你在寻找一种最好的编程语言,“这个问题没有具体和最终的答案。
“尽管每个基准中最节能的语言几乎总是最快的那一个,但事实是,没有一种语言始终优于其他语言,”研究人员总结道。“使用一种语言的情况是确定该语言是否是最节能选择的核心方面。”
参考链接:https://thenewstack.io/which-programming-languages-use-the-least-electricity/