Scala循环性能问题,为了性能,你愿意牺牲代码的可维护性么?

开发 后端
最近我在学习我们产品的代码,看到了一段代码,我当时很是疑惑:为什么不用循环呢?于是就报了一个Issue,心想这样写可能有它的道理,但是需要澄清一下。

最近我在学习我们产品的代码,看到了类似以下的一段代码:

  1. x.set(1)  
  2. x.set(2)  
  3. x.set(3) 
  4. x.set(4) 
  5. x.set(5) 

我当时很是疑惑,为什么不用循环呢?于是就报了一个Issue,心想这样写可能有它的道理,但是需要澄清一下。

[[323560]]

另一个问题,就是我发现代码里对循环的使用,各有不同的方式,有人写array.foreach(f=>_),有人用使用index的for loop,个人觉得使用foreach的代码比较简洁,于是我也报了Issue,看看是不是应该使用简洁的方式来写循环。举例:

for loop

  1. var index = 0 
  2. var arr = Array[String] 
  3. var length = arr.length  
  4. for ( index <- 0 to length ) { 
  5.     do() 

for each

  1. var index = 0 
  2. var arr = Array[String] 
  3. var length = arr.length  
  4. for ( index <- 0 to length ) { 
  5.     do() 

明显foreach的版本要省不少代码。

后来和我们的工程师沟通了一下,原来我们是为了性能优化了代码,因为for loop比foreach的性能好,所以我们采用稍微繁琐的for loop。至于某些代码中的foreach是因为遗留的还没有来得及改动。

Scala的循环就行性能如何呢?我还是测试一下再说吧。

先看看不同的循环用法,我这里测试了四种,分别是 while loop,for loop,使用range的foreach, 和使用函数的foreach。

测试代码如下:

  1. package profiling 
  2.  
  3. object Loop { 
  4.  
  5.   def whileLoop(arr:Array[Int]): Unit = { 
  6.     var idx = 0 
  7.     var n = arr.length 
  8.     val tStart = System.currentTimeMillis() 
  9.     while (idx < n) { 
  10.       arr(idx) = 1 
  11.       idx += 1 
  12.     } 
  13.     val tEnd = System.currentTimeMillis() 
  14.     println("while loop took " + (tEnd - tStart) + "ms") 
  15.   } 
  16.  
  17.   def forLoop(arr:Array[Int]): Unit = { 
  18.     var idx = 0 
  19.     var n = arr.length 
  20.     val tStart = System.currentTimeMillis() 
  21.     for(idx <- 0 until n) { 
  22.       arr(idx) = 1 
  23.     } 
  24.     val tEnd = System.currentTimeMillis() 
  25.     println("for loop took " + (tEnd - tStart) + "ms") 
  26.   } 
  27.  
  28.   def foreachLoop(arr:Array[Int]): Unit = { 
  29.     var n = arr.length 
  30.     val tStart = System.currentTimeMillis() 
  31.     (0 until n).foreach{idx => arr(idx) = 1} 
  32.     val tEnd = System.currentTimeMillis() 
  33.     println("foreach range took " + (tEnd - tStart) + "ms") 
  34.   } 
  35.  
  36.   def foreachFuncLoop(arr:Array[Int]): Unit = { 
  37.     val tStart = System.currentTimeMillis() 
  38.     arr.foreach{ idx => arr(idx) = 1} 
  39.     val tEnd = System.currentTimeMillis() 
  40.     println("foreach function took " + (tEnd - tStart) + "ms") 
  41.   } 
  42.  
  43.   def profileRun(n: Int) { 
  44.     val arr = new Array[Int](n) 
  45.  
  46.     whileLoop(arr) 
  47.     foreachLoop(arr) 
  48.     forLoop(arr) 
  49.     foreachFuncLoop(arr) 
  50.   } 
  51.  
  52.   def main(args:Array[String]) { 
  53.     profileRun(args(0).toInt) 
  54.   } 

我的环境是scala 2.13.1 , 调用500000000次的结果是:

Bash 代码

  1. while loop took 344ms 
  2. foreach range took 484ms 
  3. for loop took 422ms 
  4. foreach function took 719ms 

可以看出,while loop是最快的,一般形式的foreach最慢,差不多是while loop的一倍。但是如果使用range的话,foreach循环也不算太慢。

那么为什么foreach会慢呢? 主要是foreach的函数调用带来了额外的开销。我们上面看到的数据其实是编译器已经优化后的数字,如果我们把java的hotspot编译选项关闭,(-Xint)再看看性能。

  1. while loop took 8548ms 
  2. foreach range took 39392ms 
  3. for loop took 40799ms 
  4. foreach function took 103489ms 

如果关闭JIT,foreach的性能要远远差于其他几个选项。

对于循环的性能,我们可以得出这样的结论:

  • 在正常打开JIT的情况下,foreach的性能大概比其他几个选项慢一倍,其他几个选项性能接近
  • 在关闭JIT优化的情况下。foreach的性能要远低于其他选项 (生产环境一般不考虑)

那么对于开头讲的不用循环,直接重复代码呢?我们也测试了一下:

  1. package profiling 
  2.  
  3. object Loop2Repeat { 
  4.   def whileLoop(): Unit = { 
  5.     var idx = 0 
  6.     var n = 5 
  7.     var x = 0 
  8.     while (idx < n) { 
  9.       x = idx 
  10.       idx += 1 
  11.     } 
  12.   } 
  13.  
  14.   def repeatLoop(): Unit = { 
  15.     var x = 0 
  16.     x = 1 
  17.     x = 2 
  18.     x = 3 
  19.     x = 4 
  20.     x = 5 
  21.   } 
  22.  
  23.   def test( f:()=>Unit, num: Int, name: String): Unit = { 
  24.     val tStart = System.currentTimeMillis() 
  25.     ( 0 until num).foreach{ _ => f} 
  26.     val tEnd = System.currentTimeMillis() 
  27.     println(name + " took " + (tEnd - tStart) + "ms") 
  28.   } 
  29.  
  30.   def main(args:Array[String]) { 
  31.     test(whileLoop, 50000000, "whileLoop") 
  32.     test(repeatLoop, 50000000, "repeatLoop") 
  33.   } 
  34.  

经过50000000次循环,数据如下:

  1. whileLoop took 281ms 
  2. repeatLoop took 47ms 

确实,因为循环控制的逻辑带来的额外开销,比简单的重复代码性能下降了不少。

 

责任编辑:赵宁宁 来源: 今日头条
相关推荐

2012-07-18 10:47:49

Java

2024-10-30 08:08:45

2023-10-16 09:30:06

Java代码

2020-04-28 16:12:50

前端JavaScript代码

2024-10-07 08:32:54

2017-05-27 15:43:50

Python深拷贝memo

2023-10-17 09:19:34

开发Java

2021-12-29 10:30:15

JMH代码Java

2024-04-07 10:13:57

C++代码if-else

2023-04-28 14:54:57

架构开发React

2018-08-03 09:00:00

编程语言Python外部库

2024-04-18 08:39:57

依赖注入控制反转WPF

2020-10-13 14:52:48

物联网

2023-09-20 23:03:40

C++函数

2022-12-15 11:04:12

数字化转型循环性

2016-10-25 15:34:00

VDI性能监控

2021-03-21 23:43:22

线程编程安全

2024-02-26 08:33:51

并发编程活跃性安全性

2021-03-18 07:52:42

代码性能技巧开发

2022-06-06 00:43:35

系统架构设计
点赞
收藏

51CTO技术栈公众号