List.sort 和 Sorted 用哪个比较好?

开发 后端
排序是编程经常遇到的场景,在 Python 中,对一个列表进行排序有两种方法,一个是 list.sort 可以对列表原地排序,另一个是 Python 的内建方法 sorted,它不改变原始列表,而是返回一个新的列表,那到底用哪一个呢?

[[433436]]

排序是编程经常遇到的场景,在 Python 中,对一个列表进行排序有两种方法,一个是 list.sort 可以对列表原地排序,另一个是 Python 的内建方法 sorted,它不改变原始列表,而是返回一个新的列表,那到底用哪一个呢?

如果你不想改变原始列表,那肯定选择 sorted 啊,如果改变不改变都无所谓呢?本文就来回到这个问题。

可以先大胆猜测一下,sorted 不改变原始列表,相当于内部对列表进行了深 copy,这个过程必然更占用内存,更慢一些。

现在我们通过实际运行来比较一下:

内存占用比较

先看下结果:

代码:

  1. import random 
  2. import resource 
  3. import sys 
  4. import time 
  5. from sniffing import FunctionSniffingClass 
  6.  
  7. def list_sort(arr): 
  8.     return arr.sort() 
  9.  
  10.  
  11. def sorted_builtin(arr): 
  12.     return sorted(arr) 
  13.  
  14. if __name__ == "__main__"
  15.     if len(sys.argv) != 2: 
  16.         sys.exit("Please run: python (sort|sorted)"
  17.     elif sys.argv[1] == "sorted"
  18.         func = sorted_builtin 
  19.     elif sys.argv[1] == "sort"
  20.         func = list_sort 
  21.     else
  22.         sys.exit("Please run: python (sort|sorted)"
  23.  
  24.     # Lib Testing Code 
  25.     arr = [random.randint(0, 50) for r in range(1_000_000)] 
  26.     mythread = FunctionSniffingClass(func, arr) 
  27.     mythread.start() 
  28.  
  29.     used_mem = 0 
  30.     max_memory = 0 
  31.     memory_usage_refresh = 0.005  # Seconds 
  32.  
  33.     while 1: 
  34.         time.sleep(memory_usage_refresh) 
  35.         used_mem = resource.getrusage(resource.RUSAGE_SELF).ru_maxrss 
  36.         if used_mem > max_memory: 
  37.             max_memory = used_mem 
  38.  
  39.         # Check to see if the function call is complete 
  40.         if mythread.isShutdown(): 
  41.             # Uncomment if yu want to see the results 
  42.             # print(mythread.results) 
  43.             break 
  44.  
  45.     print("\nMAX Memory Usage:", round(max_memory / (2 ** 20), 3), "MB"

很明显,内建的 sorted 函数占用的内存更多。代码用到了 FunctionSniffingClass 类,这里就不展开了,完整代码请访问:https://github.com/DahlitzFlorian/list-sort-vs-sorted-list/tree/master/memory_measurement

速度比较

测试代码:

  1. import random 
  2.  
  3. from somedecorators import timeit 
  4.  
  5. @timeit() 
  6. def list_sort(arr): 
  7.     return arr.sort() 
  8.  
  9.  
  10. @timeit() 
  11. def sorted_builtin(arr): 
  12.     return sorted(arr) 
  13.  
  14.  
  15. def main(): 
  16.     arr = [random.randint(0, 50) for r in range(10_000_000)] 
  17.  
  18.     sorted_builtin(arr) 
  19.  
  20.     list_sort(arr) 
  21.  
  22. if __name__ == "__main__"
  23.     main() 

最后

从结果来看,符合预期,如果不考虑是否改变原始列表的顺序,无论是内存占用还是速度,list.sort 总是更优秀。

但是,请记住,这 list.sort 仅适用于列表,而 sorted 接受任何可迭代对象。此外,如果您使用 list.sort,您将丢失原始列表的次序。

 

责任编辑:武晓燕 来源: Python七号
相关推荐

2021-11-11 07:02:33

类型函数调用

2023-09-14 15:48:53

排序测试

2021-11-30 23:01:51

编程语言数据Python

2009-09-15 09:24:42

思科认证考试思科认证

2021-08-05 08:32:45

TypeScript InterfaceType

2020-09-23 16:53:46

Python编辑器工具

2018-06-16 14:32:16

无线路由器单频双频

2024-10-28 21:11:52

2024-02-22 15:31:46

Python排序

2020-01-17 13:33:42

大数据分析师大数据工程师

2010-03-29 17:38:18

CentOS源代码

2021-03-15 14:09:49

电脑软件安全

2011-10-26 20:34:24

ssh 客户端

2020-12-08 15:54:15

编程语言Python

2020-06-30 09:10:35

编程学习技术

2020-07-28 10:40:26

大数据专业技术

2015-01-08 22:06:18

2020-11-18 09:26:52

@property装饰器代码

2023-04-27 07:26:31

IP地址无符号
点赞
收藏

51CTO技术栈公众号