为了 1% 情形,牺牲 99% 情形下的性能: 蜗牛般的 Python 深拷贝

开发 开发工具
Python的深拷贝很慢,原因在于深拷贝需要维护一个memo用于记录已经拷贝的对象。而维护这个memo的原因是为了避免相互引用造成的死循环。

最近使用 Python 一个项目,发现 Python 的深拷贝 copy.deepcopy 实在是太慢了。

[[192491]]

相关背景

在 Python 中, 我们有两种拷贝对象的方式:浅拷贝和深拷贝。浅拷贝和深拷贝都可以在 copy 模块中找到, 其中 copy.copy() 进行浅拷贝操作, copy.deepcopy() 进行深拷贝操作。浅拷贝是在另一块地址中创建一个新的对象,但是新对象内的子对象引用指向源对象的子对象。如果这时候我们修改源对象的子对象的属性, 新对象中子对象的属性也会改变。为了获取一个和源对象没有任何关系的全新对象,我们需要深拷贝。深拷贝是在另一块地址中创建一个新的对象,同时对象内的子对象也是新开辟的,和源对象对比仅仅是值相同。

下面用一个例子说明浅拷贝和深拷贝的区别,下面的代码将输出 "b [2,2,3]" 和 "c [1,2,3]"。

  1. import copyclass A: 
  2.    def __init__(self): 
  3.     array = [1,2,3] 
  4. a = A() 
  5. b = copy.copy(a) 
  6. c = copy.deepcopy(a) 
  7. a.array[0] = 2 
  8. print "b",b.array 
  9. print "c",c.array 

b 是由 a 浅拷贝而来,c 是由 a 深拷贝而来。修改 a.array 之后, b.array 也随之发生变化。其实 a.array 和 b.array 指向同一个对象。而 c.array 则保持原样。

深拷贝比浅拷贝符合人类的直觉,代价就是深拷贝实在是太慢了。下面代码中,case1 和 case2 是等价的。在我的机器上测试,case1 不到一秒,而 case2 则达到了 十秒。那么深拷贝为什么那么慢呢?

  1. import copyclass A: 
  2.    def __init__(self): 
  3.        array = [1,2,3] 
  4.  
  5. a = [A() for i in xrange(100000)] 
  6. a[10].array[0] = 100 
  7.  
  8. ### case1 
  9. b = [A() for i in xrange(100000)] 
  10. for i in xrange(100000): 
  11.     for j in xrange(3): 
  12.        b[i].array[j] = a[i].array[j] 
  13.  
  14. ### case2 
  15. c = copy.deepcopy(a) 

深拷贝分析

为了搞清楚为什么 Python 深拷贝这么慢,我阅读了下 Python 2.7 版本的 copy.deepcopy 的实现: https://github.com/python/cpython/blob/2.7/Lib/copy.py。其大体结构为:

  1. def deepcopy(x, memo=None_nil=[]): 
  2.     if memo is None: 
  3.         memo = {} 
  4.     d = id(x) 
  5.     y = memo.get(d, _nil) 
  6.     if y is not _nil: 
  7.         return y 
  8.   
  9.     cls = type(x) 
  10.   
  11.     copier = _deepcopy_dispatch.get(cls) 
  12.     if copier: 
  13.         y = copier(x, memo) 
  14.     else: 
  15.         ... ## 其他特殊的拷贝方式 
  16.  
  17.     memo[d] = y 
  18.     return y 

其中 memo 保存着所有拷贝过的对象。为什么要设置 memo 呢?在某些特殊情况下,一个对象的相关对象可以指向它自己,比如双向链表。如果不将拷贝过的对象存着,那程序将陷入死循环。另外一个值得注意的点是 _deepcopy_dispatch,这行代码根据待拷贝对象的类型,选择相应的拷贝函数。可选的拷贝函数有:用于拷贝基本数据类型的 _deepcopy_atomic, 用于拷贝列表的 _deepcopy_list,用于拷贝元组 _deepcopy_tuple,用于拷贝字典 的 _deepcopy_dict,用于拷贝自定义对象的 _deepcopy_inst 等等。其中比较重要的拷贝函数 __deepcopy_inst 代码如下所示:如果对象有 _ _ deepcopy _ _ 函数,则使用该函数进行拷贝;如果没有,那么先拷贝初始构造参数,然后构造一个对象,再拷贝对象状态。

  1. def _deepcopy_inst(x, memo): 
  2.     if hasattr(x,'__deepcopy__'): 
  3.         return x.__deepcopy__(memo) 
  4.     if hasattr(x,'__getinitargs__'): 
  5.         args = x.__getinitargs__() 
  6.         args = deepcopy(args, memo) 
  7.         y = x.__class__(*args) 
  8.     else: 
  9.         y = _EmptyClass() 
  10.         y.__class__ = x.__class__ 
  11.  
  12.     memo[id(x)] = y     
  13.     if hasattr(x, '__getstate__'): 
  14.         state = x.__getstate__() 
  15.     else: 
  16.         state = x.__dict__ 
  17.     state = deepcopy(state, memo) 
  18.     if hasattr(y, '__setstate__'): 
  19.         y.__setstate__(state) 
  20.     else: 
  21.         y.__dict__.update(state) 
  22.  
  23.     return y 

深拷贝需要维护一个 memo 用于记录已经拷贝的对象,这是它比较慢的原因。在绝大多数情况下,程序里都不存在相互引用。但作为一个通用的模块,Python 深拷贝必须为了这 1% 情形,牺牲 99% 情形下的性能。

一个场景

上面给出了深拷贝效率对比的结果,已经可以看出深拷贝很慢了,但没有办法直观感受深拷贝拖累整个程序的运行速度。下面给一个实际项目的例子,最近在写的一些游戏环境。玩家程序获得游戏环境给出的信息,当前玩家程序选择合适的动作,游戏环境根据该动作推进游戏逻辑;重复上述过程,直到分出胜负;整个过程如下所示。给玩家程序的信息必须从游戏环境深拷贝出来。如果给玩家的信息是从游戏环境浅拷贝出来的,那么玩家程序有可能通过信息获取游戏秘密或者操纵游戏。

拷贝

我们已经知道默认的深拷贝很慢。为了改进深拷贝的效率,我们在信息类以及相关类都添加了 _ _ deepcopy _ _ 函数,下面是信息类示例。

  1. class FiveCardStudInfo(roomai.abstract.AbstractInfo): 
  2.     public_state  = None 
  3.     person_state  = None 
  4.  
  5.     def __deepcopy__(self, memodict={}): 
  6.         info = FiveCardStudInfo() 
  7.         info.public_state = self.public_state.__deepcopy__() 
  8.         info.public_state = self.person_state.__deepcopy__() 
  9.         return info 

简单做了一个效率对比实验:让随机玩法玩家打一千局梭哈,统计耗时。实验结果如下所示。

原始深拷贝

使用原始深拷贝,程序运行时间为 143 秒,其中深拷贝时间 134 秒,深拷贝时间占整个程序时间的 94%。使用了改进深拷贝,程序运行时间是 23 秒,其中深拷贝时间 16 秒,占比为 69 %。虽然深拷贝依然占到了 69%,相比之间 94 % 已经下降很多。整个程序运行时间也从 134 秒减少到 23 秒了。

总结

Python 的深拷贝很慢,原因在于深拷贝需要维护一个 memo 用于记录已经拷贝的对象。而维护这个 memo 的原因是为了避免相互引用造成的死循环。但作为一个通用的模块,Python 深拷贝必须为了这 1% 情形,牺牲 99% 情形下的性能。我们可以通过自己实现 _ _ deepcopy _ _ 函数来改进其效率。

【本文为51CTO专栏作者“李立”的原创稿件,转载请通过51CTO获取联系和授权】

戳这里,看该作者更多好文

责任编辑:赵宁宁 来源: 51CTO专栏
相关推荐

2010-07-20 11:18:12

SQL server阻

2013-02-20 16:02:02

Android开发内存泄露

2010-07-20 11:26:08

SQL Server阻

2009-07-02 10:52:30

JavaBean规范

2018-10-17 14:50:08

2020-04-24 10:44:45

Scala代码开发

2024-04-17 09:01:08

Python深拷贝浅拷贝

2010-08-19 09:54:42

DB2死锁

2012-02-07 17:07:46

虚拟化服务器虚拟化

2021-06-14 09:39:44

网络威胁4G5G

2017-08-16 13:30:05

Java深拷贝浅拷贝

2021-07-16 12:33:24

Javascript深拷贝浅拷贝

2010-08-10 13:36:00

2009-05-19 17:28:44

深拷贝浅拷贝clone()

2020-10-12 08:35:22

JavaScript

2017-05-24 11:54:55

Javascript深拷贝

2022-07-26 08:07:03

Python浅拷贝深拷贝

2018-07-06 11:03:08

手机全面屏刘海屏

2024-02-05 22:56:16

C++拷贝开发

2021-09-10 07:41:06

Python拷贝Python基础
点赞
收藏

51CTO技术栈公众号