本文转载自公众号“读芯术”(ID:AI_Discovery)。
几天前,我在Reddit上浏览“learn python”板块的相关内容时,看到一位Reddit用户再次提问了这个问题:“==” and “is”的区别是什么?虽然网上对此问题已经有太多的答案和解释,但是很多初学者还是不知道,还是会犯错。
“==”和“is”都是Python中的运算符。初学者可能会把“a == b”理解为“a等于b”,而把“a is b” 理解为 “a is b”。也许这就是Python初学者混淆“==”和“is”的原因。
在深入讨论之前,我想先举几个“==” 和 “is”的用例:
- >>> a = 5
- >>> b = 5
- >>> a == bTrue>>> a is b
- True
简单吧?a== b 和 a is b 都能返回 True。下一个例子:
- >>> a = 1000
- >>> b = 1000
- >>> a == bTrue>>> a is b
- False
这是为什么?第二个例子与第一个唯一的不同就在于a和b的值从5变成了1000,但是“==” 和 “is”输出的结果却完全不同。再看下一例:
- >>> a = []
- >>> b = []>>> a == bTrue>>> a is b
- False
如果这还不够震惊,再看最后一个例子:
- >>> a = 1000
- >>> b = 1000
- >>> a == bTrue>>> a is b
- False>>> a = b>>> a == bTrue>>> a is b
- True
“==”的正式运算是相等,而“is”的运算是标识。用“==”是比较两个对象的值。“a == b”应解释为“a的值是否等于b的值”。在上述所有示例中,a的值始终等于b的值(即使对于空列的示例也是如此),因此“a == b”始终为真。
在解释标识的概念之前,我需要先介绍一下id函数。对象的标识可以通过id函数来获得。一个对象的标识始终是唯一且恒定的,你可以将其视为该对象的地址。如果两个对象的标识相同,则它们的值也一定相同。
- >>> id(a)
- 2047616
运算符“is”用于比较两个对象的标识是否相同,“a is b”就表示“a的标识与b的标识相同”。
图源:unsplash
现在你知道了“==”和“is”的真正含义,我们就可以开始深入讨论上述示例。
首先是第一例和第二例的结果差异。因为Python存储了一个介于-5到256之间的整数数组列表,每一个整数都有固定的对应标识。当你在此范围内分配整数变量时,Python就会将此变量作为数组列里的整数为其分配标识。
因此,在第一例中,由于a和b的标识都是从数组列表中获得的,所以他们的标识当然相同,因此a is b为真。
- >>> a = 5
- >>> id(a)
- 1450375152
- >>> b = 5
- >>> id(b)
- 1450375152
但一旦变量的值不在这个区间范围内,由于Python内部没有对应该值的对象,因此Python将为此变量创建新的标识,并为这个变量赋值。
如前所述,每个创建的标识都是唯一的,因此即使两个变量的值相同,他们的标识也永远不会等同。这就是为什么第二例中的a is b返回False。
- >>> a = 1000
- >>> id(a)
- 12728608
- >>> b = 1000
- >>> id(b)
- 13620208
另外,假设你打开的是两个控制台,如果该值仍在区间内,也能得到相同标识。但是,如果该值不在区间内,结果当然就不同了。
一旦理解了第一例和第二例的区别,就很容易理解第三例的结果了。由于Python不存储“空列表”对象,所以Python创建了一个新对象并赋值“空列表”。无论这两个列表是空还是元素相同,结果都是一样的。
- >>> a = [1,10,100,1000]
- >>> b = [1,10,100,1000]
- >>> a == bTrue>>> a is bFalse>>> id(a)
- 12578024
- >>> id(b)
- 12578056
来看最后一例。第二例与最后一例的唯一区别在于多了一行代码a = b。然而,这行代码却改变了变量a的命运。下面的结果将阐述原因:
- >>> a = 1000
- >>> b = 2000
- >>> id(a)
- 2047616
- >>> id(b)
- 5034992
- >>> a = b>>> id(a)
- 5034992
- >>> id(b)
- 5034992
- >>> a2000>>> b2000
可以看到,在a= b之后,a的标识变成了b的标识。a = b把b的标识赋予了a。因此a和b就拥有了相同的标识,a的值现在就等于b的值,即2000。
最后一例传达出一个重要信息,即你可能在不经意间更改了对象的值,尤其是当对象为列表时。
- >>> a = [1,2,3]
- >>> id(a)
- 5237992
- >>> b = a
- >>> id(b)
- 5237992
- >>> a.append(4)
- >>> a
- [1, 2, 3, 4]
- >>> b
- [1, 2, 3, 4]
从上例可以看出,a和b拥有相同的标识,他们的值就一定相同。因此在为a附加了一个新元素后,b的值也会受到影响。为了避免这种情况,如果要把一个对象的值复制到另一对象,又不引用同一标识,一个方法是在copy模块中使用deepcopy。对于列表,你还可以通过b= a[:]来实现。
- >>> import copy
- >>> a = [1,2,3]
- >>> b= copy.deepcopy(a)
- >>> id(a)
- 39785256
- >>> id(b)
- 5237992
使用[:]把元素复制到新变量:
- >>> a = [1,2,3]
- >>> id(a)
- 39785256
- >>> b = a[:]
- >>> id(b)
- 23850216
- >>> a.append(4)
- >>> a
- [1, 2, 3, 4]
- >>> b
- [1, 2, 3]
希望这篇文章能帮你彻底解决这个问题,不要再被相同的难题困住啦。