本文转载自公众号“读芯术”(ID:AI_Discovery)。
几天前,我在Reddit上浏览“learn python”板块的相关内容时,看到一位Reddit用户再次提问了这个问题:“==” and “is”的区别是什么?虽然网上对此问题已经有太多的答案和解释,但是很多初学者还是不知道,还是会犯错。
“==”和“is”都是Python中的运算符。初学者可能会把“a == b”理解为“a等于b”,而把“a is b” 理解为 “a is b”。也许这就是Python初学者混淆“==”和“is”的原因。
在深入讨论之前,我想先举几个“==” 和 “is”的用例:
>>> a = 5
>>> b = 5
>>> a == bTrue>>> a is b
True
- 1.
- 2.
- 3.
- 4.
简单吧?a== b 和 a is b 都能返回 True。下一个例子:
>>> a = 1000
>>> b = 1000
>>> a == bTrue>>> a is b
False
- 1.
- 2.
- 3.
- 4.
这是为什么?第二个例子与第一个唯一的不同就在于a和b的值从5变成了1000,但是“==” 和 “is”输出的结果却完全不同。再看下一例:
>>> a = []
>>> b = []>>> a == bTrue>>> a is b
False
- 1.
- 2.
- 3.
如果这还不够震惊,再看最后一个例子:
>>> a = 1000
>>> b = 1000
>>> a == bTrue>>> a is b
False>>> a = b>>> a == bTrue>>> a is b
True
- 1.
- 2.
- 3.
- 4.
- 5.
“==”的正式运算是相等,而“is”的运算是标识。用“==”是比较两个对象的值。“a == b”应解释为“a的值是否等于b的值”。在上述所有示例中,a的值始终等于b的值(即使对于空列的示例也是如此),因此“a == b”始终为真。
在解释标识的概念之前,我需要先介绍一下id函数。对象的标识可以通过id函数来获得。一个对象的标识始终是唯一且恒定的,你可以将其视为该对象的地址。如果两个对象的标识相同,则它们的值也一定相同。
>>> id(a)
2047616
- 1.
- 2.
运算符“is”用于比较两个对象的标识是否相同,“a is b”就表示“a的标识与b的标识相同”。
图源:unsplash
现在你知道了“==”和“is”的真正含义,我们就可以开始深入讨论上述示例。
首先是第一例和第二例的结果差异。因为Python存储了一个介于-5到256之间的整数数组列表,每一个整数都有固定的对应标识。当你在此范围内分配整数变量时,Python就会将此变量作为数组列里的整数为其分配标识。
因此,在第一例中,由于a和b的标识都是从数组列表中获得的,所以他们的标识当然相同,因此a is b为真。
>>> a = 5
>>> id(a)
1450375152
>>> b = 5
>>> id(b)
1450375152
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
但一旦变量的值不在这个区间范围内,由于Python内部没有对应该值的对象,因此Python将为此变量创建新的标识,并为这个变量赋值。
如前所述,每个创建的标识都是唯一的,因此即使两个变量的值相同,他们的标识也永远不会等同。这就是为什么第二例中的a is b返回False。
>>> a = 1000
>>> id(a)
12728608
>>> b = 1000
>>> id(b)
13620208
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
另外,假设你打开的是两个控制台,如果该值仍在区间内,也能得到相同标识。但是,如果该值不在区间内,结果当然就不同了。
一旦理解了第一例和第二例的区别,就很容易理解第三例的结果了。由于Python不存储“空列表”对象,所以Python创建了一个新对象并赋值“空列表”。无论这两个列表是空还是元素相同,结果都是一样的。
>>> a = [1,10,100,1000]
>>> b = [1,10,100,1000]
>>> a == bTrue>>> a is bFalse>>> id(a)
12578024
>>> id(b)
12578056
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
来看最后一例。第二例与最后一例的唯一区别在于多了一行代码a = b。然而,这行代码却改变了变量a的命运。下面的结果将阐述原因:
>>> a = 1000
>>> b = 2000
>>> id(a)
2047616
>>> id(b)
5034992
>>> a = b>>> id(a)
5034992
>>> id(b)
5034992
>>> a2000>>> b2000
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
可以看到,在a= b之后,a的标识变成了b的标识。a = b把b的标识赋予了a。因此a和b就拥有了相同的标识,a的值现在就等于b的值,即2000。
最后一例传达出一个重要信息,即你可能在不经意间更改了对象的值,尤其是当对象为列表时。
>>> a = [1,2,3]
>>> id(a)
5237992
>>> b = a
>>> id(b)
5237992
>>> a.append(4)
>>> a
[1, 2, 3, 4]
>>> b
[1, 2, 3, 4]
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
从上例可以看出,a和b拥有相同的标识,他们的值就一定相同。因此在为a附加了一个新元素后,b的值也会受到影响。为了避免这种情况,如果要把一个对象的值复制到另一对象,又不引用同一标识,一个方法是在copy模块中使用deepcopy。对于列表,你还可以通过b= a[:]来实现。
>>> import copy
>>> a = [1,2,3]
>>> b= copy.deepcopy(a)
>>> id(a)
39785256
>>> id(b)
5237992
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
使用[:]把元素复制到新变量:
>>> a = [1,2,3]
>>> id(a)
39785256
>>> b = a[:]
>>> id(b)
23850216
>>> a.append(4)
>>> a
[1, 2, 3, 4]
>>> b
[1, 2, 3]
- 1.
- 2.
- 3.
- 4.
- 5.
- 6.
- 7.
- 8.
- 9.
- 10.
- 11.
希望这篇文章能帮你彻底解决这个问题,不要再被相同的难题困住啦。