关于Python整数比较的一些坑:
Python中一切都是对象,对象比较可以用 == 或者 is。== 比较的是两个对象的内容是否相等,默认会调用对象的 __eq__() 方法。
is 比较的是两个对象的 id 是否相等,也就是是否是同一个对象,是否指向同一个内存地址。
>>> a = 4 >>> b = 4 >>> a == b True >>> a is b True >>> a = 256 >>> b = 256 >>> a == b True >>> a is b True >>> a = 257 >>> b = 257 >>> a == b True >>> a is b False
我们看到,前几组比较我们都可以理解显示的结果,但是最后当 a/b 都指向 257 这个整数对象的时候,用 is 比较以后的结果是 False。
这是因为 Python 处于对性能的考虑,内部作了优化,对于整数对象,把一些频繁使用的整数对象缓存起来,保存到一个叫 small_ints 的链表中。
在 Python 整个生命周期中,任何需要引用这些整数对象的地方,都不再重新创建新的整数对象,范围是 [-5,256]。
再看下面这个例子 :
>>> a = 259 >>> def foo () : ... b = 259 ... c = 259 ... print(a is b) ... print(b is c) ... >>> foo() False True
这是因为 Python 程序都是由代码块构成,代码块作为程序的一个最小基本单位来执行。一个模块文件/一个函数体/一个类/交互式命令中的单行代码都叫做一个代码块。
上面的程序中有两部分代码块,一个是名称 a 所在的代码块,一个是名称 b/c 所在的代码块。Python 的另一个优化的地方就是,如果在同一个代码块中创建的两个整数对象中,它们的值相等的话,那么这两个对象引用同一个整数对象。所以Python出于对性能的考虑,但凡是不可变的对象,在同一代码块中,只有值相等的对象就不会重复创建,而是直接引用已经存在的对象。不仅整数对象,字符串对象也遵循同样的原则。