Python解惑之整数比较详解


Posted in Python onApril 24, 2017

前言

在 Python 中一切都是对象,毫无例外整数也是对象,对象之间比较是否相等可以用==,也可以用is。

==和is操作的区别是:

  • is比较的是两个对象的id值是否相等,也就是比较俩对象是否为同一个实例对象,是否指向同一个内存地址。
  • ==比较的是两个对象的内容是否相等,默认会调用对象的__eq__()方法。

清楚is和==的区别之后,对此也许你有可能会遇到下面的这些困惑,于是就有了这样一篇文章,试图把Python中一些隐晦的东西趴出来,希望对你有一定的帮助。

我们先来看两段代码:

片段一:

>>> a = 256
>>> b = 256
>>> a == b
True
>>>

片段二:

>>> a = 256
>>> b = 256
>>> a is b
True
>>>

在交互式命令行执行上面两段代码,代码片段一中的a==b返回True很好理解,因为两个对象的值都是256,对于片段二,a is b也返回True,这说明a和b是指向同一个对象的,可以检查一下他们的id值是否相等:

>>> id(a)
8213296
>>> id(b)
8213296
>>>

结果证明他俩的确是同一个对象,指向的是同一个内存地址。那是不是所有的整数对象只要两个对象的值(内容)相等,它们就是同一个实例对象呢?换句话说,对于整数对象只要==返回True,is操作也会返回True吗?

带着这个问题来看下面这两段代码:

片段一:

>>> a = 257
>>> b = 257
>>> a == b
True
>>>

片段二:

>>> a = 257
>>> b = 257
>>> a is b
False
>>>

对于257,a is b返回的竟然是False,结果可能在你的意料之中,也有可能出乎你的意料,但不管怎么,我们还是要刨根问底,找出问题的真相。

解惑一

出于对性能的考虑,Python内部做了很多的优化工作,对于整数对象,Python把一些频繁使用的整数对象缓存起来,保存到一个叫small_ints的链表中,在Python的整个生命周期内,任何需要引用这些整数对象的地方,都不再重新创建新的对象,而是直接引用缓存中的对象。Python把这些可能频繁使用的整数对象规定在范围[-5, 256]之间的小对象放在small_ints中,但凡是需要用些小整数时,就从这里面取,不再去临时创建新的对象。因为257不再小整数范围内,因此尽管a和b的值是一样,但是他们在Python内部却是以两个独立的对象存在的,各自为政,互不干涉。

弄明白第一个问题后,我们继续在Python交互式命令行中写一个函数,再来看下面这段代码:

片段一:

>>> c = 257
>>> def foo():
...  a = 257
...  b = 257
...  print a is b
...  print a is c
... 
>>> foo()
True
False

呃,什么情况,是的,你没看错,片段一中的这段代码 a、b 值都是257的情况下,出现了a is b返回True,而a is c 返回的False,a、b、c的值都为257,为什么会出现不同的结果呢?这对于刚刚好不容易建立起来的认知就被彻底否决了吗,那这段代码中究竟发生了什么?难道解惑一中的结论是错误的吗?

解惑二

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. structure-of-a-program

为了弄清楚这个问题,我们有必要先理解程序代码块的概念。Python程序由代码块构成,代码块作为程序的一个最小基本单位来执行。一个模块文件、一个函数体、一个类、交互式命令中的单行代码都叫做一个代码块。在上面这段代码中,由两个代码块构成,c = 257作为一个代码块,函数foo作为另外一个代码块。Python内部为了将性能进一步的提高,凡是在一个代码块中创建的整数对象,如果存在一个值与其相同的对象于该代码块中了,那么就直接引用,否则创建一个新的对象出来。Python出于对性能的考虑,但凡是不可变对象,在同一个代码块中的对象,只有是值相同的对象,就不会重复创建,而是直接引用已经存在的对象。因此,不仅是整数对象,还有字符串对象也遵循同样的原则。所以 a is b就理所当然的返回True了,而c和a不在同一个代码块中,因此在Python内部创建了两个值都是257的对象。为了验证刚刚的结论,我们可以借用dis模块从字节码的角度来看看这段代码。

>>> import dis
>>> dis.dis(foo)
 2   0 LOAD_CONST    1 (257)
    3 STORE_FAST    0 (a)

 3   6 LOAD_CONST    1 (257)
    9 STORE_FAST    1 (b)

 4   12 LOAD_FAST    0 (a)
    15 LOAD_FAST    1 (b)
    18 COMPARE_OP    8 (is)
    21 PRINT_ITEM   
    22 PRINT_NEWLINE  

 5   23 LOAD_FAST    0 (a)
    26 LOAD_GLOBAL    0 (c)
    29 COMPARE_OP    8 (is)
    32 PRINT_ITEM   
    33 PRINT_NEWLINE  
    34 LOAD_CONST    0 (None)
    37 RETURN_VALUE

可以看出两个257都是从常量池的同一个位置co_consts[1]获取的。

总结

一番长篇大论之后,得出两点结论:

1、小整数对象[-5,256]是全局解释器范围内被重复使用,永远不会被GC回收。

2、同一个代码块中的不可变对象,只要值是相等的就不会重复创建新的对象。似乎这些知识点对日常的工作一点忙也帮不上,因为你根本不会用is来比较两个整数对象的值是否相等。那为什么还要拿出来讨论呢?嗯,程序员学知识,不应该浅尝辄止,要充分发挥死磕到底的精神。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者使用python能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
python使用scrapy解析js示例
Jan 23 Python
python中Matplotlib实现绘制3D图的示例代码
Sep 04 Python
matplotlib 输出保存指定尺寸的图片方法
May 24 Python
解决Python找不到ssl模块问题 No module named _ssl的方法
Apr 29 Python
python实现ip地址查询经纬度定位详解
Aug 30 Python
简单了解python协程的相关知识
Aug 31 Python
python装饰器的特性原理详解
Dec 25 Python
Pytorch之Variable的用法
Dec 31 Python
解决python replace函数替换无效问题
Jan 18 Python
python保留格式汇总各部门excel内容的实现思路
Jun 01 Python
浅谈Python 参数与变量
Jun 20 Python
python 实现一个简单的线性回归案例
Dec 17 Python
Python解惑之True和False详解
Apr 24 #Python
Python新手入门最容易犯的错误总结
Apr 24 #Python
Python正则抓取新闻标题和链接的方法示例
Apr 24 #Python
Python的爬虫框架scrapy用21行代码写一个爬虫
Apr 24 #Python
fastcgi文件读取漏洞之python扫描脚本
Apr 23 #Python
批量获取及验证HTTP代理的Python脚本
Apr 23 #Python
深入理解python中的select模块
Apr 23 #Python
You might like
php根据一个给定范围和步进生成数组的方法
2015/06/19 PHP
百万级别知乎用户数据抓取与分析之PHP开发
2015/09/28 PHP
简单PHP会话(session)说明介绍
2016/08/21 PHP
php实现异步将远程链接上内容(图片或内容)写到本地的方法
2016/11/30 PHP
php微信公众号开发之简答题
2018/10/20 PHP
Ctrl+Enter提交内容信息
2006/06/26 Javascript
js对象的构造和继承实现代码
2010/12/05 Javascript
jquery获取table中的某行全部td的内容方法
2013/03/08 Javascript
Extjs NumberField后面加单位实现思路
2013/07/30 Javascript
javascript scrollTop正解使用方法
2013/11/14 Javascript
禁止IE用右键的JS代码
2013/12/30 Javascript
jQuery+ajax实现鼠标单击修改内容的方法
2014/06/27 Javascript
IE6 hack for js 集锦
2014/09/23 Javascript
javascript实现模拟时钟的方法
2015/05/13 Javascript
JS实现DIV容器赋值的方法
2015/12/14 Javascript
js获取上传文件的绝对路径实现方法
2016/08/02 Javascript
PHP+jquery+ajax实现分页
2016/12/09 Javascript
微信小程序登录换取token的教程
2018/05/31 Javascript
JavaScript设计模式之单例模式原理与用法实例分析
2018/07/26 Javascript
详解vue中axios的使用与封装
2019/03/20 Javascript
小米5s微信跳一跳小程序python源码
2018/01/08 Python
Python实现统计给定字符串中重复模式最高子串功能示例
2018/05/16 Python
Django 1.10以上版本 url 配置注意事项详解
2019/08/05 Python
Python如何实现强制数据类型转换
2019/11/22 Python
Pycharm小白级简单使用教程
2020/01/08 Python
Python类继承和多态原理解析
2020/02/05 Python
python 使用while循环输出*组成的菱形实例
2020/04/12 Python
使用AJAX和Django获取数据的方法实例
2020/10/25 Python
python中time tzset()函数实例用法
2021/02/18 Python
美国网上书店:Barnes & Noble
2018/08/15 全球购物
公司会计岗位职责
2014/02/13 职场文书
教师四风对照检查材料思想汇报
2014/09/17 职场文书
后勤工作个人总结
2015/02/28 职场文书
学生早退检讨书(范文)
2019/08/19 职场文书
oracle重置序列从0开始递增1
2022/02/28 Oracle
微软Win11 全新照片应用面向 Dev预览版推出 新版本上手体验图集
2022/09/23 数码科技