Python解惑之整数比较详解


Posted in Python onApril 24, 2017

前言

在 Python 中一切都是对象,毫无例外整数也是对象,对象之间比较是否相等可以用==,也可以用is。

==和is操作的区别是:

  • is比较的是两个对象的id值是否相等,也就是比较俩对象是否为同一个实例对象,是否指向同一个内存地址。
  • ==比较的是两个对象的内容是否相等,默认会调用对象的__eq__()方法。

清楚is和==的区别之后,对此也许你有可能会遇到下面的这些困惑,于是就有了这样一篇文章,试图把Python中一些隐晦的东西趴出来,希望对你有一定的帮助。

我们先来看两段代码:

片段一:

>>> a = 256
>>> b = 256
>>> a == b
True
>>>

片段二:

>>> a = 256
>>> b = 256
>>> a is b
True
>>>

在交互式命令行执行上面两段代码,代码片段一中的a==b返回True很好理解,因为两个对象的值都是256,对于片段二,a is b也返回True,这说明a和b是指向同一个对象的,可以检查一下他们的id值是否相等:

>>> id(a)
8213296
>>> id(b)
8213296
>>>

结果证明他俩的确是同一个对象,指向的是同一个内存地址。那是不是所有的整数对象只要两个对象的值(内容)相等,它们就是同一个实例对象呢?换句话说,对于整数对象只要==返回True,is操作也会返回True吗?

带着这个问题来看下面这两段代码:

片段一:

>>> a = 257
>>> b = 257
>>> a == b
True
>>>

片段二:

>>> a = 257
>>> b = 257
>>> a is b
False
>>>

对于257,a is b返回的竟然是False,结果可能在你的意料之中,也有可能出乎你的意料,但不管怎么,我们还是要刨根问底,找出问题的真相。

解惑一

出于对性能的考虑,Python内部做了很多的优化工作,对于整数对象,Python把一些频繁使用的整数对象缓存起来,保存到一个叫small_ints的链表中,在Python的整个生命周期内,任何需要引用这些整数对象的地方,都不再重新创建新的对象,而是直接引用缓存中的对象。Python把这些可能频繁使用的整数对象规定在范围[-5, 256]之间的小对象放在small_ints中,但凡是需要用些小整数时,就从这里面取,不再去临时创建新的对象。因为257不再小整数范围内,因此尽管a和b的值是一样,但是他们在Python内部却是以两个独立的对象存在的,各自为政,互不干涉。

弄明白第一个问题后,我们继续在Python交互式命令行中写一个函数,再来看下面这段代码:

片段一:

>>> c = 257
>>> def foo():
...  a = 257
...  b = 257
...  print a is b
...  print a is c
... 
>>> foo()
True
False

呃,什么情况,是的,你没看错,片段一中的这段代码 a、b 值都是257的情况下,出现了a is b返回True,而a is c 返回的False,a、b、c的值都为257,为什么会出现不同的结果呢?这对于刚刚好不容易建立起来的认知就被彻底否决了吗,那这段代码中究竟发生了什么?难道解惑一中的结论是错误的吗?

解惑二

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. structure-of-a-program

为了弄清楚这个问题,我们有必要先理解程序代码块的概念。Python程序由代码块构成,代码块作为程序的一个最小基本单位来执行。一个模块文件、一个函数体、一个类、交互式命令中的单行代码都叫做一个代码块。在上面这段代码中,由两个代码块构成,c = 257作为一个代码块,函数foo作为另外一个代码块。Python内部为了将性能进一步的提高,凡是在一个代码块中创建的整数对象,如果存在一个值与其相同的对象于该代码块中了,那么就直接引用,否则创建一个新的对象出来。Python出于对性能的考虑,但凡是不可变对象,在同一个代码块中的对象,只有是值相同的对象,就不会重复创建,而是直接引用已经存在的对象。因此,不仅是整数对象,还有字符串对象也遵循同样的原则。所以 a is b就理所当然的返回True了,而c和a不在同一个代码块中,因此在Python内部创建了两个值都是257的对象。为了验证刚刚的结论,我们可以借用dis模块从字节码的角度来看看这段代码。

>>> import dis
>>> dis.dis(foo)
 2   0 LOAD_CONST    1 (257)
    3 STORE_FAST    0 (a)

 3   6 LOAD_CONST    1 (257)
    9 STORE_FAST    1 (b)

 4   12 LOAD_FAST    0 (a)
    15 LOAD_FAST    1 (b)
    18 COMPARE_OP    8 (is)
    21 PRINT_ITEM   
    22 PRINT_NEWLINE  

 5   23 LOAD_FAST    0 (a)
    26 LOAD_GLOBAL    0 (c)
    29 COMPARE_OP    8 (is)
    32 PRINT_ITEM   
    33 PRINT_NEWLINE  
    34 LOAD_CONST    0 (None)
    37 RETURN_VALUE

可以看出两个257都是从常量池的同一个位置co_consts[1]获取的。

总结

一番长篇大论之后,得出两点结论:

1、小整数对象[-5,256]是全局解释器范围内被重复使用,永远不会被GC回收。

2、同一个代码块中的不可变对象,只要值是相等的就不会重复创建新的对象。似乎这些知识点对日常的工作一点忙也帮不上,因为你根本不会用is来比较两个整数对象的值是否相等。那为什么还要拿出来讨论呢?嗯,程序员学知识,不应该浅尝辄止,要充分发挥死磕到底的精神。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者使用python能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
python实现单线程多任务非阻塞TCP服务端
Jun 13 Python
Python数字图像处理之霍夫线变换实现详解
Jan 12 Python
Python中多个数组行合并及列合并的方法总结
Apr 12 Python
学生信息管理系统Python面向对象版
Jan 30 Python
python使用socket实现的传输demo示例【基于TCP协议】
Sep 24 Python
django框架创建应用操作示例
Sep 26 Python
30秒学会30个超实用Python代码片段【收藏版】
Oct 15 Python
如何基于python实现画不同品种的樱花树
Jan 03 Python
Python3标准库之threading进程中管理并发操作方法
Mar 30 Python
使用python修改文件并立即写回到原始位置操作(inplace读写)
Jun 28 Python
Python图像读写方法对比
Nov 16 Python
pytorch 计算Parameter和FLOP的操作
Mar 04 Python
Python解惑之True和False详解
Apr 24 #Python
Python新手入门最容易犯的错误总结
Apr 24 #Python
Python正则抓取新闻标题和链接的方法示例
Apr 24 #Python
Python的爬虫框架scrapy用21行代码写一个爬虫
Apr 24 #Python
fastcgi文件读取漏洞之python扫描脚本
Apr 23 #Python
批量获取及验证HTTP代理的Python脚本
Apr 23 #Python
深入理解python中的select模块
Apr 23 #Python
You might like
用js进行url编码后用php反解以及用php实现js的escape功能函数总结
2010/02/08 PHP
PHP Zip解压 文件在线解压缩的函数代码
2010/05/26 PHP
为PHP安装imagick时出现Cannot locate header file MagickWand.h错误的解决方法
2014/11/03 PHP
简介JavaScript中的getSeconds()方法的使用
2015/06/10 Javascript
JavaScript中捕获/阻止捕获、冒泡/阻止冒泡方法
2016/12/07 Javascript
AngularJS中run方法的巧妙运用
2017/01/04 Javascript
HTML+JavaScript实现扫雷小游戏
2019/09/30 Javascript
手把手教你实现 Promise的使用方法
2020/09/02 Javascript
python实现linux服务器批量修改密码并生成execl
2014/04/22 Python
Python使用SQLite和Excel操作进行数据分析
2018/01/20 Python
Tensorflow 自带可视化Tensorboard使用方法(附项目代码)
2018/02/10 Python
python实现对指定输入的字符串逆序输出的6种方法
2018/04/26 Python
对python实时得到鼠标位置的示例讲解
2018/10/14 Python
Python实现的简单线性回归算法实例分析
2018/12/26 Python
Python中Numpy mat的使用详解
2019/05/24 Python
Python自动化之数据驱动让你的脚本简洁10倍【推荐】
2019/06/04 Python
详解基于python的多张不同宽高图片拼接成大图
2019/09/26 Python
python通过移动端访问查看电脑界面
2020/01/06 Python
python读取多层嵌套文件夹中的文件实例
2020/02/27 Python
Python实现UDP程序通信过程图解
2020/05/15 Python
Python unittest装饰器实现原理及代码
2020/09/08 Python
python两个list[]相加的实现方法
2020/09/23 Python
Python爬虫Scrapy框架CrawlSpider原理及使用案例
2020/11/20 Python
如何用Django处理gzip数据流
2021/01/29 Python
纯HTML5+CSS3制作生日蛋糕代码
2016/11/16 HTML / CSS
学生的自我鉴定范文
2013/10/24 职场文书
放飞蜻蜓反思
2014/02/05 职场文书
《十六年前的回忆》教学反思
2014/02/14 职场文书
分层教学实施方案
2014/03/19 职场文书
市场营销毕业生自荐信范文
2014/04/01 职场文书
大学生工作自荐书
2014/06/16 职场文书
党员学习正风肃纪思想汇报
2014/09/12 职场文书
会议欢迎词
2015/01/23 职场文书
Python中的pprint模块
2021/11/27 Python
什么是SOLID
2022/03/24 Javascript
Redis过期数据是否会被立马删除
2022/07/23 Redis