Python解惑之整数比较详解


Posted in Python onApril 24, 2017

前言

在 Python 中一切都是对象,毫无例外整数也是对象,对象之间比较是否相等可以用==,也可以用is。

==和is操作的区别是:

  • is比较的是两个对象的id值是否相等,也就是比较俩对象是否为同一个实例对象,是否指向同一个内存地址。
  • ==比较的是两个对象的内容是否相等,默认会调用对象的__eq__()方法。

清楚is和==的区别之后,对此也许你有可能会遇到下面的这些困惑,于是就有了这样一篇文章,试图把Python中一些隐晦的东西趴出来,希望对你有一定的帮助。

我们先来看两段代码:

片段一:

>>> a = 256
>>> b = 256
>>> a == b
True
>>>

片段二:

>>> a = 256
>>> b = 256
>>> a is b
True
>>>

在交互式命令行执行上面两段代码,代码片段一中的a==b返回True很好理解,因为两个对象的值都是256,对于片段二,a is b也返回True,这说明a和b是指向同一个对象的,可以检查一下他们的id值是否相等:

>>> id(a)
8213296
>>> id(b)
8213296
>>>

结果证明他俩的确是同一个对象,指向的是同一个内存地址。那是不是所有的整数对象只要两个对象的值(内容)相等,它们就是同一个实例对象呢?换句话说,对于整数对象只要==返回True,is操作也会返回True吗?

带着这个问题来看下面这两段代码:

片段一:

>>> a = 257
>>> b = 257
>>> a == b
True
>>>

片段二:

>>> a = 257
>>> b = 257
>>> a is b
False
>>>

对于257,a is b返回的竟然是False,结果可能在你的意料之中,也有可能出乎你的意料,但不管怎么,我们还是要刨根问底,找出问题的真相。

解惑一

出于对性能的考虑,Python内部做了很多的优化工作,对于整数对象,Python把一些频繁使用的整数对象缓存起来,保存到一个叫small_ints的链表中,在Python的整个生命周期内,任何需要引用这些整数对象的地方,都不再重新创建新的对象,而是直接引用缓存中的对象。Python把这些可能频繁使用的整数对象规定在范围[-5, 256]之间的小对象放在small_ints中,但凡是需要用些小整数时,就从这里面取,不再去临时创建新的对象。因为257不再小整数范围内,因此尽管a和b的值是一样,但是他们在Python内部却是以两个独立的对象存在的,各自为政,互不干涉。

弄明白第一个问题后,我们继续在Python交互式命令行中写一个函数,再来看下面这段代码:

片段一:

>>> c = 257
>>> def foo():
...  a = 257
...  b = 257
...  print a is b
...  print a is c
... 
>>> foo()
True
False

呃,什么情况,是的,你没看错,片段一中的这段代码 a、b 值都是257的情况下,出现了a is b返回True,而a is c 返回的False,a、b、c的值都为257,为什么会出现不同的结果呢?这对于刚刚好不容易建立起来的认知就被彻底否决了吗,那这段代码中究竟发生了什么?难道解惑一中的结论是错误的吗?

解惑二

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. structure-of-a-program

为了弄清楚这个问题,我们有必要先理解程序代码块的概念。Python程序由代码块构成,代码块作为程序的一个最小基本单位来执行。一个模块文件、一个函数体、一个类、交互式命令中的单行代码都叫做一个代码块。在上面这段代码中,由两个代码块构成,c = 257作为一个代码块,函数foo作为另外一个代码块。Python内部为了将性能进一步的提高,凡是在一个代码块中创建的整数对象,如果存在一个值与其相同的对象于该代码块中了,那么就直接引用,否则创建一个新的对象出来。Python出于对性能的考虑,但凡是不可变对象,在同一个代码块中的对象,只有是值相同的对象,就不会重复创建,而是直接引用已经存在的对象。因此,不仅是整数对象,还有字符串对象也遵循同样的原则。所以 a is b就理所当然的返回True了,而c和a不在同一个代码块中,因此在Python内部创建了两个值都是257的对象。为了验证刚刚的结论,我们可以借用dis模块从字节码的角度来看看这段代码。

>>> import dis
>>> dis.dis(foo)
 2   0 LOAD_CONST    1 (257)
    3 STORE_FAST    0 (a)

 3   6 LOAD_CONST    1 (257)
    9 STORE_FAST    1 (b)

 4   12 LOAD_FAST    0 (a)
    15 LOAD_FAST    1 (b)
    18 COMPARE_OP    8 (is)
    21 PRINT_ITEM   
    22 PRINT_NEWLINE  

 5   23 LOAD_FAST    0 (a)
    26 LOAD_GLOBAL    0 (c)
    29 COMPARE_OP    8 (is)
    32 PRINT_ITEM   
    33 PRINT_NEWLINE  
    34 LOAD_CONST    0 (None)
    37 RETURN_VALUE

可以看出两个257都是从常量池的同一个位置co_consts[1]获取的。

总结

一番长篇大论之后,得出两点结论:

1、小整数对象[-5,256]是全局解释器范围内被重复使用,永远不会被GC回收。

2、同一个代码块中的不可变对象,只要值是相等的就不会重复创建新的对象。似乎这些知识点对日常的工作一点忙也帮不上,因为你根本不会用is来比较两个整数对象的值是否相等。那为什么还要拿出来讨论呢?嗯,程序员学知识,不应该浅尝辄止,要充分发挥死磕到底的精神。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者使用python能带来一定的帮助,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
在Python中使用第三方模块的教程
Apr 27 Python
Django中对通过测试的用户进行限制访问的方法
Jul 23 Python
Python安装使用命令行交互模块pexpect的基础教程
May 12 Python
Pandas过滤dataframe中包含特定字符串的数据方法
Nov 07 Python
浅谈tensorflow中张量的提取值和赋值
Jan 19 Python
python pprint模块中print()和pprint()两者的区别
Feb 10 Python
pyecharts在数据可视化中的应用详解
Jun 08 Python
python中pathlib模块的基本用法与总结
Aug 17 Python
如何利用python之wxpy模块玩转微信
Aug 17 Python
python中用ggplot绘制画图实例讲解
Jan 26 Python
python-for x in range的用法(注意要点、细节)
May 10 Python
健身房被搭讪?用python写了个小米计时器助人为乐
Jun 08 Python
Python解惑之True和False详解
Apr 24 #Python
Python新手入门最容易犯的错误总结
Apr 24 #Python
Python正则抓取新闻标题和链接的方法示例
Apr 24 #Python
Python的爬虫框架scrapy用21行代码写一个爬虫
Apr 24 #Python
fastcgi文件读取漏洞之python扫描脚本
Apr 23 #Python
批量获取及验证HTTP代理的Python脚本
Apr 23 #Python
深入理解python中的select模块
Apr 23 #Python
You might like
PHP统一页面编码避免乱码问题
2015/04/09 PHP
掌握PHP垃圾回收机制详解
2019/03/13 PHP
PHP 加密 Password Hashing API基础知识点
2020/03/02 PHP
JavaScript去除空格的几种方法
2006/10/03 Javascript
Javascript的IE和Firefox兼容性汇编(zz)
2007/02/02 Javascript
JavaScript 基础知识 被自己遗忘的
2009/10/15 Javascript
Array.prototype.slice 使用扩展
2010/06/09 Javascript
XMLHTTPRequest的属性和方法简介
2010/11/23 Javascript
关于URL中的特殊符号使用介绍
2011/11/03 Javascript
jQuery图片播放8款精美插件分享
2013/02/17 Javascript
IE8对JS通过属性和数组遍历解析不一样的地方探讨
2013/05/06 Javascript
jQuery使用drag效果实现自由拖拽div
2015/06/11 Javascript
AngularJS学习笔记之ng-options指令
2015/06/16 Javascript
基于zepto的移动端轻量级日期插件--date_picker
2016/03/04 Javascript
JavaScript编写点击查看大图的页面半透明遮罩层效果实例
2016/05/09 Javascript
Vue.js双向绑定实现原理详解
2016/12/22 Javascript
vue之数据交互实例代码
2017/06/20 Javascript
不刷新网页就能链接新的js文件方法总结
2020/03/01 Javascript
js中switch语句的学习笔记
2020/03/25 Javascript
关于AngularJS中几种Providers的区别总结
2020/05/17 Javascript
ES6对象操作实例详解
2020/05/23 Javascript
js实现带积分弹球小游戏
2020/07/21 Javascript
js实现筛选功能
2020/11/24 Javascript
Vue开发中常见的套路和技巧总结
2020/11/24 Vue.js
Python多层装饰器用法实例分析
2018/02/09 Python
Python获取指定字符前面的所有字符方法
2018/05/02 Python
python3连接kafka模块pykafka生产者简单封装代码
2019/12/23 Python
python 三种方法提取pdf中的图片
2021/02/07 Python
CSS3 不定高宽垂直水平居中的几种方式
2020/03/26 HTML / CSS
大学毕业生自荐书怎么写?
2014/01/06 职场文书
政治学求职信
2014/06/03 职场文书
小学教师学习党的群众路线教育实践活动心得体会
2014/10/31 职场文书
办公室文员岗位职责
2015/02/04 职场文书
幼儿园感恩节活动总结
2015/03/24 职场文书
幼儿园教师安全责任书
2015/05/08 职场文书
Python可视化动图组件ipyvizzu绘制惊艳的可视化动图
2022/04/21 Python