Python中关于浮点数的冷知识


Posted in Python onSeptember 22, 2019

本周的PyCoder's Weekly 上分享了一篇小文章,它里面提到的冷知识很有意思,我稍作补充,分享给大家。

它提到的部分问题,读者们可以先思考下:

  • 若两个元组相等,即 a==b 且 a is b,那么相同索引的元素(如 a[0] 、b[0])是否必然相等呢?
  • 若两个对象的 hash 结果相等,即 hash(a) == hash(b),那么它们是否必然相等呢?

答案当然都为否(不然就不叫冷知识了),大家可以先尝试回答一下,然后再往下看。

-----思考分割线-----

好了,先来看看第一个问题。两个相同的元组 a、b,它们有如下的关系:

>>> a = (float('nan'),)
>>> b = a
>>> a  # (nan,)
>>> b  # (nan,)

>>> type(a), type(b)
(<type 'tuple'>, <type 'tuple'>)

>>> a == b
True

>>> a is b # 即 id(a) == id(b)
True

>>> a[0] == b[0]
False

以上代码表明:a 等于 b(类型、值与 id 都相等),但是它们的对位元素却不相等。

两个元组都只有一个元素(逗号后面没有别的元素,这是单元素的元组的表示方法,即 len(a)==1 )。float() 是个内置函数,可以将入参构造成一个浮点数。

为什么会这样呢?先查阅一下文档,这个内置函数的解析规则是:

sign      ::= "+" | "-"
infinity    ::= "Infinity" | "inf"
nan      ::= "nan"
numeric_value ::= floatnumber | infinity | nan
numeric_string ::= [sign] numeric_value

它在解析时,可以解析前后的空格、前缀的加减号(+/-)、浮点数,除此之外,还可以解析两类字符串(不区分大小写):"Infinity"或"inf",表示无穷大数;“nan”,表示不是数(not-a-number),确切地说,指的是除了数以外的所有东西。

前面分享的第一个冷知识就跟“nan”有关,作为整体,两个元组相等,但是它们唯一的元素却不相等。之所以会这样,因为“nan”表示除了数以外的东西,它是一个范围,所以不可比较。

作为对比,我们来看看两个“无穷大的浮点数”是什么结果:

>>> a = (float('inf'),)
>>> b = a
>>> a  # (inf,)
>>> b  # (inf,)

>>> a == b # True
>>> a is b # True
>>> a[0] == b[0] # True

注意最后一次比较,它跟前面的两个元组恰好相反,由此,我们可以得出结论:两个无穷大的浮点数,数值相等,而两个“不是数的东西”,数值不相等。

化简一下,可以这样看:

>>> a = float('inf')
>>> b = float('inf')
>>> c = float('nan')
>>> d = float('nan')

>>> a == b # True
>>> c == d # False

以上就是第一个冷知识的揭秘。接着看第二个:

>>> hash(float('nan')) == hash(float('nan'))
True

前面刚说了两个“不是数的东西”不相等,这里却显示它们的哈希结果相等,这挺违背常理的。

我们可以推理出一条简单的结论:不相等的两个对象,其哈希结果可能相等。

原因在于,hash(float('nan')) 的结果等于 0,它是个固定值,作比较时当然就相等了。

其实,关于 hash() 函数,还埋了一个彩蛋:

>>> hash(float('inf')) # 314159
>>> hash(float('-inf')) # -314159

有没有觉得这个数值很熟悉啊?它正是圆周率的前五位 3.14159,去除小数点后的结果。在早期的 Python 版本中,负无穷大数的哈希结果其实是 -271828,正是取自于自然对数 e。这两个数都是硬编码在 Python 解释器中的,算是某种致敬吧。

由于 float('nan') 的哈希值相等,这通常意味着它们不可以作为字典的不同键值,但是事实却出人意料:

>>> a = {float('nan'): 1, float('nan'): 2}
>>> a
{nan: 1, nan: 2}

# 作为对比:
>>> b = {float('inf'): 1, float('inf'): 2}
>>> b
{inf: 2}

如上所示,两个 nan 键值在表示上一模一样(注意,它们没有用引号括起来),它们可以共存,而 inf 却只能归并成一个,再次展示出了 nan 的神奇。

好了,两个很冷的小知识分享完毕,背后的原因都在于 float() 取浮点数时,Python 允许了 nan(不是数)的存在,它表示不确切的存在,所以导致了这些奇怪的结果。

最后,我们作下小结:

  • 包含 float('nan') 的两个元组,当做整体作比较时,结果相等;两个相等的元组,其对位的元素可能不相等
  • float('nan') 表示一个“不是数”的东西,它本身不是确定值,两个对象作比较时不相等,但是其哈希结果是固定值,作比较时相等;可用作字典的键值,而且是不冲突的键值
  • float('inf') 表示一个无穷大的浮点数,可看作确定的值,两个对象做比较时相等,其哈希结果也相等;可用作字典的键值,但是会产生冲突
  • float('nan') 的哈希结果为 0,float('inf') 的哈希结果为 314159

参考资料:

https://docs.python.org/3/library/functions.html#float

https://www.pythondoeswhat.com/2019/09/welcome-to-float-zone.html

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。

Python 相关文章推荐
python类参数self使用示例
Feb 17 Python
Python THREADING模块中的JOIN()方法深入理解
Feb 18 Python
Python实现对PPT文件进行截图操作的方法
Apr 28 Python
在Windows中设置Python环境变量的实例讲解
Apr 28 Python
Python查找第n个子串的技巧分享
Jun 27 Python
Python开发的十个小贴士和技巧及长常犯错误
Sep 27 Python
numpy基础教程之np.linalg
Feb 12 Python
详解爬虫被封的问题
Apr 23 Python
django中使用Celery 布式任务队列过程详解
Jul 29 Python
Python日志syslog使用原理详解
Feb 18 Python
pandas分组聚合详解
Apr 10 Python
python 实现仿微信聊天时间格式化显示的代码
Apr 17 Python
Python安装及Pycharm安装使用教程图解
Sep 20 #Python
Python实现语音识别和语音合成功能
Sep 20 #Python
使用python将最新的测试报告以附件的形式发到指定邮箱
Sep 20 #Python
Python使用__new__()方法为对象分配内存及返回对象的引用示例
Sep 20 #Python
Python 类方法和实例方法(@classmethod),静态方法(@staticmethod)原理与用法分析
Sep 20 #Python
Python 类属性与实例属性,类对象与实例对象用法分析
Sep 20 #Python
使用python脚本自动创建pip.ini配置文件代码实例
Sep 20 #Python
You might like
利用Memcached在php下实现session机制 替换PHP的原生session支持
2010/08/21 PHP
PHP中限制IP段访问、禁止IP提交表单的代码
2011/04/23 PHP
如何使用php绘制在图片上的正余弦曲线
2013/06/08 PHP
CodeIgniter框架过滤HTML危险代码
2014/06/12 PHP
PHP5.3与5.5废弃与过期函数整理汇总
2014/07/10 PHP
destoon实现调用热门关键字的方法
2014/07/15 PHP
php 访问oracle 存储过程实例详解
2017/01/08 PHP
常见的5个PHP编码小陋习以及优化实例讲解
2021/02/27 PHP
JS延迟加载(setTimeout) JS最后加载
2010/07/15 Javascript
关于this和self的使用说明
2010/08/01 Javascript
Javascript公共脚本库系列(一): 弹出层脚本
2011/02/24 Javascript
利用Keydown事件阻止用户输入实现代码
2014/03/11 Javascript
node.js操作mongoDB数据库示例分享
2014/11/26 Javascript
在React框架中实现一些AngularJS中ng指令的例子
2016/03/06 Javascript
jQuery插件pagination实现无刷新分页
2016/05/21 Javascript
1秒50万字!js实现关键词匹配
2016/08/01 Javascript
jquery实现百叶窗效果
2017/01/12 Javascript
boostrapTable的refresh和refreshOptions区别浅析
2017/01/22 Javascript
JavaScript函数参数的传递方式详解
2017/03/06 Javascript
Angular5.1新功能分享
2017/12/21 Javascript
vue弹窗插件实战代码
2018/09/08 Javascript
微信小程序实现预览图片功能
2020/10/22 Javascript
nodejs对mongodb数据库的增加修删该查实例代码
2020/01/05 NodeJs
python使用Tkinter显示网络图片的方法
2015/04/24 Python
Python使用Pandas库实现MySQL数据库的读写
2019/07/06 Python
解决Django响应JsonResponse返回json格式数据报错问题
2020/08/09 Python
python进行OpenCV实战之画图(直线、矩形、圆形)
2020/08/27 Python
python 统计list中各个元素出现的次数的几种方法
2021/02/20 Python
英国泰坦旅游网站:全球陪同游览,邮轮和铁路旅行
2016/11/29 全球购物
Vero Moda西班牙官方购物网站:丹麦BESTSELLER旗下知名女装品牌
2018/04/27 全球购物
自荐信格式的六要素
2013/09/21 职场文书
施工材料员岗位职责
2014/02/12 职场文书
质量提升方案
2014/06/16 职场文书
分居协议书范本(律师见证版)
2014/11/26 职场文书
2016年幼儿园万圣节活动总结
2016/04/05 职场文书
检讨书范文
2019/04/16 职场文书