Python整数与Numpy数据溢出问题解决


Posted in Python onSeptember 11, 2019

某位 A 同学发了我一张截图,问为何结果中出现了负数?

Python整数与Numpy数据溢出问题解决

看了图,我第一感觉就是数据溢出了。数据超出能表示的最大值,就会出现奇奇怪怪的结果。

然后,他继续发了张图,内容是 print(100000*208378),就是直接打印上图的 E[0]*G[0],结果是 20837800000,这是个正确的结果。

所以新的问题是:如果说上图的数据溢出了,为何直接相乘的数却没有溢出?

由于我一直忽视数据的表示规则(整型的上限是多少?),而且对 Numpy 了解不多,还错看了图中结果,误以为每一个数据都是错误的,所以就解答不出来。

最后,经过学习群里的一番讨论,我才终于明白是怎么回事,所以本文把相关知识点做个梳理。

在正式开始之前,先总结一下上图会引出的话题:

  • Python 3 中整数的上限是多少?Python 2 呢?
  • Numpy 中整数的上限是多少?出现整数溢出该怎么办?

关于第一个问题,先看看 Python 2,它有两种整数:

  • 一种是短整数,也即常说的整数,用 int 表示,有个内置函数 int()。其大小有限,可通过sys.maxint() 查看(取决于平台是 32 位还是 64 位)
  • 一种是长整数,即大小无限的整数,用 long 表示,有个内置函数 long()。写法上是在数字后面加大写字母 L 或小写的 l,如 1000L

当一个整数超出短整数范围时,它会自动采用长整数表示。举例,打印 2**100 ,结果会在末尾加字母 L 表示它是长整数。

但是到了 Python 3,情况就不同了:它仅有一种内置的整数,表示为 int,形式上是 Python 2 的短整数,但实际上它能表示的范围无限,行为上更像是长整数。无论多大的数,结尾都不需要字母 L 来作区分。

也就是说,Python 3 整合了两种整数表示法,用户不再需要自行区分,全交给底层按需处理。

理论上,Python 3 中的整数没有上限(只要不超出内存空间)。这就解释了前文中直接打印两数相乘,为什么结果会正确了。

PEP-237(Unifying Long Integers and Integers)中对这个转变作了说明。它解释这样做的 目的:

这会给新的 Python 程序员(无论他们是否是编程新手)减少一项上手前要学的功课。

Python 在语言运用层屏蔽了很多琐碎的活,比如内存分配,所以,我们在使用字符串、列表或字典等对象时,根本不用操心。整数类型的转变,也是出于这样的便利目的。(坏处是牺牲了一些效率,在此就不谈了)

回到前面的第二个话题:Numpy 中整数的上限是多少?

由于它是 C 语言实现,在整数表示上,用的是 C 语言的规则,也就是会区分整数和长整数。

有一种方式可查看:

import numpy as np
a = np.arange(2)
type(a[0])
# 结果:numpy.int32

也就是说它默认的整数 int 是 32 位,表示范围在 -2147483648 ~ 2147483647。

对照前文的截图,里面只有两组数字相乘时没有溢出:100007*4549、100012*13264,其它数据组都溢出了,所以出现奇怪的负数结果。

Numpy 支持的数据类型要比 Python 的多,相互间的区分界限很多样:

Python整数与Numpy数据溢出问题解决

截图来源:https://www.runoob.com/numpy/numpy-dtype.html

要解决整数溢出问题,可以通过指定 dtype 的方式:

import numpy as np
q = [100000]
w = [500000]
# 一个溢出的例子:
a = np.array(q)
b = np.array(w)
print(a*b) # 产生溢出,结果是个奇怪的数值
# 一个解决的例子:
c = np.array(q, dtype='int64')
d = np.array(w, dtype='int64')
print(c*d) # 没有溢出:[50000000000]

好了,前面提出的问题就回答完了。来作个结尾吧:

  • Python 3 极大地简化了整数的表示,效果可表述为:整数就只有一种整数(int),没有其它类型的整数(long、int8、int64 之类的)
  • Numpy 中的整数类型对应于 C 语言的数据类型,每种“整数”有自己的区间,要解决数据溢出问题,需要指定更大的数据类型(dtype)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
haskell实现多线程服务器实例代码
Nov 26 Python
Python重新引入被覆盖的自带function
Jul 16 Python
使用Python脚本操作MongoDB的教程
Apr 16 Python
Python中数字以及算数运算符的相关使用
Oct 12 Python
Python编程pygal绘图实例之XY线
Dec 09 Python
PyCharm代码整体缩进,反向缩进的方法
Jun 25 Python
vscode 配置 python3开发环境的方法
Sep 19 Python
pytorch之添加BN的实现
Jan 06 Python
Python基于class()实现面向对象原理详解
Mar 26 Python
如何在python中执行另一个py文件
Apr 30 Python
Python几种常见算法汇总
Jun 02 Python
python如何设置静态变量
Sep 07 Python
python中通过selenium简单操作及元素定位知识点总结
Sep 10 #Python
用Python画一个LinkinPark的logo代码实例
Sep 10 #Python
Pytorch修改ResNet模型全连接层进行直接训练实例
Sep 10 #Python
django drf框架自带的路由及最简化的视图
Sep 10 #Python
Pytorch中accuracy和loss的计算知识点总结
Sep 10 #Python
python3.7环境下安装Anaconda的教程图解
Sep 10 #Python
Windows10下 python3.7 安装 facenet的教程
Sep 10 #Python
You might like
PHP实现简单数字分页效果
2015/07/26 PHP
Prototype使用指南之ajax
2007/01/10 Javascript
javascript学习之闭包分析
2010/12/02 Javascript
动态的创建一个元素createElement及删除一个元素
2014/01/24 Javascript
jquery跨域请求示例分享(jquery发送ajax请求)
2014/03/25 Javascript
js实现发送验证码后的倒计时功能
2015/05/28 Javascript
使用AngularJS中的SCE来防止XSS攻击的方法
2015/06/18 Javascript
基于JavaScript实现类似于百度学术高级检索功能
2016/03/02 Javascript
BootStrap学习系列之Bootstrap Typeahead 组件实现百度下拉效果(续)
2016/07/07 Javascript
JavaScript编写九九乘法表(两种任选)
2017/02/04 Javascript
浅谈jquery拼接字符串效率比较高的方法
2017/02/22 Javascript
zTree异步加载展开第一级节点的实现方法
2017/09/05 Javascript
js使用generator函数同步执行ajax任务
2017/09/05 Javascript
JS实现json对象数组按对象属性排序操作示例
2018/05/18 Javascript
Angular服务Request异步请求的实例讲解
2018/08/13 Javascript
webpack结合express实现自动刷新的方法
2019/05/07 Javascript
微信小程序自定义组件实现环形进度条
2020/11/17 Javascript
OpenLayers3实现鼠标移动显示坐标
2020/09/25 Javascript
[54:41]2018DOTA2亚洲邀请赛3月30日 小组赛B组 VGJ.T VS paiN
2018/03/31 DOTA
Python可跨平台实现获取按键的方法
2015/03/05 Python
python用来获得图片exif信息的库实例分析
2015/03/16 Python
在java中如何定义一个抽象属性示例详解
2017/08/18 Python
详解如何利用Cython为Python代码加速
2018/01/27 Python
Python生成短uuid的方法实例详解
2018/05/29 Python
解决Django删除migrations文件夹中的文件后出现的异常问题
2019/08/31 Python
python利用Excel读取和存储测试数据完成接口自动化教程
2020/04/30 Python
Python使用pdb调试代码的技巧
2020/05/03 Python
Tensorflow实现将标签变为one-hot形式
2020/05/22 Python
两种CSS3伪类选择器详细介绍
2013/12/24 HTML / CSS
StubHub智利:购买和出售您的门票
2016/11/23 全球购物
期中考试后的反思
2014/02/08 职场文书
大三学年自我鉴定范文(3篇)
2014/09/28 职场文书
2014年保卫部工作总结
2014/11/21 职场文书
护士自荐信范文
2015/03/25 职场文书
女性健康知识讲座通知
2015/04/23 职场文书
opencv读取视频并保存图像的方法
2021/06/04 Python