Python整数与Numpy数据溢出问题解决


Posted in Python onSeptember 11, 2019

某位 A 同学发了我一张截图,问为何结果中出现了负数?

Python整数与Numpy数据溢出问题解决

看了图,我第一感觉就是数据溢出了。数据超出能表示的最大值,就会出现奇奇怪怪的结果。

然后,他继续发了张图,内容是 print(100000*208378),就是直接打印上图的 E[0]*G[0],结果是 20837800000,这是个正确的结果。

所以新的问题是:如果说上图的数据溢出了,为何直接相乘的数却没有溢出?

由于我一直忽视数据的表示规则(整型的上限是多少?),而且对 Numpy 了解不多,还错看了图中结果,误以为每一个数据都是错误的,所以就解答不出来。

最后,经过学习群里的一番讨论,我才终于明白是怎么回事,所以本文把相关知识点做个梳理。

在正式开始之前,先总结一下上图会引出的话题:

  • Python 3 中整数的上限是多少?Python 2 呢?
  • Numpy 中整数的上限是多少?出现整数溢出该怎么办?

关于第一个问题,先看看 Python 2,它有两种整数:

  • 一种是短整数,也即常说的整数,用 int 表示,有个内置函数 int()。其大小有限,可通过sys.maxint() 查看(取决于平台是 32 位还是 64 位)
  • 一种是长整数,即大小无限的整数,用 long 表示,有个内置函数 long()。写法上是在数字后面加大写字母 L 或小写的 l,如 1000L

当一个整数超出短整数范围时,它会自动采用长整数表示。举例,打印 2**100 ,结果会在末尾加字母 L 表示它是长整数。

但是到了 Python 3,情况就不同了:它仅有一种内置的整数,表示为 int,形式上是 Python 2 的短整数,但实际上它能表示的范围无限,行为上更像是长整数。无论多大的数,结尾都不需要字母 L 来作区分。

也就是说,Python 3 整合了两种整数表示法,用户不再需要自行区分,全交给底层按需处理。

理论上,Python 3 中的整数没有上限(只要不超出内存空间)。这就解释了前文中直接打印两数相乘,为什么结果会正确了。

PEP-237(Unifying Long Integers and Integers)中对这个转变作了说明。它解释这样做的 目的:

这会给新的 Python 程序员(无论他们是否是编程新手)减少一项上手前要学的功课。

Python 在语言运用层屏蔽了很多琐碎的活,比如内存分配,所以,我们在使用字符串、列表或字典等对象时,根本不用操心。整数类型的转变,也是出于这样的便利目的。(坏处是牺牲了一些效率,在此就不谈了)

回到前面的第二个话题:Numpy 中整数的上限是多少?

由于它是 C 语言实现,在整数表示上,用的是 C 语言的规则,也就是会区分整数和长整数。

有一种方式可查看:

import numpy as np
a = np.arange(2)
type(a[0])
# 结果:numpy.int32

也就是说它默认的整数 int 是 32 位,表示范围在 -2147483648 ~ 2147483647。

对照前文的截图,里面只有两组数字相乘时没有溢出:100007*4549、100012*13264,其它数据组都溢出了,所以出现奇怪的负数结果。

Numpy 支持的数据类型要比 Python 的多,相互间的区分界限很多样:

Python整数与Numpy数据溢出问题解决

截图来源:https://www.runoob.com/numpy/numpy-dtype.html

要解决整数溢出问题,可以通过指定 dtype 的方式:

import numpy as np
q = [100000]
w = [500000]
# 一个溢出的例子:
a = np.array(q)
b = np.array(w)
print(a*b) # 产生溢出,结果是个奇怪的数值
# 一个解决的例子:
c = np.array(q, dtype='int64')
d = np.array(w, dtype='int64')
print(c*d) # 没有溢出:[50000000000]

好了,前面提出的问题就回答完了。来作个结尾吧:

  • Python 3 极大地简化了整数的表示,效果可表述为:整数就只有一种整数(int),没有其它类型的整数(long、int8、int64 之类的)
  • Numpy 中的整数类型对应于 C 语言的数据类型,每种“整数”有自己的区间,要解决数据溢出问题,需要指定更大的数据类型(dtype)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python获取单个程序CPU使用情况趋势图
Mar 10 Python
python 实现自动远程登陆scp文件实例代码
Mar 13 Python
tensorflow更改变量的值实例
Jul 30 Python
对python Tkinter Text的用法详解
Oct 11 Python
使用PyCharm创建Django项目及基本配置详解
Oct 24 Python
利用Python实现原创工具的Logo与Help
Dec 03 Python
Django中使用极验Geetest滑动验证码过程解析
Jul 31 Python
python pillow模块使用方法详解
Aug 30 Python
django执行数据库查询之后实现返回的结果集转json
Mar 31 Python
python 将视频 通过视频帧转换成时间实例
Apr 23 Python
Python通过kerberos安全认证操作kafka方式
Jun 06 Python
python模块与C和C++动态库相互调用实现过程示例
Nov 02 Python
python中通过selenium简单操作及元素定位知识点总结
Sep 10 #Python
用Python画一个LinkinPark的logo代码实例
Sep 10 #Python
Pytorch修改ResNet模型全连接层进行直接训练实例
Sep 10 #Python
django drf框架自带的路由及最简化的视图
Sep 10 #Python
Pytorch中accuracy和loss的计算知识点总结
Sep 10 #Python
python3.7环境下安装Anaconda的教程图解
Sep 10 #Python
Windows10下 python3.7 安装 facenet的教程
Sep 10 #Python
You might like
PHP得到mssql的存储过程的输出参数功能实现
2012/11/23 PHP
php实现的百度搜索某地天气的小偷代码
2014/04/23 PHP
让ThinkPHP的模板引擎达到最佳效率的方法详解
2017/03/14 PHP
JS中剪贴板兼容性、判断复制成功或失败
2021/03/09 Javascript
在浏览器窗口上添加遮罩层的方法
2012/11/12 Javascript
Jquery同辈元素选中/未选中效果的实例代码
2013/08/01 Javascript
让JavaScript的Alert弹出框失效的方法禁止弹出警告框
2014/09/03 Javascript
Javascript中的apply()方法浅析
2015/03/15 Javascript
Jquery动态添加输入框的方法
2015/05/29 Javascript
微信小程序  Mustache语法详细介绍
2016/10/27 Javascript
原生js实现秒表计时器功能
2017/02/16 Javascript
Vue获取DOM元素样式和样式更改示例
2017/03/07 Javascript
微信通过页面(H5)直接打开本地app的解决方法
2017/09/09 Javascript
详解webpack + vue + node 打造单页面(入门篇)
2017/09/23 Javascript
node vue项目开发之前后端分离实战记录
2017/12/13 Javascript
红黑树的插入详解及Javascript实现方法示例
2018/03/26 Javascript
使用Object.defineProperty如何巧妙找到修改某个变量的准确代码位置
2018/11/02 Javascript
百度小程序之间的页面通信过程详解
2019/07/18 Javascript
在Vue mounted方法中使用data变量详解
2019/11/05 Javascript
js获取本日、本周、本月的时间代码
2020/02/01 Javascript
谈谈JavaScript中的垃圾回收机制
2020/09/17 Javascript
[56:35]DOTA2上海特级锦标赛主赛事日 - 5 总决赛Liquid VS Secret第一局
2016/03/06 DOTA
python 读写、创建 文件的方法(必看)
2016/09/12 Python
Python输出各行命令详解
2018/02/01 Python
利用python库在局域网内传输文件的方法
2018/06/04 Python
django反向解析URL和URL命名空间的方法
2018/06/05 Python
python日期与时间戳的各种转换示例
2020/02/12 Python
浅谈Python协程
2020/06/17 Python
html5 音乐播放器 audio 标签使用概述
2013/07/15 HTML / CSS
美国最大的珠宝商之一:Littman Jewelers
2016/11/13 全球购物
如何高效率的查找一个月以内的数据
2012/04/15 面试题
中学运动会广播稿
2014/01/19 职场文书
管理失职检讨书范文
2015/05/05 职场文书
离婚律师函范本
2015/05/27 职场文书
2016公务员年度考核评语
2015/12/01 职场文书
总结几个非常实用的Python库
2021/06/26 Python