Python整数与Numpy数据溢出问题解决


Posted in Python onSeptember 11, 2019

某位 A 同学发了我一张截图,问为何结果中出现了负数?

Python整数与Numpy数据溢出问题解决

看了图,我第一感觉就是数据溢出了。数据超出能表示的最大值,就会出现奇奇怪怪的结果。

然后,他继续发了张图,内容是 print(100000*208378),就是直接打印上图的 E[0]*G[0],结果是 20837800000,这是个正确的结果。

所以新的问题是:如果说上图的数据溢出了,为何直接相乘的数却没有溢出?

由于我一直忽视数据的表示规则(整型的上限是多少?),而且对 Numpy 了解不多,还错看了图中结果,误以为每一个数据都是错误的,所以就解答不出来。

最后,经过学习群里的一番讨论,我才终于明白是怎么回事,所以本文把相关知识点做个梳理。

在正式开始之前,先总结一下上图会引出的话题:

  • Python 3 中整数的上限是多少?Python 2 呢?
  • Numpy 中整数的上限是多少?出现整数溢出该怎么办?

关于第一个问题,先看看 Python 2,它有两种整数:

  • 一种是短整数,也即常说的整数,用 int 表示,有个内置函数 int()。其大小有限,可通过sys.maxint() 查看(取决于平台是 32 位还是 64 位)
  • 一种是长整数,即大小无限的整数,用 long 表示,有个内置函数 long()。写法上是在数字后面加大写字母 L 或小写的 l,如 1000L

当一个整数超出短整数范围时,它会自动采用长整数表示。举例,打印 2**100 ,结果会在末尾加字母 L 表示它是长整数。

但是到了 Python 3,情况就不同了:它仅有一种内置的整数,表示为 int,形式上是 Python 2 的短整数,但实际上它能表示的范围无限,行为上更像是长整数。无论多大的数,结尾都不需要字母 L 来作区分。

也就是说,Python 3 整合了两种整数表示法,用户不再需要自行区分,全交给底层按需处理。

理论上,Python 3 中的整数没有上限(只要不超出内存空间)。这就解释了前文中直接打印两数相乘,为什么结果会正确了。

PEP-237(Unifying Long Integers and Integers)中对这个转变作了说明。它解释这样做的 目的:

这会给新的 Python 程序员(无论他们是否是编程新手)减少一项上手前要学的功课。

Python 在语言运用层屏蔽了很多琐碎的活,比如内存分配,所以,我们在使用字符串、列表或字典等对象时,根本不用操心。整数类型的转变,也是出于这样的便利目的。(坏处是牺牲了一些效率,在此就不谈了)

回到前面的第二个话题:Numpy 中整数的上限是多少?

由于它是 C 语言实现,在整数表示上,用的是 C 语言的规则,也就是会区分整数和长整数。

有一种方式可查看:

import numpy as np
a = np.arange(2)
type(a[0])
# 结果:numpy.int32

也就是说它默认的整数 int 是 32 位,表示范围在 -2147483648 ~ 2147483647。

对照前文的截图,里面只有两组数字相乘时没有溢出:100007*4549、100012*13264,其它数据组都溢出了,所以出现奇怪的负数结果。

Numpy 支持的数据类型要比 Python 的多,相互间的区分界限很多样:

Python整数与Numpy数据溢出问题解决

截图来源:https://www.runoob.com/numpy/numpy-dtype.html

要解决整数溢出问题,可以通过指定 dtype 的方式:

import numpy as np
q = [100000]
w = [500000]
# 一个溢出的例子:
a = np.array(q)
b = np.array(w)
print(a*b) # 产生溢出,结果是个奇怪的数值
# 一个解决的例子:
c = np.array(q, dtype='int64')
d = np.array(w, dtype='int64')
print(c*d) # 没有溢出:[50000000000]

好了,前面提出的问题就回答完了。来作个结尾吧:

  • Python 3 极大地简化了整数的表示,效果可表述为:整数就只有一种整数(int),没有其它类型的整数(long、int8、int64 之类的)
  • Numpy 中的整数类型对应于 C 语言的数据类型,每种“整数”有自己的区间,要解决数据溢出问题,需要指定更大的数据类型(dtype)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中文编码那些事
Jun 25 Python
python调用机器喇叭发出蜂鸣声(Beep)的方法
Mar 23 Python
python获取文件扩展名的方法
Jul 06 Python
简单了解Django模板的使用
Dec 20 Python
pygame游戏之旅 添加icon和bgm音效的方法
Nov 21 Python
python中matplotlib条件背景颜色的实现
Sep 02 Python
Python PyInstaller安装和使用教程详解
Jan 08 Python
解决tensorboard多个events文件显示紊乱的问题
Feb 15 Python
python tkinter之 复选、文本、下拉的实现
Mar 04 Python
解决python ThreadPoolExecutor 线程池中的异常捕获问题
Apr 08 Python
Django:使用filter的pk进行多值查询操作
Jul 15 Python
Python 利用flask搭建一个共享服务器的步骤
Dec 05 Python
python中通过selenium简单操作及元素定位知识点总结
Sep 10 #Python
用Python画一个LinkinPark的logo代码实例
Sep 10 #Python
Pytorch修改ResNet模型全连接层进行直接训练实例
Sep 10 #Python
django drf框架自带的路由及最简化的视图
Sep 10 #Python
Pytorch中accuracy和loss的计算知识点总结
Sep 10 #Python
python3.7环境下安装Anaconda的教程图解
Sep 10 #Python
Windows10下 python3.7 安装 facenet的教程
Sep 10 #Python
You might like
论建造顺序的重要性
2020/03/04 星际争霸
Thinkphp事务操作实例(推荐)
2017/04/01 PHP
LNMP部署laravel以及xhprof安装使用教程
2017/09/14 PHP
利用Homestead快速运行一个Laravel项目的方法详解
2017/11/14 PHP
PHP基于phpqrcode类生成二维码的方法详解
2018/03/14 PHP
Laravel框架路由和控制器的绑定操作方法
2018/06/12 PHP
Thinkphp5+plupload实现的图片上传功能示例【支持实时预览】
2019/05/08 PHP
Prototype使用指南之string.js
2007/01/10 Javascript
二叉树的非递归后序遍历算法实例详解
2014/02/07 Javascript
无限树Jquery插件zTree的常用功能特性总结
2014/09/11 Javascript
浅析JavaScript中命名空间namespace模式
2016/06/22 Javascript
详解nodejs中express搭建权限管理系统
2017/09/15 NodeJs
js 显示日期时间的实例(时间过一秒加1)
2017/10/25 Javascript
JavaScript 数组去重并统计重复元素出现的次数实例
2017/12/14 Javascript
Node.js创建一个Express服务的方法详解
2020/01/06 Javascript
javascript设计模式 ? 享元模式原理与用法实例分析
2020/04/15 Javascript
JavaScript数组排序的六种常见算法总结
2020/08/18 Javascript
springboot+vue实现文件上传下载
2020/11/17 Vue.js
原生js实现点击按钮复制内容到剪切板
2020/11/19 Javascript
Python 文件数据读写的具体实现
2020/01/24 Python
python下载卫星云图合成gif的方法示例
2020/02/18 Python
python爬虫爬取图片的简单代码
2021/01/18 Python
美国本地交易和折扣网站:LocalFlavor.com
2017/10/26 全球购物
英国健康和美容技术产品购物网站:CurrentBody
2019/07/17 全球购物
校领导推荐信
2013/11/01 职场文书
数控机械专业个人的自我评价
2014/01/02 职场文书
软件项目开发计划书
2014/05/01 职场文书
经典团队口号大全
2014/06/21 职场文书
后勤管理员岗位职责
2014/08/27 职场文书
2015年教师党员公开承诺书
2015/01/22 职场文书
行政主管岗位职责范本
2015/04/09 职场文书
小学德育工作总结2015
2015/05/12 职场文书
水浒传读书笔记
2015/06/25 职场文书
Java实现斗地主之洗牌发牌
2021/06/14 Java/Android
使用kubeadm命令行工具创建kubernetes集群
2022/03/31 Servers
mysql使用 not int 子查询隐含陷阱
2022/04/12 MySQL