编程 Python

Python Numpy中数据的常用保存与读取方法

Posted in Python onApril 01, 2020

在经常性读取大量的数值文件时(比如深度学习训练数据),可以考虑现将数据存储为Numpy格式,然后直接使用Numpy去读取,速度相比为转化前快很多.

下面就常用的保存数据到二进制文件和保存数据到文本文件进行介绍:

1.保存为二进制文件(.npy/.npz)

numpy.save

保存一个数组到一个二进制的文件中,保存格式是.npy

参数介绍

numpy.save(file, arr, allow_pickle=True, fix_imports=True)
file:文件名/文件路径
arr:要存储的数组
allow_pickle:布尔值,允许使用Python pickles保存对象数组(可选参数,默认即可)
fix_imports:为了方便Pyhton2中读取Python3保存的数据(可选参数,默认即可)

使用

>>> import numpy as np 
#生成数据 
>>> x=np.arange(10) 
>>> x 
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
 
#数据保存 
>>> np.save('save_x',x) 
 
#读取保存的数据 
>>> np.load('save_x.npy') 
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
numpy.savez

这个同样是保存数组到一个二进制的文件中,但是厉害的是,它可以保存多个数组到同一个文件中,保存格式是.npz,它其实就是多个前面np.save的保存的npy,再通过打包(未压缩)的方式把这些文件归到一个文件上,不行你去解压npz文件就知道了,里面是就是自己保存的多个npy.

参数介绍

numpy.savez(file, *args, **kwds)
file:文件名/文件路径
*args:要存储的数组,可以写多个,如果没有给数组指定Key,Numpy将默认从'arr_0','arr_1'的方式命名
kwds:(可选参数,默认即可)

使用

>>> import numpy as np 
#生成数据 
>>> x=np.arange(10) 
>>> x 
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
>>> y=np.sin(x) 
>>> y 
array([ 0.  , 0.84147098, 0.90929743, 0.14112001, -0.7568025 , 
  -0.95892427, -0.2794155 , 0.6569866 , 0.98935825, 0.41211849]) 
  
#数据保存 
>>> np.save('save_xy',x,y) 
 
#读取保存的数据 
>>> npzfile=np.load('save_xy.npz') 
>>> npzfile #是一个对象,无法读取 
<numpy.lib.npyio.NpzFile object at 0x7f63ce4c8860> 
 
#按照组数默认的key进行访问 
>>> npzfile['arr_0'] 
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
>>> npzfile['arr_1'] 
array([ 0.  , 0.84147098, 0.90929743, 0.14112001, -0.7568025 , 
  -0.95892427, -0.2794155 , 0.6569866 , 0.98935825, 0.41211849])

更加神奇的是,你可以不适用Numpy默认给数组的Key,而是自己给数组有意义的Key,这样就可以不用去猜测自己加载数据是否是自己需要的.

#数据保存 
>>> np.savez('newsave_xy',x=x,y=y) 
 
#读取保存的数据 
>>> npzfile=np.load('newsave_xy.npz') 
 
#按照保存时设定组数key进行访问 
>>> npzfile['x'] 
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) 
>>> npzfile['y'] 
array([ 0.  , 0.84147098, 0.90929743, 0.14112001, -0.7568025 , 
  -0.95892427, -0.2794155 , 0.6569866 , 0.98935825, 0.41211849])

简直不能太爽,深度学习中,有时候你保存了训练集,验证集,测试集,还包括他们的标签,用这个方式存储起来,要啥加载啥,文件数量大大减少,也不会到处改文件名去.

numpy.savez_compressed

这个就是在前面numpy.savez的基础上加了压缩,前面我介绍时尤其注明numpy.savez是得到的文件打包,不压缩的.这个文件就是对文件进行打包时使用了压缩,可以理解为压缩前各npy的文件大小不变,使用该函数比前面的numpy.savez得到的npz文件更小.

注:函数所需参数和numpy.savez一致,用法完成一样.

2.保存到文本文件

numpy.savetxt

保存数组到文本文件上,可以直接打开查看文件里面的内容.

参数介绍

numpy.savetxt(fname, X, fmt='%.18e', delimiter=' ', newline='\n', header='', footer='', comments='# ', encoding=None)
fname:文件名/文件路径,如果文件后缀是.gz,文件将被自动保存为.gzip格式,np.loadtxt可以识别该格式
X:要存储的1D或2D数组
fmt:控制数据存储的格式
delimiter:数据列之间的分隔符
newline:数据行之间的分隔符
header:文件头步写入的字符串
footer:文件底部写入的字符串
comments:文件头部或者尾部字符串的开头字符,默认是'#'
encoding:使用默认参数

使用

>>> import numpy as np 
#生成数据 
>>> x = y = z = np.ones((2,3)) 
>>> x 
array([[1., 1., 1.], 
  [1., 1., 1.]]) 
  
#保存数据 
np.savetxt('test.out', x) 
np.savetxt('test1.out', x,fmt='%1.4e') 
np.savetxt('test2.out', x, delimiter=',') 
np.savetxt('test3.out', x,newline='a') 
np.savetxt('test4.out', x,delimiter=',',newline='a') 
np.savetxt('test5.out', x,delimiter=',',header='abc') 
np.savetxt('test6.out', x,delimiter=',',footer='abc')

保存下来的文件都是友好的,可以直接打开看看有什么变化.

numpy.loadtxt

根据前面定制的保存格式,相应的加载数据的函数也得变化.

参数介绍

numpy.loadtxt(fname, dtype=<class 'float'>, comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0, encoding='bytes')
fname:文件名/文件路径,如果文件后缀是.gz或.bz2,文件将被解压,然后再载入
dtype:要读取的数据类型
comments:文件头部或者尾部字符串的开头字符,用于识别头部,尾部字符串
delimiter:划分读取上来值的字符串
converters:数据行之间的分隔符
.......后面不常用的就不写了

使用

np.loadtxt('test.out') 
np.loadtxt('test2.out', delimiter=',')

总结

到此这篇关于Python Numpy中数据的常用保存与读取方法的文章就介绍到这了,更多相关python numpy 数据保存读取内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Python Numpy中数据的常用保存与读取方法

- Author -

Python探索牛

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中encode()方法的使用简介

May 18 Python

使用requests库制作Python爬虫

Mar 25 Python

python的dataframe和matrix的互换方法

Apr 11 Python

基于pip install django失败时的解决方法

Jun 12 Python

python使用参数对嵌套字典进行取值的方法

Apr 26 Python

python实现爬虫抓取小说功能示例【抓取金庸小说】

Aug 09 Python

Python高级编程之消息队列(Queue)与进程池(Pool)实例详解

Nov 01 Python

pyinstaller打包成无控制台程序时运行出错(与popen冲突的解决方法)

Apr 15 Python

Python定义一个函数的方法

Jun 15 Python

推荐技术人员一款Python开源库(造数据神器)

Jul 08 Python

python中pyplot基础图标函数整理

Nov 10 Python

解决Pymongo insert时会自动添加_id的问题

Dec 05 Python

Python PyQt5整理介绍

Apr 01 #Python

django之导入并执行自定义的函数模块图解

Apr 01 #Python

在脚本中单独使用django的ORM模型详解

Apr 01 #Python

Python视频编辑库MoviePy的使用

Apr 01 #Python

python json.dumps中文乱码问题解决

Apr 01 #Python

Django Admin后台添加数据库视图过程解析

Apr 01 #Python

pyqt5中动画的使用详解

Apr 01 #Python

You might like

PHP中操作ini配置文件的方法

2013/04/25 PHP

smarty内置函数{loteral}、{ldelim}和{rdelim}用法实例

2015/01/22 PHP

Yii控制器中filter过滤器用法分析

2016/07/15 PHP

phpmailer绑定邮箱的实现方法

2016/12/01 PHP

jQuery 1.4 15个你应该知道的新特性(译)

2010/01/24 Javascript

jquery 3D球状导航的文章分类

2010/07/06 Javascript

JS时间选择器兼容IE6,7,8,9

2012/06/26 Javascript

window.open以post方式将内容提交到新窗口

2012/12/26 Javascript

JS验证邮箱格式是否正确的代码

2013/12/05 Javascript

JavaScript实现的简单幂函数实例

2015/04/17 Javascript

js验证身份证号有效性并提示对应信息

2015/10/19 Javascript

JQuery DIV 动态隐藏和显示的方法

2016/06/23 Javascript

使用Angular.js实现简单的购物车功能

2016/11/21 Javascript

自定义vue全局组件use使用、vuex的使用详解

2017/06/14 Javascript

详解angularJS自定义指令间的相互交互

2017/07/05 Javascript

解决使用vue.js路由后失效的问题

2018/03/17 Javascript

LayUi中接口传数据成功,表格不显示数据的解决方法

2018/08/19 Javascript

8个有意思的JavaScript面试题

2019/07/30 Javascript

python和shell实现的校验IP地址合法性脚本分享

2014/10/23 Python

python去掉空白行的多种实现代码

2018/03/19 Python

python3模块smtplib实现发送邮件功能

2018/05/22 Python

Python中flatten( )函数及函数用法详解

2018/11/02 Python

Python PIL读取的图像发生自动旋转的实现方法

2019/07/05 Python

python中time库的实例使用方法

2019/10/31 Python

PythonPC客户端自动化实现原理(pywinauto)

2020/05/28 Python

python3排序的实例方法

2020/10/20 Python

matplotlib运行时配置(Runtime Configuration，rc)参数rcParams解析

2021/01/05 Python

浅析canvas元素的html尺寸和css尺寸对元素视觉的影响

2019/07/22 HTML / CSS

美国Max仓库：Max Warehouse

2020/05/31 全球购物

网络工程师面试(三木通信技术有限公司)

2013/06/05 面试题

学年自我鉴定范文

2013/10/01 职场文书

弘扬雷锋精神活动演讲稿

2014/03/04 职场文书

卫生巾广告词

2014/03/18 职场文书

应聘英语教师求职信

2014/04/24 职场文书

高二语文教学反思

2016/02/16 职场文书

java中为什么说子类的构造方法默认访问的是父类的无参构造方法

2022/04/13 Java/Android