Python数据存储之 h5py详解


Posted in Python onDecember 26, 2019

1、Python数据存储(压缩)

(1)numpy.save , numpy.savez , scipy.io.savemat

numpy和scipy内建的数据存储方式。

(2)cPickle + gzip

cPickle是pickle内建的数据存储方式,gzip是常用的文件压缩模块。

(3)h5py

h5py是对HDF5文件格式进行读写的python包,关于h5py更多介绍与安装,参考官方网站

关于HDF5,参考官方网站。:

一个HDF5文件就是一个由两种基本数据对象(groups and datasets)存放多种科学数据的容器:

HDF5 dataset: 数据元素的一个多维数组以及支持元数据(metadata); HDF5 group: 包含0个或多个HDF5对象以及支持元数据(metadata)的一个群组结构;

总之,dataset是类似于数组的数据集,而group是类似文件夹一样的容器,存放dataset和其他group;group和dataset在h5py中的使用有点类似于词典和Numpy中数组的用法。

h5py的优势:速度快、压缩效率高,总之,numpy.savez和cPickle存储work或不work的都可以试一试h5py!

2、h5py读取和存储数据示例

import h5py
X= np.random.rand(100, 1000, 1000).astype('float32')
y = np.random.rand(1, 1000, 1000).astype('float32')

# Create a new file
f = h5py.File('data.h5', 'w')
f.create_dataset('X_train', data=X)
f.create_dataset('y_train', data=y)
f.close()

# Load hdf5 dataset
f = h5py.File('data.h5', 'r')
X = f['X_train']
Y = f['y_train']
f.close()

详细使用方法,参考官网。

以上这篇Python数据存储之 h5py详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现把数字转换成中文
Jun 29 Python
使用python调用zxing库生成二维码图片详解
Jan 10 Python
Python线性回归实战分析
Feb 01 Python
Ubuntu下使用Python实现游戏制作中的切分图片功能
Mar 30 Python
对Python 内建函数和保留字详解
Oct 15 Python
django2笔记之路由path语法的实现
Jul 17 Python
python读取Excel表格文件的方法
Sep 02 Python
python脚本调用iftop 统计业务应用流量的思路详解
Oct 11 Python
详解python 破解网站反爬虫的两种简单方法
Feb 09 Python
python opencv pytesseract 验证码识别的实现
Aug 28 Python
Pytorch之Tensor和Numpy之间的转换的实现方法
Sep 03 Python
python for循环赋值问题
Jun 03 Python
Python 使用 prettytable 库打印表格美化输出功能
Dec 26 #Python
Python实现图片识别加翻译功能
Dec 26 #Python
opencv resize图片为正方形尺寸的实现方法
Dec 26 #Python
opencv之为图像添加边界的方法示例
Dec 26 #Python
Python 过滤错误log并导出的实例
Dec 26 #Python
python3 pathlib库Path类方法总结
Dec 26 #Python
python3实现在二叉树中找出和为某一值的所有路径(推荐)
Dec 26 #Python
You might like
有关PHP性能优化的介绍
2013/06/20 PHP
javascript监听鼠标滚轮事件浅析
2014/06/05 Javascript
提升PHP安全:8个必须修改的PHP默认配置
2014/11/17 Javascript
创建自己的jquery表格插件
2015/11/25 Javascript
jQuery实现简单隔行变色的方法
2016/02/20 Javascript
完善的jquery处理机制
2016/02/21 Javascript
AngularJS 验证码60秒倒计时功能的实现
2017/06/05 Javascript
windows下更新npm和node的方法
2017/11/30 Javascript
解决vue-cli3 使用子目录部署问题
2018/07/19 Javascript
Angular Excel 导入与导出的实现代码
2019/04/17 Javascript
jQuery 判断元素是否存在然后按需加载内容的实现代码
2020/01/16 jQuery
vue中v-for循环选中点击的元素并对该元素添加样式操作
2020/07/17 Javascript
[54:19]完美世界DOTA2联赛PWL S2 Magma vs PXG 第二场 11.28
2020/12/01 DOTA
python之Socket网络编程详解
2016/09/29 Python
Python做文本按行去重的实现方法
2016/10/19 Python
Python实现的密码强度检测器示例
2017/08/23 Python
基于Python中capitalize()与title()的区别详解
2017/12/09 Python
Python闭包执行时值的传递方式实例分析
2018/06/04 Python
[原创]Python入门教程2. 字符串基本操作【运算、格式化输出、常用函数】
2018/10/29 Python
Python中查看变量的类型内存地址所占字节的大小
2019/06/26 Python
详解pycharm连接不上mysql数据库的解决办法
2020/01/10 Python
pycharm 实现复制一行的快捷键
2021/01/15 Python
美国畅销的跑步机品牌:ProForm
2017/02/06 全球购物
英国最受信任的在线眼镜商之一:Fashion Eyewear
2019/10/31 全球购物
高中生校园生活自我评价
2013/09/19 职场文书
高中军训感言800字
2014/03/05 职场文书
保护动物的标语
2014/06/11 职场文书
2014年银行员工年终自我评价
2014/09/19 职场文书
2015年员工工作表现评语
2015/03/25 职场文书
个人催款函范文
2015/06/23 职场文书
单位车辆管理制度
2015/08/05 职场文书
中学生运动会广播稿
2015/08/19 职场文书
幼儿教师继续教育培训心得体会
2016/01/19 职场文书
几款流行的HTML5 UI框架比较(小结)
2021/04/08 HTML / CSS
python开发飞机大战游戏
2021/07/15 Python
室外天线与收音机天线杆接合方法
2022/04/05 无线电