对pandas写入读取h5文件的方法详解


Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的。 使用压缩可以提磁盘利用率,节省空间。 开启压缩也没有什么劣势,只会慢一点点。 压缩在小数据量的时候优势不明显,数据量大了才有优势。 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖。

另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不知道如果使用该包存pd.DataFrame格式的文件,不像numpy格式文件可以直接存储,因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数:pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据,9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储:
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数:pd.read_hdf

参数:文件名,key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python利用matplotlib生成图片背景及图例透明的效果
Apr 27 Python
简单实现python进度条脚本
Dec 18 Python
python selenium UI自动化解决验证码的4种方法
Jan 05 Python
浅谈flask中的before_request与after_request
Jan 20 Python
python 获取文件下所有文件或目录os.walk()的实例
Apr 23 Python
python多任务及返回值的处理方法
Jan 22 Python
Apache部署Django项目图文详解
Jul 30 Python
基于python实现的百度新歌榜、热歌榜下载器(附代码)
Aug 05 Python
Python使用matplotlib实现交换式图形显示功能示例
Sep 06 Python
Python常用数据类型之间的转换总结
Sep 06 Python
Python 读取有公式cell的结果内容实例方法
Feb 17 Python
使用python无账号无限制获取企查查信息的实例代码
Apr 17 Python
Python线程池模块ThreadPoolExecutor用法分析
Dec 28 #Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 #Python
python 检查是否为中文字符串的方法
Dec 28 #Python
浅谈python3发送post请求参数为空的情况
Dec 28 #Python
python3使用flask编写注册post接口的方法
Dec 28 #Python
python通过tcp发送xml报文的方法
Dec 28 #Python
对python 生成拼接xml报文的示例详解
Dec 28 #Python
You might like
无限级别菜单的实现
2006/10/09 PHP
PHP最常用的ini函数分析 针对PHP.ini配置文件
2010/04/22 PHP
基于thinkPHP3.2实现微信接入及查询token值的方法
2017/04/18 PHP
javascript date格式化示例
2013/09/25 Javascript
js获取URL的参数的方法(getQueryString)示例
2013/09/29 Javascript
js调试工具console.log()方法查看js代码的执行情况
2014/08/08 Javascript
js判断上传文件后缀名是否合法
2016/01/28 Javascript
JS清除字符串中重复值的实现方法
2016/08/03 Javascript
解析JavaScript实现DDoS攻击原理与保护措施
2016/12/26 Javascript
js Canvas绘制圆形时钟教程
2017/02/06 Javascript
详解使用fetch发送post请求时的参数处理
2017/04/05 Javascript
jQuery+Ajax实现用户名重名实时检测
2017/06/01 jQuery
Node.js 回调函数实例详解
2017/07/06 Javascript
iscroll实现下拉刷新功能
2017/07/18 Javascript
深入理解JavaScript和TypeScript中的class
2018/04/22 Javascript
Javascript的console['']常用输入方法汇总
2018/04/26 Javascript
原生JS实现轮播图效果
2018/10/12 Javascript
elementUI vue this.$confirm 和el-dialog 弹出框 移动 示例demo
2019/07/03 Javascript
vue+echarts实现中国地图流动效果(步骤详解)
2021/01/27 Vue.js
python根据路径导入模块的方法
2014/09/30 Python
windows下python连接oracle数据库
2017/06/07 Python
python中正则表达式的使用方法
2018/02/25 Python
python 遍历目录(包括子目录)下所有文件的实例
2018/07/11 Python
一篇文章搞懂Python的类与对象名称空间
2018/12/10 Python
使用TFRecord存取多个数据案例
2020/02/17 Python
美国球鞋寄卖网站:Stadium Goods
2018/05/09 全球购物
英国银首饰公司:e&e Jewellery
2021/02/11 全球购物
《识字五》教学反思
2014/03/01 职场文书
护理专业毕业生自我鉴定总结
2014/03/24 职场文书
技术合作协议书范本
2014/04/18 职场文书
副检察长四风问题对照检查材料思想汇报
2014/10/07 职场文书
活动经费申请报告
2015/05/15 职场文书
团支部书记竞选稿
2015/11/21 职场文书
《岳阳楼记》原文、译文赏析
2019/09/10 职场文书
JDBC连接的六步实例代码(与mysql连接)
2021/05/12 MySQL
人工智能深度学习OpenAI baselines的使用方法
2022/05/20 Python