对pandas写入读取h5文件的方法详解


Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的。 使用压缩可以提磁盘利用率,节省空间。 开启压缩也没有什么劣势,只会慢一点点。 压缩在小数据量的时候优势不明显,数据量大了才有优势。 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖。

另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不知道如果使用该包存pd.DataFrame格式的文件,不像numpy格式文件可以直接存储,因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数:pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据,9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储:
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数:pd.read_hdf

参数:文件名,key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3.3实现乘法表示例
Feb 07 Python
python实现文本去重且不打乱原本顺序
Jan 26 Python
Python制作Windows系统服务
Mar 25 Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 Python
对python的文件内注释 help注释方法
May 23 Python
Python中关键字global和nonlocal的区别详解
Sep 03 Python
django2.0扩展用户字段示例
Feb 13 Python
python中sort和sorted排序的实例方法
Aug 26 Python
PyTorch中反卷积的用法详解
Dec 30 Python
Python matplotlib修改默认字体的操作
Mar 05 Python
Python3内置函数chr和ord实现进制转换
Jun 05 Python
python的列表生成式,生成器和generator对象你了解吗
Mar 16 Python
Python线程池模块ThreadPoolExecutor用法分析
Dec 28 #Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 #Python
python 检查是否为中文字符串的方法
Dec 28 #Python
浅谈python3发送post请求参数为空的情况
Dec 28 #Python
python3使用flask编写注册post接口的方法
Dec 28 #Python
python通过tcp发送xml报文的方法
Dec 28 #Python
对python 生成拼接xml报文的示例详解
Dec 28 #Python
You might like
php 服务器调试 Zend Debugger 的安装教程
2009/09/25 PHP
php简单开启gzip压缩方法(zlib.output_compression)
2013/04/13 PHP
PHP通过内置函数memory_get_usage()获取内存使用情况
2014/11/20 PHP
PHP5多态性与动态绑定介绍
2015/04/03 PHP
PHP+swoole实现简单多人在线聊天群发
2016/01/19 PHP
jquery 简单图片导航插件jquery.imgNav.js
2010/03/17 Javascript
jQuery.ajax 用户登录验证代码
2010/10/29 Javascript
javascript动态添加样式(行内式/嵌入式/外链式等规则)
2013/06/24 Javascript
jQuery插件EasyUI校验规则 validatebox验证框
2015/11/29 Javascript
jQuery实现图像旋转动画效果
2016/05/29 Javascript
D3.js实现柱状图的方法详解
2016/09/21 Javascript
bootstrap模态框消失问题的解决方法
2016/12/02 Javascript
轻松理解Javascript变量的相关问题
2017/01/20 Javascript
bootstrap的常用组件和栅格式布局详解
2017/05/02 Javascript
Angular.js指令学习中一些重要属性的用法教程
2017/05/24 Javascript
JavaScript程序设计高级算法之动态规划实例分析
2017/11/24 Javascript
开发Vue树形组件的示例代码
2017/12/21 Javascript
基于node搭建服务器,写接口,调接口,跨域的实例
2018/05/13 Javascript
解析vue data不可以使用箭头函数问题
2018/07/03 Javascript
JS浮点数运算结果不精确的Bug解决
2019/08/01 Javascript
如何利用JavaScript编写更好的条件语句详解
2020/08/10 Javascript
python中字符串变二维数组的实例讲解
2018/04/03 Python
python 把列表转化为字符串的方法
2018/10/23 Python
利用Python脚本批量生成SQL语句
2020/03/04 Python
小学教师学期末自我评价
2013/09/25 职场文书
大学生就业自我推荐信
2014/05/10 职场文书
巾帼建功标兵事迹材料
2014/05/11 职场文书
放飞梦想演讲稿600字
2014/08/26 职场文书
教师个人查摆剖析材料
2014/10/14 职场文书
写给孩子的新学期寄语
2015/02/27 职场文书
2015年端午节活动策划书
2015/05/05 职场文书
学校教学管理制度
2015/08/06 职场文书
在JavaScript中如何使用宏详解
2021/05/06 Javascript
JavaScript实现班级抽签小程序
2021/05/19 Javascript
MySQL快速插入一亿测试数据
2021/06/23 MySQL
青岛市的收音机研制与生产
2022/04/07 无线电