对pandas写入读取h5文件的方法详解


Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的。 使用压缩可以提磁盘利用率,节省空间。 开启压缩也没有什么劣势,只会慢一点点。 压缩在小数据量的时候优势不明显,数据量大了才有优势。 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖。

另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不知道如果使用该包存pd.DataFrame格式的文件,不像numpy格式文件可以直接存储,因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数:pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据,9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储:
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数:pd.read_hdf

参数:文件名,key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python双向链表实现实例代码
Nov 21 Python
python pdb调试方法分享
Jan 21 Python
python实现逆波兰计算表达式实例详解
May 06 Python
给你选择Python语言实现机器学习算法的三大理由
Nov 15 Python
解决Python requests库编码 socks5代理的问题
May 07 Python
Python实现的连接mssql数据库操作示例
Aug 17 Python
Python 通过调用接口获取公交信息的实例
Dec 17 Python
Python学习笔记之变量、自定义函数用法示例
May 28 Python
python中时间转换datetime和pd.to_datetime详析
Aug 11 Python
Jupyter Notebook折叠输出的内容实例
Apr 22 Python
利用python调用摄像头的实例分析
Jun 07 Python
Python socket如何解析HTTP请求内容
Feb 12 Python
Python线程池模块ThreadPoolExecutor用法分析
Dec 28 #Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 #Python
python 检查是否为中文字符串的方法
Dec 28 #Python
浅谈python3发送post请求参数为空的情况
Dec 28 #Python
python3使用flask编写注册post接口的方法
Dec 28 #Python
python通过tcp发送xml报文的方法
Dec 28 #Python
对python 生成拼接xml报文的示例详解
Dec 28 #Python
You might like
php设计模式 Visitor 访问者模式
2011/06/28 PHP
PHP中返回引用类型的方法
2015/04/03 PHP
PHP SPL标准库之文件操作(SplFileInfo和SplFileObject)实例
2015/05/11 PHP
Yii2中使用asset压缩js,css文件的方法
2016/11/24 PHP
简单谈谈PHP中的Reload操作
2016/12/12 PHP
完美的php分页类
2017/10/24 PHP
js向上无缝滚动,网站公告效果 具体代码
2013/11/18 Javascript
node.js中的querystring.parse方法使用说明
2014/12/10 Javascript
理解AngularJs指令
2015/12/10 Javascript
jquery.validate 自定义验证方法及validate相关参数
2016/01/18 Javascript
jQuery实现的文字hover颜色渐变效果实例
2016/02/20 Javascript
基于jQuery实现选项卡效果
2017/01/04 Javascript
js脚本编写简单刷票投票系统
2017/06/27 Javascript
JavaScript函数绑定用法实例分析
2017/11/14 Javascript
分析JS中this引发的bug
2017/12/12 Javascript
Bootbox将后台JSON数据填充Form表单的实例代码
2018/09/10 Javascript
基于Vue-cli快速搭建项目的完整步骤
2018/11/03 Javascript
vue 设置 input 为不可以编辑的实现方法
2019/09/19 Javascript
使用Protocol Buffers的C语言拓展提速Python程序的示例
2015/04/16 Python
详解Python中break语句的用法
2015/05/14 Python
使用Django Form解决表单数据无法动态刷新的两种方法
2017/07/14 Python
Python编程pygal绘图实例之XY线
2017/12/09 Python
pandas.DataFrame选取/排除特定行的方法
2018/07/03 Python
Python 实现某个功能每隔一段时间被执行一次的功能方法
2018/10/14 Python
浅谈Python基础—判断和循环
2019/03/22 Python
详解Python下载图片并保存本地的两种方式
2019/05/15 Python
Windows平台Python编程必会模块之pywin32介绍
2019/10/01 Python
使用Python完成15位18位身份证的互转功能
2019/11/06 Python
使用tensorflow DataSet实现高效加载变长文本输入
2020/01/20 Python
使用Django和Postgres进行全文搜索的实例代码
2020/02/13 Python
Python loguru日志库之高效输出控制台日志和日志记录
2020/03/07 Python
英国家电直销:Appliances Direct
2016/09/22 全球购物
新大陆软件面试题
2016/11/24 面试题
自荐信的禁忌和要点
2013/10/15 职场文书
司机岗位职责说明书
2014/07/29 职场文书
2015年师德师风承诺书
2015/01/22 职场文书