编程 Python

对pandas写入读取h5文件的方法详解

Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩，使用的方式是blosc，这个是速度最快的也是pandas默认支持的。使用压缩可以提磁盘利用率，节省空间。开启压缩也没有什么劣势，只会慢一点点。压缩在小数据量的时候优势不明显，数据量大了才有优势。同时发现hdf读取文件的时候只能是一次写，写的时候可以append，可以put，但是写完成了之后关闭文件，就不能再写了，会覆盖。

另外，为什么单独说pandas，主要因为本人目前对于h5py这个包的理解不是很深入，不知道如果使用该包存pd.DataFrame格式的文件，不像numpy格式文件可以直接存储，因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数：pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据，9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储：
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数：pd.read_hdf

参数：文件名，key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

对pandas写入读取h5文件的方法详解

- Author -

hzau_yang

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python双向链表实现实例代码

Nov 21 Python

python pdb调试方法分享

Jan 21 Python

python实现逆波兰计算表达式实例详解

May 06 Python

给你选择Python语言实现机器学习算法的三大理由

Nov 15 Python

解决Python requests库编码 socks5代理的问题

May 07 Python

Python实现的连接mssql数据库操作示例

Aug 17 Python

Python 通过调用接口获取公交信息的实例

Dec 17 Python

Python学习笔记之变量、自定义函数用法示例

May 28 Python

python中时间转换datetime和pd.to_datetime详析

Aug 11 Python

Jupyter Notebook折叠输出的内容实例

Apr 22 Python

利用python调用摄像头的实例分析

Jun 07 Python

Python socket如何解析HTTP请求内容

Feb 12 Python

Python线程池模块ThreadPoolExecutor用法分析

Dec 28 #Python

Python实现的逻辑回归算法示例【附测试csv文件下载】

Dec 28 #Python

python 检查是否为中文字符串的方法

Dec 28 #Python

浅谈python3发送post请求参数为空的情况

Dec 28 #Python

python3使用flask编写注册post接口的方法

Dec 28 #Python

python通过tcp发送xml报文的方法

Dec 28 #Python

对python 生成拼接xml报文的示例详解

Dec 28 #Python

You might like

php设计模式 Visitor 访问者模式

2011/06/28 PHP

PHP中返回引用类型的方法

2015/04/03 PHP

PHP SPL标准库之文件操作(SplFileInfo和SplFileObject)实例

2015/05/11 PHP

Yii2中使用asset压缩js,css文件的方法

2016/11/24 PHP

简单谈谈PHP中的Reload操作

2016/12/12 PHP

完美的php分页类

2017/10/24 PHP

js向上无缝滚动,网站公告效果具体代码

2013/11/18 Javascript

node.js中的querystring.parse方法使用说明

2014/12/10 Javascript

理解AngularJs指令

2015/12/10 Javascript

jquery.validate 自定义验证方法及validate相关参数

2016/01/18 Javascript

jQuery实现的文字hover颜色渐变效果实例

2016/02/20 Javascript

基于jQuery实现选项卡效果

2017/01/04 Javascript

js脚本编写简单刷票投票系统

2017/06/27 Javascript

JavaScript函数绑定用法实例分析

2017/11/14 Javascript

分析JS中this引发的bug

2017/12/12 Javascript

Bootbox将后台JSON数据填充Form表单的实例代码

2018/09/10 Javascript

基于Vue-cli快速搭建项目的完整步骤

2018/11/03 Javascript

vue 设置 input 为不可以编辑的实现方法

2019/09/19 Javascript

使用Protocol Buffers的C语言拓展提速Python程序的示例

2015/04/16 Python

详解Python中break语句的用法

2015/05/14 Python

使用Django Form解决表单数据无法动态刷新的两种方法

2017/07/14 Python

Python编程pygal绘图实例之XY线

2017/12/09 Python

pandas.DataFrame选取/排除特定行的方法

2018/07/03 Python

Python 实现某个功能每隔一段时间被执行一次的功能方法

2018/10/14 Python

浅谈Python基础—判断和循环

2019/03/22 Python

详解Python下载图片并保存本地的两种方式

2019/05/15 Python

Windows平台Python编程必会模块之pywin32介绍

2019/10/01 Python

使用Python完成15位18位身份证的互转功能

2019/11/06 Python

使用tensorflow DataSet实现高效加载变长文本输入

2020/01/20 Python

使用Django和Postgres进行全文搜索的实例代码

2020/02/13 Python

Python loguru日志库之高效输出控制台日志和日志记录

2020/03/07 Python

英国家电直销：Appliances Direct

2016/09/22 全球购物

新大陆软件面试题

2016/11/24 面试题

自荐信的禁忌和要点

2013/10/15 职场文书

司机岗位职责说明书

2014/07/29 职场文书

2015年师德师风承诺书

2015/01/22 职场文书