对pandas写入读取h5文件的方法详解


Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的。 使用压缩可以提磁盘利用率,节省空间。 开启压缩也没有什么劣势,只会慢一点点。 压缩在小数据量的时候优势不明显,数据量大了才有优势。 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖。

另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不知道如果使用该包存pd.DataFrame格式的文件,不像numpy格式文件可以直接存储,因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数:pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据,9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储:
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数:pd.read_hdf

参数:文件名,key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python序列操作之进阶篇
Dec 08 Python
Python2和Python3中print的用法示例总结
Oct 25 Python
使用django-crontab实现定时任务的示例
Feb 26 Python
Python Grid使用和布局详解
Jun 30 Python
Python如何调用外部系统命令
Aug 07 Python
python文字和unicode/ascll相互转换函数及简单加密解密实现代码
Aug 12 Python
Python logging设置和logger解析
Aug 28 Python
python图形开发GUI库pyqt5的基本使用方法详解
Feb 14 Python
python实现滑雪游戏
Feb 22 Python
利用python实现后端写网页(flask框架)
Feb 28 Python
Python基础学习之奇异的GUI对话框
May 27 Python
python利用while求100内的整数和方式
Nov 07 Python
Python线程池模块ThreadPoolExecutor用法分析
Dec 28 #Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 #Python
python 检查是否为中文字符串的方法
Dec 28 #Python
浅谈python3发送post请求参数为空的情况
Dec 28 #Python
python3使用flask编写注册post接口的方法
Dec 28 #Python
python通过tcp发送xml报文的方法
Dec 28 #Python
对python 生成拼接xml报文的示例详解
Dec 28 #Python
You might like
php去除HTML标签实例
2013/11/06 PHP
PHP判断一个字符串是否是回文字符串的方法
2015/03/23 PHP
laravel邮件发送的实现代码示例
2020/01/31 PHP
javascript Excel操作知识点
2009/04/24 Javascript
javascript 获取url参数和script标签中获取url参数函数代码
2010/01/22 Javascript
javascript中使用css需要注意的地方小结
2010/09/01 Javascript
jquery remove方法应用详解
2012/11/22 Javascript
JavaScript中的Truthy和Falsy介绍
2015/01/01 Javascript
JavaScript截取指定长度字符串点击可以展开全部代码
2015/12/04 Javascript
JavaScript中解决多浏览器兼容性23个问题的快速解决方法
2016/05/19 Javascript
seajs模块之间依赖的加载以及模块的执行
2016/10/21 Javascript
浅谈JavaScript事件绑定的常用方法及其优缺点分析
2016/11/01 Javascript
在页面中引入js的两种方法(推荐)
2017/08/29 Javascript
JS中精巧的自动柯里化实现方法
2017/12/12 Javascript
解决vue axios的封装 请求状态的错误提示问题
2018/09/25 Javascript
手挽手带你学React之React-router4.x的使用
2019/02/14 Javascript
JS 封装父页面子页面交互接口的实例代码
2019/06/25 Javascript
vue-router 2.0 跳转之router.push()用法说明
2020/08/12 Javascript
关于uniApp editor微信滑动问题
2021/01/15 Javascript
[04:03]DOTA2英雄梦之声_第02期_风暴之灵
2014/06/30 DOTA
基于wxpython实现的windows GUI程序实例
2015/05/30 Python
用python做一个搜索引擎(Pylucene)的实例代码
2017/07/05 Python
解决Python的str强转int时遇到的问题
2018/04/09 Python
python爬虫之快速对js内容进行破解
2019/07/09 Python
给大家整理了19个pythonic的编程习惯(小结)
2019/09/25 Python
Python如何使用ElementTree解析xml
2020/10/12 Python
Python开发.exe小工具的详细步骤
2021/01/27 Python
新加坡最受追捧的体验平台:Hapz
2018/01/01 全球购物
C/C++程序员常见面试题一
2012/12/08 面试题
vue实现倒计时功能
2021/03/24 Vue.js
法制宣传日活动总结
2014/04/29 职场文书
委托书怎样写
2014/08/30 职场文书
语文复习计划
2015/01/19 职场文书
商务邀请函
2015/01/30 职场文书
幼儿园辞职信范文
2015/02/27 职场文书
元旦晚会开场白
2015/05/29 职场文书