对pandas写入读取h5文件的方法详解


Posted in Python onDecember 28, 2018

1、引言

通过参考相关博客对hdf5格式简要介绍。

hdf5在存储的是支持压缩,使用的方式是blosc,这个是速度最快的也是pandas默认支持的。 使用压缩可以提磁盘利用率,节省空间。 开启压缩也没有什么劣势,只会慢一点点。 压缩在小数据量的时候优势不明显,数据量大了才有优势。 同时发现hdf读取文件的时候只能是一次写,写的时候可以append,可以put,但是写完成了之后关闭文件,就不能再写了, 会覆盖。

另外,为什么单独说pandas,主要因为本人目前对于h5py这个包的理解不是很深入,不知道如果使用该包存pd.DataFrame格式的文件,不像numpy格式文件可以直接存储,因此本人只能依赖pandas自带一些函数进行处理。

2、写入文件

使用函数:pd.HDFStore

import numpy as np
import pandas as pd
####生成9000,0000条数据,9千万条
a = np.random.standard_normal((90000000,4))
b = pd.DataFrame(a)
####普通格式存储:
h5 = pd.HDFStore('/data/stock/test_s.h5','w')
h5['data'] = b
h5.close()

####压缩格式存储
h5 = pd.HDFStore('/data/stock/test_c4.h5','w', complevel=4, complib='blosc')
h5['data'] = b
h5.close()

3、读取文件

使用函数:pd.read_hdf

参数:文件名,key

data=pd.read_hdf('/data/stock/test_c4.h5',key='data')

以上这篇对pandas写入读取h5文件的方法详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
easy_install python包安装管理工具介绍
Feb 10 Python
python使用urllib2提交http post请求的方法
May 26 Python
好用的Python编辑器WingIDE的使用经验总结
Aug 31 Python
python利用urllib实现爬取京东网站商品图片的爬虫实例
Aug 24 Python
Python基础教程之利用期物处理并发
Mar 29 Python
Python生成rsa密钥对操作示例
Apr 26 Python
Django如何开发简单的查询接口详解
May 17 Python
Python selenium使用autoIT上传附件过程详解
May 26 Python
python中的错误如何查看
Jul 08 Python
详解python安装matplotlib库三种失败情况
Jul 28 Python
python实现简单遗传算法
Sep 18 Python
深入理解pytorch库的dockerfile
Jun 10 Python
Python线程池模块ThreadPoolExecutor用法分析
Dec 28 #Python
Python实现的逻辑回归算法示例【附测试csv文件下载】
Dec 28 #Python
python 检查是否为中文字符串的方法
Dec 28 #Python
浅谈python3发送post请求参数为空的情况
Dec 28 #Python
python3使用flask编写注册post接口的方法
Dec 28 #Python
python通过tcp发送xml报文的方法
Dec 28 #Python
对python 生成拼接xml报文的示例详解
Dec 28 #Python
You might like
利用phpExcel实现Excel数据的导入导出(全步骤详细解析)
2013/11/26 PHP
PHP结合Ueditor并修改图片上传路径
2016/10/16 PHP
JQuery打造PHP的AJAX表单提交实例
2009/11/03 Javascript
IE下通过a实现location.href 获取referer的值
2014/09/04 Javascript
jQuery中appendTo()方法用法实例
2015/01/08 Javascript
javascript获取元素离文档各边距离的方法
2015/02/13 Javascript
jquery图片倾斜层叠切换特效代码分享
2015/08/27 Javascript
网页从弹窗页面单选框传值至父页面代码分享
2015/09/29 Javascript
JS识别浏览器类型(电脑浏览器和手机浏览器)
2016/11/18 Javascript
详解用原生JavaScript实现jQuery的某些简单功能
2016/12/19 Javascript
jQuery用noConflict代替$的实现方法
2017/04/12 jQuery
vue如何从接口请求数据
2017/06/22 Javascript
vue表单绑定实现多选框和下拉列表的实例
2017/08/12 Javascript
angular.js实现购物车功能
2017/10/23 Javascript
JS数组Object.keys()方法的使用示例
2019/06/05 Javascript
浅谈webpack构建工具配置和常用插件总结
2020/05/11 Javascript
在vue中实现给每个页面顶部设置title
2020/07/29 Javascript
浅谈vue项目,访问路径#号的问题
2020/08/14 Javascript
Javascript柯里化实现原理及作用解析
2020/10/22 Javascript
[50:02]完美世界DOTA2联赛循环赛 Magma vs IO BO2第一场 11.01
2020/11/02 DOTA
零基础写python爬虫之urllib2中的两个重要概念:Openers和Handlers
2014/11/05 Python
python中的json总结
2018/10/11 Python
Python基于plotly模块实现的画图操作示例
2019/01/23 Python
Python logging设置和logger解析
2019/08/28 Python
Python列表list操作相关知识小结
2020/01/29 Python
对tensorflow 中tile函数的使用详解
2020/02/07 Python
Python面向对象程序设计之类和对象、实例变量、类变量用法分析
2020/03/23 Python
CSS3绘制六边形的简单实现
2016/08/25 HTML / CSS
英国豪华装饰照明品牌的在线零售商:Inspyer Lighting
2019/12/10 全球购物
什么是数据库锁?Oracle中都有哪些类型的锁?
2015/08/21 面试题
小摄影师教学反思
2014/04/27 职场文书
群众路线个人剖析材料
2014/10/07 职场文书
购房委托书
2014/10/15 职场文书
2015教师年度工作总结范文
2015/04/07 职场文书
Python中super().__init__()测试以及理解
2021/12/06 Python
SpringDataJPA在Entity中常用的注解介绍
2021/12/06 Java/Android