通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python字符串连接方式汇总
Aug 21 Python
使用Python判断质数(素数)的简单方法讲解
May 05 Python
Python实现读取txt文件并画三维图简单代码示例
Dec 09 Python
python 接口返回的json字符串实例
Mar 27 Python
Python批量合并有合并单元格的Excel文件详解
Apr 05 Python
Python爬取qq空间说说的实例代码
Aug 17 Python
Django+JS 实现点击头像即可更改头像的方法示例
Dec 26 Python
python图的深度优先和广度优先算法实例分析
Oct 26 Python
python如果快速判断数字奇数偶数
Nov 13 Python
基于python实现模拟数据结构模型
Jun 12 Python
Python基础之Socket通信原理
Apr 22 Python
Python编写可视化界面的全过程(Python+PyCharm+PyQt)
May 17 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
用PHP开发GUI
2006/10/09 PHP
ThinkPHP实现批量删除数据的代码实例
2014/07/02 PHP
PHP传参之传值与传址的区别
2015/04/24 PHP
如何重写Laravel异常处理类详解
2020/12/20 PHP
Ext修改GridPanel数据和字体颜色、css属性等
2014/06/13 Javascript
关于javascript模块加载技术的一些思考
2014/11/28 Javascript
jquery中ajax跨域方法实例分析
2015/12/18 Javascript
JS简单实现点击复制链接的方法
2016/08/03 Javascript
移动端利用H5实现压缩图片上传功能
2017/03/29 Javascript
获取当前按钮或者html的ID名称实例(推荐)
2017/06/23 Javascript
angularjs实现分页和搜索功能
2018/01/03 Javascript
Vue.JS实现垂直方向展开、收缩不定高度模块的JS组件
2018/06/19 Javascript
JS逻辑运算符短路操作实例分析
2018/07/09 Javascript
给localStorage设置一个过期时间的方法分享
2018/11/06 Javascript
vue+Element-ui实现分页效果实例代码详解
2018/12/10 Javascript
jQuery中event.target和this的区别详解
2020/08/13 jQuery
Python生成随机验证码的两种方法
2015/12/22 Python
Python数据库的连接实现方法与注意事项
2016/02/27 Python
详解多线程Django程序耗尽数据库连接的问题
2018/10/08 Python
python爬取酷狗音乐排行榜
2019/02/20 Python
详解python读取和输出到txt
2019/03/29 Python
Python中的 is 和 == 以及字符串驻留机制详解
2019/06/28 Python
python粘包问题及socket套接字编程详解
2019/06/29 Python
浅谈spring boot 集成 log4j 解决与logback冲突的问题
2020/02/20 Python
Python matplotlib绘制图形实例(包括点,曲线,注释和箭头)
2020/04/17 Python
全网首秀之Pycharm十大实用技巧(推荐)
2020/04/27 Python
Python基于gevent实现文件字符串查找器
2020/08/11 Python
保险公司晨会主持词
2014/03/22 职场文书
《吃水不忘挖井人》教学反思
2014/04/15 职场文书
营销与策划实训报告
2014/11/05 职场文书
2014年酒店工作总结范文
2014/11/17 职场文书
2014年妇幼卫生工作总结
2014/12/09 职场文书
沂蒙六姐妹观后感
2015/06/08 职场文书
老乡会致辞
2015/07/28 职场文书
PHP中strval()函数实例用法
2021/06/07 PHP
MySQL约束(创建表时的各种条件说明)
2022/06/21 MySQL