通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python版的文曲星猜数字游戏代码
Sep 02 Python
在Debian下配置Python+Django+Nginx+uWSGI+MySQL的教程
Apr 25 Python
Python 基础之字符串string详解及实例
Apr 01 Python
Python实现的归并排序算法示例
Nov 21 Python
Python实现简易版的Web服务器(推荐)
Jan 29 Python
解决.ui文件生成的.py文件运行不出现界面的方法
Jun 19 Python
Python实现序列化及csv文件读取
Jan 19 Python
python动态文本进度条的实例代码
Jan 22 Python
python生成并处理uuid的实现方式
Mar 03 Python
Python3爬虫发送请求的知识点实例
Jul 30 Python
python/golang 删除链表中的元素
Sep 14 Python
Python中Permission denied的解决方案
Apr 02 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
PHP使用strtotime计算两个给定日期之间天数的方法
2015/03/18 PHP
Zend Framework创建自己的动作助手详解
2016/03/05 PHP
PHP简单操作MongoDB的方法(安装及增删改查)
2016/05/26 PHP
解决laravel-admin 自己新建页面里 js 需要刷新一次的问题
2019/10/03 PHP
javascript之函数直接量(function(){})()
2007/06/29 Javascript
基于JQuery的数字改变的动画效果--可用来做计数器
2010/08/11 Javascript
Script的加载方法小结
2011/01/12 Javascript
jQuery中scrollLeft()方法用法实例
2015/01/16 Javascript
JS 组件系列之BootstrapTable的treegrid功能
2017/06/16 Javascript
微信小程序tabBar底部导航中文注解api详解
2017/08/16 Javascript
JS设计模式之命令模式概念与用法分析
2018/02/06 Javascript
Node.js使用supervisor进行开发中调试的方法
2019/03/26 Javascript
js blob类型url的视频下载问题的解决
2019/11/29 Javascript
JavaScript ECMA-262-3 深入解析(二):变量对象实例详解
2020/04/25 Javascript
JavaScript常用8种数组去重代码实例
2020/09/09 Javascript
[01:12](回顾)DOTA2国际邀请赛,全世界DOTAer的盛宴
2014/07/01 DOTA
[02:17]DOTA2亚洲邀请赛 RAVE战队出场宣传片
2015/02/07 DOTA
[05:09]第二届DOTA2亚洲邀请赛决赛日比赛集锦:iG 3:0 OG夺冠
2017/04/05 DOTA
Python 学习笔记
2008/12/27 Python
python实现剪切功能
2019/01/23 Python
Python实现统计英文文章词频的方法分析
2019/01/28 Python
Ubuntu下Anaconda和Pycharm配置方法详解
2019/06/14 Python
如何在python中实现随机选择
2019/11/02 Python
浅谈OpenCV中的新函数connectedComponentsWithStats用法
2020/07/05 Python
详解Django中异步任务之django-celery
2020/11/05 Python
Python爬虫后获取重定向url的两种方法
2021/01/19 Python
CSS3教程(1):什么是CSS3
2009/04/02 HTML / CSS
如何使用html5与css3完成google涂鸦动画
2012/12/16 HTML / CSS
伦敦一家非常流行的时尚精品店:Oxygen Boutique
2017/01/15 全球购物
招商经理岗位职责
2013/11/16 职场文书
教师实习自我鉴定
2013/12/14 职场文书
小学教师听课制度
2014/02/01 职场文书
软件专业毕业生个人自我鉴定
2014/04/17 职场文书
领导班子个人对照检查材料(群众路线)
2014/09/26 职场文书
同学聚会通知短信
2015/04/20 职场文书
硕士毕业答辩开场白
2015/05/27 职场文书