通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 获取新浪微博的最新公共微博实例分享
Jul 03 Python
在Python中编写数据库模块的教程
Apr 29 Python
python处理二进制数据的方法
Jun 03 Python
Python中__init__.py文件的作用详解
Sep 18 Python
Python实现ping指定IP的示例
Jun 04 Python
python自动发邮件总结及实例说明【推荐】
May 31 Python
Pycharm新手教程(只需要看这篇就够了)
Jun 18 Python
详解python tkinter模块安装过程
Jan 06 Python
python 实现批量图片识别并翻译
Nov 02 Python
python实现PolynomialFeatures多项式的方法
Jan 06 Python
利用Python函数实现一个万历表完整示例
Jan 23 Python
分享python函数常见关键字
Apr 26 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
PHP 第一节 php简介
2012/04/28 PHP
PHP中ob_start函数的使用说明
2013/11/11 PHP
简洁短小的 JavaScript IE 浏览器判定代码
2010/03/21 Javascript
jquery事件机制扩展插件 jquery鼠标右键事件。
2011/12/26 Javascript
Jquery 数据选择插件Pickerbox使用介绍
2012/08/24 Javascript
jQuery图片的展开和收缩实现代码
2013/04/16 Javascript
浅谈 jQuery 事件源码定位问题
2014/06/18 Javascript
js实现动画特效的文字链接鼠标悬停提示的方法
2015/03/02 Javascript
JavaScript实现彩虹文字效果的方法
2015/04/16 Javascript
Javascript实现Array和String互转换的方法
2015/12/21 Javascript
快速学习AngularJs HTTP响应拦截器
2015/12/31 Javascript
jQuery抛物线运动实现方法(附完整demo源码下载)
2016/01/08 Javascript
在Node.js中使用Javascript Generators详解
2016/05/05 Javascript
jQuery表单元素选择器代码实例
2017/02/06 Javascript
jQuery使用JSONP实现跨域获取数据的三种方法详解
2017/05/04 jQuery
vue 简单自动补全的输入框的示例
2018/03/12 Javascript
vue 父组件调用子组件方法及事件
2018/03/29 Javascript
Bootstrap模态对话框用法简单示例
2018/08/31 Javascript
vue element-ui实现input输入框金额数字添加千分位
2019/12/29 Javascript
下载安装setuptool和pip linux安装pip    
2014/01/24 Python
解决python3 网络请求路径包含中文的问题
2018/05/10 Python
python3 http提交json参数并获取返回值的方法
2018/12/19 Python
Python识别快递条形码及Tesseract-OCR使用详解
2019/07/15 Python
Python参数传递及收集机制原理解析
2020/06/05 Python
Python 没有main函数的原因
2020/07/10 Python
django美化后台django-suit的安装配置操作
2020/07/12 Python
pycharm 如何取消连按两下shift出现的全局搜索
2021/01/15 Python
详解CSS3选择器:nth-child和:nth-of-type之间的差异
2017/09/18 HTML / CSS
《我为你骄傲》教学反思
2014/02/20 职场文书
优秀团员事迹材料1000字
2014/08/20 职场文书
环卫工人节活动总结
2014/08/29 职场文书
安全先进个人材料
2014/12/29 职场文书
丧事答谢词
2015/01/05 职场文书
营销策划分析:怎么策划才能更好销量产品?
2019/09/04 职场文书
看看如何用Python绘制小米新版天价logo
2021/04/20 Python
利用Pycharm连接服务器的全过程记录
2021/07/01 Python