通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python中for循环的使用方法
May 14 Python
python读写json文件的简单实现
Apr 11 Python
Python unittest 简单实现参数化的方法
Nov 30 Python
python删除文件夹下相同文件和无法打开的图片
Jul 16 Python
python实现PCA降维的示例详解
Feb 24 Python
浅谈python累加求和+奇偶数求和_break_continue
Feb 25 Python
利用python控制Autocad:pyautocad方式
Jun 01 Python
pytorch 限制GPU使用效率详解(计算效率)
Jun 27 Python
详解向scrapy中的spider传递参数的几种方法(2种)
Sep 28 Python
python爬虫爬取淘宝商品比价(附淘宝反爬虫机制解决小办法)
Dec 03 Python
解决pycharm修改代码后第一次运行不生效的问题
Feb 06 Python
Python+Appium新手教程
Apr 17 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
真正的ZIP文件操作类(php)
2007/07/21 PHP
php集成环境xampp中apache无法启动问题解决方案
2014/11/18 PHP
php精度计算的问题解析
2019/06/21 PHP
thinkphp5实现微信扫码支付
2019/12/23 PHP
Ext.MessageBox工具类简介
2009/12/10 Javascript
浅析onsubmit校验表单时利用ajax的return false无效问题
2013/07/10 Javascript
CSS鼠标响应事件经过、移动、点击示例介绍
2013/09/04 Javascript
jQuery中mouseover事件用法实例
2014/12/26 Javascript
Javascript基础教程之数据类型 (数值 Number)
2015/01/18 Javascript
jQuery+ajax实现动态执行脚本的方法
2015/01/27 Javascript
jQuery插件PageSlide实现左右侧栏导航菜单
2015/04/12 Javascript
jquery读取xml文件实现省市县三级联动的方法
2015/05/29 Javascript
使用Node.js实现HTTP 206内容分片的教程
2015/06/23 Javascript
JS实现样式清新的横排下拉菜单效果
2015/10/09 Javascript
JavaScript兼容性总结之获取非行间样式案例
2016/08/07 Javascript
深入浅出 jQuery中的事件机制
2016/08/23 Javascript
AngularJS 中ui-view传参的实例详解
2017/08/25 Javascript
React教程之Props验证的具体用法(Props Validation)
2017/09/04 Javascript
vue中动态设置meta标签和title标签的方法
2018/07/11 Javascript
JS前端知识点总结之页面加载事件,数组操作,DOM节点操作,循环和分支
2019/07/04 Javascript
微信小程序与公众号实现数据互通的方法
2019/07/25 Javascript
vue项目实现图片上传功能
2019/12/23 Javascript
Vue通过配置WebSocket并实现群聊功能
2019/12/31 Javascript
JS实现扫码枪扫描二维码功能
2020/01/03 Javascript
python简单实现刷新智联简历
2016/03/30 Python
Python找出list中最常出现元素的方法
2016/06/14 Python
python 打印对象的所有属性值的方法
2016/09/11 Python
Python OpenCV实现视频分帧
2019/06/01 Python
Python lxml模块的基本使用方法分析
2019/12/21 Python
Python读取excel文件中带公式的值的实现
2020/04/17 Python
html5 学习简单的拾色器
2010/09/03 HTML / CSS
HTML5里的placeholder属性使用实例和美化显示效果的方法
2014/04/23 HTML / CSS
大学生2014全国两会学习心得体会
2014/03/10 职场文书
领导班子四风对照检查材料范文
2014/09/27 职场文书
2015年校医个人工作总结
2015/07/24 职场文书
SpringBoot实现异步事件驱动的方法
2021/06/28 Java/Android