通过Pandas读取大文件的实例


Posted in Python onJune 07, 2018

当数据文件过大时,由于计算机内存有限,需要对大文件进行分块读取:

import pandas as pd
f = open('E:/学习相关/Python/数据样例/用户侧数据/test数据.csv')
reader = pd.read_csv(f, sep=',', iterator=True)
loop = True
chunkSize = 100000
chunks = []
while loop:
 try:
 chunk = reader.get_chunk(chunkSize)
 chunks.append(chunk)
 except StopIteration:
 loop = False
 print("Iteration is stopped.")
df = pd.concat(chunks, ignore_index=True)
print(df)

read_csv()函数的iterator参数等于True时,表示返回一个TextParser以便逐块读取文件;

chunkSize表示文件块的大小,用于迭代;

TextParser类的get_chunk方法用于读取任意大小的文件块;

StopIteration的异常表示在循环对象穷尽所有元素时报错;

concat()函数用于将数据做轴向连接:

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False, keys=None, levels=None, names=None, Verify_integrity=False)

常用参数:

objs:Series,DataFrame或者是Panel构成的序列list;

axis:需要合并连接的轴,0是行,1是列;

join:连接的参数,inner或outer;

ignore=True表示重建索引。

以上这篇通过Pandas读取大文件的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python获取豆瓣电影简介代码分享
Jan 16 Python
用Python实现一个简单的线程池
Apr 07 Python
Python实现二叉搜索树
Feb 03 Python
Python3利用Dlib19.7实现摄像头人脸识别的方法
May 11 Python
python的pandas工具包,保存.csv文件时不要表头的实例
Jun 14 Python
Python获取时间戳代码实例
Sep 24 Python
Python如何优雅获取本机IP方法
Nov 10 Python
python中元组的用法整理
Jun 15 Python
基于Python和C++实现删除链表的节点
Jul 06 Python
解决pycharm导入numpy包的和使用时报错:RuntimeError: The current Numpy installation (‘D:\\python3.6\\lib\\site-packa的问题
Dec 08 Python
Python基于Opencv识别两张相似图片
Apr 25 Python
Python获取江苏疫情实时数据及爬虫分析
Aug 02 Python
Pandas:DataFrame对象的基础操作方法
Jun 07 #Python
Python中偏函数用法示例
Jun 07 #Python
网红编程语言Python将纳入高考你怎么看?
Jun 07 #Python
python指定写入文件时的编码格式方法
Jun 07 #Python
Python实现的爬虫刷回复功能示例
Jun 07 #Python
异步任务队列Celery在Django中的使用方法
Jun 07 #Python
浅谈python中对于json写入txt文件的编码问题
Jun 07 #Python
You might like
PHP图像处理类库及演示分享
2015/05/17 PHP
4种PHP异步执行的常用方式
2015/12/24 PHP
thinkPHP5 ACL用户权限模块用法详解
2017/05/10 PHP
JQuery困惑—包装集 DOM节点
2009/10/16 Javascript
jQuery LigerUI 使用教程表格篇(1)
2012/01/18 Javascript
Jquery取得iframe下内容的方法
2013/11/18 Javascript
jquery的clone方法应用于textarea和select的bug修复
2014/06/26 Javascript
BootStrap入门教程(二)之固定的内置样式
2016/09/19 Javascript
JS常用倒计时代码实例总结
2017/02/07 Javascript
React Native中导航组件react-navigation跨tab路由处理详解
2017/10/31 Javascript
AngularJs 最新验证手机号码的实例,成功测试通过
2017/11/26 Javascript
vue实现路由懒加载及组件懒加载的方式
2019/06/11 Javascript
[02:19]DOTA2女子战队FOX视频专访:希望更多美眉一起加入
2013/10/15 DOTA
打开电脑上的QQ的python代码
2013/02/10 Python
Python greenlet实现原理和使用示例
2014/09/24 Python
Python的Flask框架中实现登录用户的个人资料和头像的教程
2015/04/20 Python
在Python中marshal对象序列化的相关知识
2015/07/01 Python
详解Python的Django框架中inclusion_tag的使用
2015/07/21 Python
python自动裁剪图像代码分享
2017/11/25 Python
python装饰器深入学习
2018/04/06 Python
Python3读取Excel数据存入MySQL的方法
2018/05/04 Python
Python错误处理操作示例
2018/07/18 Python
python读取图片任意范围区域
2019/01/23 Python
Python +Selenium解决图片验证码登录或注册问题(推荐)
2020/02/09 Python
Python异常处理机制结构实例解析
2020/07/23 Python
python字典通过值反查键的实现(简洁写法)
2020/09/30 Python
pymongo insert_many 批量插入的实例
2020/12/05 Python
几道数据库的概念性面试题
2014/05/30 面试题
护理自荐信
2013/10/22 职场文书
化妆品促销方案
2014/02/24 职场文书
迎新晚会主持词
2014/03/24 职场文书
奥运会口号
2014/06/13 职场文书
新郎父母婚礼致辞
2015/07/27 职场文书
国庆放假通知怎么写
2015/07/30 职场文书
2016中秋节广告语
2016/01/28 职场文书
vue3 自定义图片放大器效果的示例代码
2022/07/23 Vue.js