pandas string转dataframe的方法


Posted in Python onApril 11, 2018

今天业务上碰到用pandas处理一个大文件的内存不够问题,需要做concat 合并多个文件,每个文件数据在1.4亿行左右。当时第一反应是把dataframe分割成多块小文件处理,后面发现即使pandas内存问题解决了,用pickle做保存数据时也会提升内存不够的报错,后来把dataframe对象转化成string,发现内存占用减少了近一半。

所以打算用先转成string再dump到离线文件里,官网文档上只有to_string的说明,而从string转dataframe却没有提供直接的函数。

其实很简单,我们可以把string放到一个文件对象里,然后通过read_csv函数来创建dataframe对象。

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd
TESTDATA=StringIO("""col1;col2;col3
1;4.4;99
2;4.5;200
3;4.7;65
4;3.2;140
""")
df = pd.read_csv(TESTDATA, sep=";")

以上这篇pandas string转dataframe的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现的登陆Discuz!论坛通用代码分享
Jul 11 Python
django 创建过滤器的实例详解
Aug 14 Python
Python装饰器(decorator)定义与用法详解
Feb 09 Python
Python txt文件加入字典并查询的方法
Jan 15 Python
python实现蒙特卡罗方法教程
Jan 28 Python
Python将json文件写入ES数据库的方法
Apr 10 Python
jupyter notebook中美观显示矩阵实例
Apr 17 Python
Python发送邮件封装实现过程详解
May 09 Python
Python OpenCV去除字母后面的杂线操作
Jul 05 Python
python实现图片,视频人脸识别(dlib版)
Nov 18 Python
使用Python下载抖音各大V视频的思路详解
Feb 06 Python
对PyTorch中inplace字段的全面理解
May 22 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 #Python
DataFrame中的object转换成float的方法
Apr 10 #Python
pandas object格式转float64格式的方法
Apr 10 #Python
python 处理dataframe中的时间字段方法
Apr 10 #Python
python调用API实现智能回复机器人
Apr 10 #Python
python读取文本中数据并转化为DataFrame的实例
Apr 10 #Python
python实现百度语音识别api
Apr 10 #Python
You might like
PHP在不同页面间传递Json数据示例代码
2013/06/08 PHP
php读取文件内容的三种可行方法示例介绍
2014/02/08 PHP
Yii2使用自带的UploadedFile实现的文件上传
2016/06/20 PHP
在视频前插入广告
2006/11/20 Javascript
checkbox全选/取消全选以及checkbox遍历jQuery实现代码
2009/12/02 Javascript
Jquery常用技巧收集整理篇
2010/11/14 Javascript
关于hashchangebroker和statehashable的补充文档
2011/08/08 Javascript
Tab页界面 用jQuery及Ajax技术实现(php后台)
2011/10/12 Javascript
jquery getScript动态加载JS方法改进详解
2012/11/15 Javascript
js动态创建、删除表格示例代码
2013/08/07 Javascript
javascipt:filter过滤介绍及使用
2014/09/10 Javascript
Angular.js去除页面中显示的空行方法示例
2017/03/30 Javascript
ES6新特性三: Generator(生成器)函数详解
2017/04/21 Javascript
获取本机IP地址的实例(JavaScript / Node.js)
2017/11/24 Javascript
微信小程序实现左滑修改、删除功能
2020/10/19 Javascript
轻松解决JavaScript定时器越走越快的问题
2019/05/13 Javascript
微信小程序开发技巧汇总
2019/07/15 Javascript
深入了解JavaScript词法作用域
2020/07/29 Javascript
JavaScript 绘制饼图的示例
2021/02/19 Javascript
[00:27]DOTA2战队VP、Secret贺新春
2018/02/11 DOTA
python批量修改文件后缀示例代码分享
2013/12/24 Python
用Python实现一个简单的线程池
2015/04/07 Python
Python找出9个连续的空闲端口
2016/02/01 Python
python实现八大排序算法(1)
2017/09/14 Python
详解django中使用定时任务的方法
2018/09/27 Python
pycharm的console输入实现换行的方法
2019/01/16 Python
Python常见数字运算操作实例小结
2019/03/22 Python
Python之虚拟环境virtualenv,pipreqs生成项目依赖第三方包的方法
2019/07/23 Python
Python加载数据的5种不同方式(收藏)
2020/11/13 Python
技校生自我鉴定范文
2013/09/26 职场文书
行政办公室岗位职责
2014/03/18 职场文书
介绍信格式
2015/01/30 职场文书
2015年预算员工作总结
2015/05/14 职场文书
党员证明模板
2015/06/19 职场文书
2016学雷锋优秀志愿者事迹材料
2016/02/25 职场文书
win11高清晰音频管理器在哪里?win11找不到高清晰音频管理器解决办法
2022/04/08 数码科技