pandas string转dataframe的方法


Posted in Python onApril 11, 2018

今天业务上碰到用pandas处理一个大文件的内存不够问题,需要做concat 合并多个文件,每个文件数据在1.4亿行左右。当时第一反应是把dataframe分割成多块小文件处理,后面发现即使pandas内存问题解决了,用pickle做保存数据时也会提升内存不够的报错,后来把dataframe对象转化成string,发现内存占用减少了近一半。

所以打算用先转成string再dump到离线文件里,官网文档上只有to_string的说明,而从string转dataframe却没有提供直接的函数。

其实很简单,我们可以把string放到一个文件对象里,然后通过read_csv函数来创建dataframe对象。

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd
TESTDATA=StringIO("""col1;col2;col3
1;4.4;99
2;4.5;200
3;4.7;65
4;3.2;140
""")
df = pd.read_csv(TESTDATA, sep=";")

以上这篇pandas string转dataframe的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 实现将字典dict、列表list中的中文正常显示方法
Jul 06 Python
对Django中static(静态)文件详解以及{% static %}标签的使用方法
Jul 28 Python
python join方法使用详解
Jul 30 Python
Python使用Pandas对csv文件进行数据处理的方法
Aug 01 Python
Python箱型图绘制与特征值获取过程解析
Oct 22 Python
pandas factorize实现将字符串特征转化为数字特征
Dec 19 Python
OpenCV哈里斯(Harris)角点检测的实现
Jan 15 Python
django admin 根据choice字段选择的不同来显示不同的页面方式
May 13 Python
解决Pytorch自定义层出现多Variable共享内存错误问题
Jun 28 Python
python Protobuf定义消息类型知识点讲解
Mar 02 Python
Python Pytorch查询图像的特征从集合或数据库中查找图像
Apr 09 Python
在 Python 中利用 Pool 进行多线程
Apr 24 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 #Python
DataFrame中的object转换成float的方法
Apr 10 #Python
pandas object格式转float64格式的方法
Apr 10 #Python
python 处理dataframe中的时间字段方法
Apr 10 #Python
python调用API实现智能回复机器人
Apr 10 #Python
python读取文本中数据并转化为DataFrame的实例
Apr 10 #Python
python实现百度语音识别api
Apr 10 #Python
You might like
BBS(php &amp; mysql)完整版(四)
2006/10/09 PHP
PHP中的use关键字概述
2014/07/23 PHP
php 广告点击统计代码(php+mysql)
2018/02/21 PHP
解决laravel查询构造器中的别名问题
2019/10/17 PHP
jquery ui dialog里调用datepicker的问题
2009/08/06 Javascript
javascript实现yield的方法
2013/11/06 Javascript
如何在MVC应用程序中使用Jquery
2014/11/17 Javascript
jQuery中:only-child选择器用法实例
2015/01/03 Javascript
js 右侧浮动层效果实现代码(跟随滚动)
2015/11/22 Javascript
jQuery EasyUi实战教程之布局篇
2016/01/26 Javascript
Bootstrap实现渐变顶部固定自适应导航栏
2020/08/27 Javascript
使用node.js对音视频文件加密的实例代码
2017/08/30 Javascript
详解ES6语法之可迭代协议和迭代器协议
2018/01/13 Javascript
微信小程序之圆形进度条实现思路
2018/02/22 Javascript
JavaScript基础心法 深浅拷贝(浅拷贝和深拷贝)
2018/03/05 Javascript
详解小程序不同页面之间通讯的解决方案
2018/11/23 Javascript
Vue基本指令实例图文讲解
2021/02/25 Vue.js
[56:58]VP vs Optic 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
Python写的一个简单监控系统
2015/06/19 Python
Python3使用PyQt5制作简单的画板/手写板实例
2017/10/19 Python
python实现二叉查找树实例代码
2018/02/08 Python
Python管理Windows服务小脚本
2018/03/12 Python
Python实现多条件筛选目标数据功能【测试可用】
2018/06/13 Python
一款纯css3实现简单的checkbox复选框和radio单选框
2014/11/05 HTML / CSS
印度电子产品购物网站:Vijay Sales
2021/02/16 全球购物
财务管理个人自荐书范文
2013/11/24 职场文书
蛋糕店的商业计划书范文
2014/01/27 职场文书
少年闰土教学反思
2014/02/22 职场文书
我的长生果教学反思
2014/04/28 职场文书
励志演讲稿600字
2014/08/21 职场文书
保密工作承诺书
2014/08/29 职场文书
无房产证房屋转让协议书合同样本
2014/10/18 职场文书
父亲婚礼答谢词
2015/01/04 职场文书
MySQL root密码的重置方法
2021/04/21 MySQL
教你快速构建一个基于nginx的web集群项目
2021/11/27 Servers
python获取字符串中的email
2022/03/31 Python