pandas string转dataframe的方法


Posted in Python onApril 11, 2018

今天业务上碰到用pandas处理一个大文件的内存不够问题,需要做concat 合并多个文件,每个文件数据在1.4亿行左右。当时第一反应是把dataframe分割成多块小文件处理,后面发现即使pandas内存问题解决了,用pickle做保存数据时也会提升内存不够的报错,后来把dataframe对象转化成string,发现内存占用减少了近一半。

所以打算用先转成string再dump到离线文件里,官网文档上只有to_string的说明,而从string转dataframe却没有提供直接的函数。

其实很简单,我们可以把string放到一个文件对象里,然后通过read_csv函数来创建dataframe对象。

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd
TESTDATA=StringIO("""col1;col2;col3
1;4.4;99
2;4.5;200
3;4.7;65
4;3.2;140
""")
df = pd.read_csv(TESTDATA, sep=";")

以上这篇pandas string转dataframe的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python socket 超时设置 errno 10054
Jul 01 Python
跟老齐学Python之dict()的操作方法
Sep 24 Python
Python实现遍历windows所有窗口并输出窗口标题的方法
Mar 13 Python
Python制作数据导入导出工具
Jul 31 Python
python实现zabbix发送短信脚本
Sep 17 Python
python提取照片坐标信息的实例代码
Aug 14 Python
pytorch自定义初始化权重的方法
Aug 17 Python
python区分不同数据类型的方法
Oct 14 Python
Django异步任务线程池实现原理
Dec 17 Python
python解决OpenCV在读取显示图片的时候闪退的问题
Feb 23 Python
Python自动化爬取天眼查数据的实现
Jun 15 Python
你需要掌握的20个Python常用技巧
Feb 28 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 #Python
DataFrame中的object转换成float的方法
Apr 10 #Python
pandas object格式转float64格式的方法
Apr 10 #Python
python 处理dataframe中的时间字段方法
Apr 10 #Python
python调用API实现智能回复机器人
Apr 10 #Python
python读取文本中数据并转化为DataFrame的实例
Apr 10 #Python
python实现百度语音识别api
Apr 10 #Python
You might like
落伍首发 php+mysql 采用ajax技术的 省 市 地 3级联动无刷新菜单 源码
2006/12/16 PHP
利用“多说”制作留言板、评论系统
2015/07/14 PHP
遍历echsop的region表形成缓存的程序实例代码
2016/11/01 PHP
任意位置显示html菜单
2007/02/01 Javascript
关于firefox的ElementTraversal 接口 使用说明
2010/11/11 Javascript
setTimeout函数兼容各主流浏览器运行执行效果实例
2013/06/13 Javascript
JSuggest自动匹配下拉框使用方法(示例代码)
2013/12/27 Javascript
js opener的使用详解
2014/01/11 Javascript
浅谈Javascript中的Function与Object
2015/01/26 Javascript
轻松学习jQuery插件EasyUI EasyUI表单验证
2015/12/01 Javascript
基于javascript html5实现多文件上传
2016/03/03 Javascript
node.js连接mongoDB数据库 快速搭建自己的web服务
2016/04/17 Javascript
浅谈js的url解析函数封装
2016/06/28 Javascript
AngularJS优雅的自定义指令
2016/07/01 Javascript
轻松掌握JavaScript状态模式
2016/09/07 Javascript
简单实现jQuery级联菜单
2017/01/09 Javascript
微信小程序实现圆形进度条动画
2020/11/18 Javascript
非常实用的jQuery代码段集锦【检测浏览器、滚动、复制、淡入淡出等】
2019/08/08 jQuery
微信小程序框架的页面布局代码
2019/08/17 Javascript
[03:14]2014DOTA2西雅图国际邀请赛 EG战队巡礼
2014/07/07 DOTA
[02:49]DOTA2完美大师赛首日观众采访
2017/11/23 DOTA
python实现ip查询示例
2014/03/26 Python
利用Python演示数型数据结构的教程
2015/04/03 Python
python 生成器生成杨辉三角的方法(必看)
2017/04/10 Python
Django自定义认证方式用法示例
2017/06/23 Python
python实现简单登陆系统
2018/10/18 Python
python实现桌面气泡提示功能
2019/07/29 Python
Django使用rest_framework写出API
2020/05/21 Python
keras中模型训练class_weight,sample_weight区别说明
2020/05/23 Python
css3模拟jq点击事件的实例代码
2017/07/06 HTML / CSS
Tiqets荷兰:出售欧洲最美丽的景点和博物馆门票
2018/01/09 全球购物
澳大利亚百货公司:David Jones
2018/02/08 全球购物
优秀毕业自我鉴定
2014/02/15 职场文书
计算机科学技术自荐信
2014/06/12 职场文书
红十字会救护培训简讯
2015/07/20 职场文书
Redis性能监控的实现
2021/07/09 Redis