pandas string转dataframe的方法


Posted in Python onApril 11, 2018

今天业务上碰到用pandas处理一个大文件的内存不够问题,需要做concat 合并多个文件,每个文件数据在1.4亿行左右。当时第一反应是把dataframe分割成多块小文件处理,后面发现即使pandas内存问题解决了,用pickle做保存数据时也会提升内存不够的报错,后来把dataframe对象转化成string,发现内存占用减少了近一半。

所以打算用先转成string再dump到离线文件里,官网文档上只有to_string的说明,而从string转dataframe却没有提供直接的函数。

其实很简单,我们可以把string放到一个文件对象里,然后通过read_csv函数来创建dataframe对象。

import sys
if sys.version_info[0] < 3:
from StringIO import StringIO
else:
from io import StringIO
import pandas as pd
TESTDATA=StringIO("""col1;col2;col3
1;4.4;99
2;4.5;200
3;4.7;65
4;3.2;140
""")
df = pd.read_csv(TESTDATA, sep=";")

以上这篇pandas string转dataframe的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python程序语言快速上手教程
Jul 18 Python
Python性能优化技巧
Mar 09 Python
python单元测试unittest实例详解
May 11 Python
python Matplotlib画图之调整字体大小的示例
Nov 20 Python
在Python中增加和插入元素的示例
Nov 01 Python
用Python实现数据的透视表的方法
Nov 16 Python
Python开发之Nginx+uWSGI+virtualenv多项目部署教程
May 13 Python
PyCharm下载和安装详细步骤
Dec 17 Python
python实现按键精灵找色点击功能教程,使用pywin32和Pillow库
Jun 04 Python
树莓派4B安装Tensorflow的方法步骤
Jul 16 Python
python 爬虫爬取京东ps4售卖情况
Dec 18 Python
Python面向对象之内置函数相关知识总结
Jun 24 Python
Python实现统计给定列表中指定数字出现次数的方法
Apr 11 #Python
DataFrame中的object转换成float的方法
Apr 10 #Python
pandas object格式转float64格式的方法
Apr 10 #Python
python 处理dataframe中的时间字段方法
Apr 10 #Python
python调用API实现智能回复机器人
Apr 10 #Python
python读取文本中数据并转化为DataFrame的实例
Apr 10 #Python
python实现百度语音识别api
Apr 10 #Python
You might like
让你同时上传 1000 个文件 (二)
2006/10/09 PHP
用PHP实现ODBC数据分页显示一例
2006/10/09 PHP
探讨PHP中OO之静态关键字以及类常量的详解
2013/06/07 PHP
php使用正则表达式提取字符串中尖括号、小括号、中括号、大括号中的字符串
2020/04/05 PHP
PHP读取大文件末尾N行的高效方法推荐
2016/06/03 PHP
extjs DataReader、JsonReader、XmlReader的构造方法
2009/11/07 Javascript
JS实现随机化快速排序的实例代码
2013/08/01 Javascript
ECMAScript 5中的属性描述符详解
2015/03/02 Javascript
深入学习Bootstrap表单
2016/12/13 Javascript
原生js实现密码输入框值的显示隐藏
2017/07/17 Javascript
AngularJs用户登录问题处理(交互及验证、阻止FQ处理)
2017/10/26 Javascript
VUE 3D轮播图封装实现方法
2018/07/03 Javascript
js实现图片推拉门效果代码实例
2019/05/18 Javascript
小程序实现左滑删除效果
2019/07/25 Javascript
jQuery实现手风琴效果(蒙版)
2020/01/11 jQuery
Vue两个版本的区别和使用方法(更深层次了解)
2020/02/16 Javascript
Python中使用动态变量名的方法
2014/05/06 Python
解决pandas无法在pycharm中使用plot()方法显示图像的问题
2018/05/24 Python
Pycharm简单使用教程(入门小结)
2019/07/04 Python
Python在Matplotlib图中显示中文字体的操作方法
2019/07/29 Python
python 3.6.7实现端口扫描器
2019/09/04 Python
Python爬取知乎图片代码实现解析
2019/09/17 Python
pytorch中的卷积和池化计算方式详解
2020/01/03 Python
python操作yaml说明
2020/04/08 Python
Biblibili视频投稿接口分析并以Python实现自动投稿功能
2021/02/05 Python
HTML5 解决苹果手机不能自动播放音乐问题
2017/12/27 HTML / CSS
AmazeUI 输入框组的示例代码
2020/08/14 HTML / CSS
SQL Server 2000数据库的文件有哪些,分别进行描述。
2015/11/09 面试题
电脑销售顾问自荐信
2014/01/29 职场文书
青春演讲稿范文
2014/05/08 职场文书
空气的环保标语
2014/06/12 职场文书
清明节网上祭英烈寄语2015
2015/03/04 职场文书
高中升旗仪式主持词
2015/07/03 职场文书
高中军训感想
2015/08/07 职场文书
MySQL之MyISAM存储引擎的非聚簇索引详解
2022/03/03 MySQL
Python实现科学占卜 让视频自动打码
2022/04/09 Python