python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python ValueError: invalid literal for int() with base 10 实用解决方法
Jun 21 Python
python获取当前用户的主目录路径方法(推荐)
Jan 12 Python
恢复百度云盘本地误删的文件脚本(简单方法)
Oct 21 Python
Python 获取主机ip与hostname的方法
Dec 17 Python
python实现词法分析器
Jan 31 Python
Python Selenium 之关闭窗口close与quit的方法
Feb 13 Python
如何使用pyinstaller打包32位的exe程序
May 26 Python
Django Serializer HiddenField隐藏字段实例
Mar 31 Python
python 5个实用的技巧
Sep 27 Python
详解python爬取弹幕与数据分析
Nov 14 Python
Django中使用Celery的方法步骤
Dec 07 Python
基于Python的接口自动化读写excel文件的方法
Jan 15 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
php中Smarty模板初体验
2011/08/08 PHP
PHP spl_autoload_register实现自动加载研究
2011/12/06 PHP
PHP删除HTMl标签的三种解决方法
2013/06/30 PHP
PHP+Mysql树型结构(无限分类)数据库设计的2种方式实例
2014/07/15 PHP
php判断当前用户已在别处登录的方法
2015/01/06 PHP
Laravel中encrypt和decrypt的实现方法
2017/09/24 PHP
thinkphp3.2.0 setInc方法 源码全面解析
2018/01/29 PHP
php记录搜索引擎爬行记录的实现代码
2018/03/02 PHP
thinkphp5.0整合phpsocketio完整攻略(绕坑)
2018/10/12 PHP
常用的javascript function代码
2008/05/23 Javascript
理解Javascript_08_函数对象
2010/10/15 Javascript
Yii-自定义删除确认弹框(zyd)jquery实现代码
2013/03/04 Javascript
获取客户端网卡MAC地址和IP地址实现JS代码
2013/03/17 Javascript
深入解析contentWindow, contentDocument
2013/07/04 Javascript
关于javascript event flow 的一个bug详解
2013/09/17 Javascript
Jquery实现控件的隐藏和显示实例
2014/02/08 Javascript
javascript学习笔记(一)基础知识
2014/09/30 Javascript
Jquery实现图片预加载与延时加载的方法
2014/12/22 Javascript
在JavaScript的AngularJS库中进行单元测试的方法
2015/06/23 Javascript
轻松搞定jQuery.noConflict()
2016/02/15 Javascript
js实现简单的省市县三级联动效果实例
2016/02/18 Javascript
整理JavaScript对DOM中各种类型的元素的常用操作
2016/05/05 Javascript
Puppeteer 爬取动态生成的网页实战
2018/11/14 Javascript
webpack配置proxyTable时pathRewrite无效的解决方法
2018/12/13 Javascript
Vue对象赋值视图不更新问题及解决方法
2019/06/03 Javascript
如何进行微信公众号开发的本地调试的方法
2019/06/16 Javascript
node.js文件操作系统实例详解
2019/11/05 Javascript
TensorFlow实现iris数据集线性回归
2018/09/07 Python
通过cmd进入python的实例操作
2019/06/26 Python
Django 导出项目依赖库到 requirements.txt过程解析
2019/08/23 Python
Python使用jupyter notebook查看ipynb文件过程解析
2020/06/02 Python
Python3.7安装pyaudio教程解析
2020/07/24 Python
造价工程师个人求职信
2013/09/21 职场文书
商场活动策划方案
2014/01/24 职场文书
感恩老师主题班会
2015/08/12 职场文书
使用python向MongoDB插入时间字段的操作
2021/05/18 Python