python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作MySQL数据库具体方法
Oct 28 Python
python将xml xsl文件生成html文件存储示例讲解
Dec 03 Python
Python常用库推荐
Dec 04 Python
python实现二维码扫码自动登录淘宝
Dec 27 Python
Python中格式化format()方法详解
Apr 01 Python
用Python实现随机森林算法的示例
Aug 24 Python
unittest+coverage单元测试代码覆盖操作实例详解
Apr 04 Python
Python基于多线程实现抓取数据存入数据库的方法
Jun 22 Python
Pandas时间序列:重采样及频率转换方式
Dec 26 Python
python 生成任意形状的凸包图代码
Apr 16 Python
Python 绘制可视化折线图
Jul 22 Python
PyQt5爬取12306车票信息程序的实现
May 14 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
windows环境下php配置memcache的具体操作步骤
2013/06/09 PHP
php preg_match的匹配不同国家语言实例
2016/12/29 PHP
Auntion-TableSort国人写的一个javascript表格排序的东西
2007/11/12 Javascript
Jquery中LigerUi的弹出编辑框(实现方法)
2013/07/09 Javascript
页面实时更新时间的JS实例代码
2013/12/18 Javascript
jQuery toggleClass应用实例(附效果图)
2014/04/06 Javascript
在JavaScript中操作时间之getMonth()方法的使用
2015/06/10 Javascript
jquery实现不包含当前项的选择器实例
2015/06/25 Javascript
jQuery.prop() 使用详解
2015/07/19 Javascript
WebApi+Bootstrap+KnockoutJs打造单页面程序
2016/05/16 Javascript
easyUI实现类似搜索框关键词自动提示功能示例代码
2016/12/27 Javascript
JS实现仿UC浏览器前进后退效果的实例代码
2017/07/17 Javascript
JavaScript实现的搜索及高亮显示功能示例
2017/08/14 Javascript
React Native中的RefreshContorl下拉刷新使用
2017/10/09 Javascript
微信小程序之裁剪图片成圆形的实现代码
2018/10/11 Javascript
countUp.js实现数字动态变化效果
2019/10/17 Javascript
使用Python编写简单的端口扫描器的实例分享
2015/12/18 Python
Python基于TCP实现会聊天的小机器人功能示例
2018/04/09 Python
python 列表中[ ]中冒号‘:’的作用
2019/04/30 Python
Pytorch基本变量类型FloatTensor与Variable用法
2020/01/08 Python
python中xlutils库用法浅析
2020/12/29 Python
解决selenium+Headless Chrome实现不弹出浏览器自动化登录的问题
2021/01/09 Python
Autopep8的使用(python自动编排工具)
2021/03/02 Python
html5应用缓存_动力节点Java学院整理
2017/07/13 HTML / CSS
菲律宾最大的网上花店和礼品店:PhilFlower.com
2018/02/09 全球购物
SneakerStudio英国:最佳运动鞋商店
2019/05/22 全球购物
简述安装Slackware Linux系统的过程
2012/01/12 面试题
大四自我鉴定范文
2013/10/06 职场文书
房地产出纳岗位职责
2013/12/01 职场文书
高中毕业生生活的自我评价
2013/12/08 职场文书
员工培训邀请函
2014/01/11 职场文书
校长个人总结
2015/03/03 职场文书
2015年入党积极分子评语
2015/03/26 职场文书
2015初中生物教研组工作总结
2015/07/21 职场文书
品牌形象定位,全面分析
2019/07/23 职场文书
MySQL导致索引失效的几种情况
2022/06/25 MySQL