python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python数据结构之二叉树的建立实例
Apr 29 Python
利用Python和OpenCV库将URL转换为OpenCV格式的方法
Mar 27 Python
使用Python脚本生成随机IP的简单方法
Jul 30 Python
Python中音频处理库pydub的使用教程
Jun 07 Python
Python实现的选择排序算法原理与用法实例分析
Nov 22 Python
Python读取Json字典写入Excel表格的方法
Jan 03 Python
Python操作mongodb的9个步骤
Jun 04 Python
python3爬虫学习之数据存储txt的案例详解
Apr 24 Python
python保存字典和读取字典的实例代码
Jul 07 Python
python Scrapy框架原理解析
Jan 04 Python
Django migrate报错的解决方案
May 20 Python
tensorboard 可视化之localhost:6006不显示的解决方案
May 22 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
把PHP安装为Apache DSO
2006/10/09 PHP
PHP获取客户端真实IP地址的5种情况分析和实现代码
2014/07/08 PHP
Zend Studio使用技巧两则
2016/04/01 PHP
php+webSoket实现聊天室示例代码(附源码)
2017/02/17 PHP
Laravel框架实现定时发布任务的方法
2018/08/16 PHP
一个刚完成的layout(拖动流畅,不受iframe影响)
2007/08/17 Javascript
JavaScript中的property和attribute介绍
2011/12/26 Javascript
用js控制组织结构图可以任意拖拽到指定位置
2014/01/17 Javascript
JS使用eval解析JSON的注意事项分析
2015/11/14 Javascript
nodejs的压缩文件模块archiver用法示例
2017/01/18 NodeJs
JS实现按钮添加背景音乐示例代码
2017/10/17 Javascript
js中Array对象的常用遍历方法详解
2019/01/17 Javascript
Vue自定义全局Toast和Loading的实例详解
2019/04/18 Javascript
[47:42]Fnatic vs Liquid 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
Python库urllib与urllib2主要区别分析
2014/07/13 Python
仅用50行Python代码实现一个简单的代理服务器
2015/04/08 Python
json跨域调用python的方法详解
2017/01/11 Python
Python正则表达式教程之一:基础篇
2017/03/02 Python
Python中使用haystack实现django全文检索搜索引擎功能
2017/08/26 Python
Linux(Redhat)安装python3.6虚拟环境(推荐)
2018/05/05 Python
Python从文件中读取数据的方法讲解
2019/02/14 Python
Python常见数字运算操作实例小结
2019/03/22 Python
树莓派实现移动拍照
2019/06/22 Python
Python3.6实现根据电影名称(支持电视剧名称),获取下载链接的方法
2019/08/26 Python
python之yield和Generator深入解析
2019/09/18 Python
使用tensorflow实现VGG网络,训练mnist数据集方式
2020/05/26 Python
python中查看.db文件中表格的名字及表格中的字段操作
2020/07/07 Python
解决Pyinstaller打包软件失败的一个坑
2021/03/04 Python
CSS3教程:新增加的结构伪类
2009/04/02 HTML / CSS
来自世界各地的饮料:Flavourly
2019/05/06 全球购物
如何开发一个JQuery插件
2016/07/28 面试题
J2EE面试题大全
2016/08/06 面试题
安全资料员岗位职责
2013/12/14 职场文书
出纳员岗位责任制
2014/02/11 职场文书
青年文明号申报材料
2014/12/23 职场文书
员工开除通知书
2015/04/25 职场文书