python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python编程语言的35个与众不同之处(语言特征和使用技巧)
Jul 07 Python
闭包在python中的应用之translate和maketrans用法详解
Aug 27 Python
使用Python中PDB模块中的命令来调试Python代码的教程
Mar 30 Python
python学习教程之Numpy和Pandas的使用
Sep 11 Python
Python实现模拟分割大文件及多线程处理的方法
Oct 10 Python
PyQt5图形界面播放音乐的实例
Jun 17 Python
Django结合ajax进行页面实时更新的例子
Aug 12 Python
pytorch AvgPool2d函数使用详解
Jan 03 Python
django实现模型字段动态choice的操作
Apr 01 Python
使用Django清空数据库并重新生成
Apr 03 Python
Python如何使用PIL Image制作GIF图片
May 16 Python
使用python实现下载我们想听的歌曲,速度超快
Jul 09 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
记录mysql性能查询过程的使用方法
2013/05/02 PHP
php使用正则验证中文
2016/04/06 PHP
php 解析xml 的四种方法详细介绍
2016/10/26 PHP
Thinkphp5 自定义上传文件名的实现方法
2019/07/23 PHP
PHP中有关长整数的一些操作教程
2019/09/11 PHP
JavaScript cookie的设置获取删除详解
2014/02/11 Javascript
一个不错的仿携程自定义数据下拉选择select
2014/09/01 Javascript
分享20款美化网站的 jQuery Lightbox 灯箱插件
2014/10/10 Javascript
js中 javascript:void(0) 用法详解
2015/08/11 Javascript
浅谈JQuery+ajax+jsonp 跨域访问
2016/06/25 Javascript
jQuery使用zTree插件实现可拖拽的树示例
2017/09/23 jQuery
vue2.0在没有dev-server.js下的本地数据配置方法
2018/02/23 Javascript
微信公众号H5支付接口调用方法
2019/01/10 Javascript
vue 实现搜索的结果页面支持全选与取消全选功能
2019/05/10 Javascript
python中的多重继承实例讲解
2014/09/28 Python
python利用拉链法实现字典方法示例
2017/03/25 Python
利用python爬取软考试题之ip自动代理
2017/03/28 Python
Python图片裁剪实例代码(如头像裁剪)
2017/06/21 Python
Python中摘要算法MD5,SHA1简介及应用实例代码
2018/01/09 Python
Python设计模式之解释器模式原理与用法实例分析
2019/01/10 Python
Python3 串口接收与发送16进制数据包的实例
2019/06/12 Python
Django分页功能的实现代码详解
2019/07/29 Python
Django发送邮件和itsdangerous模块的配合使用解析
2019/08/10 Python
python爬虫 爬取超清壁纸代码实例
2019/08/16 Python
Python3实现将一维数组按标准长度分隔为二维数组
2019/11/29 Python
树莓派升级python的具体步骤
2020/07/05 Python
Pycharm中使用git进行合作开发的教程详解
2020/11/17 Python
FragranceNet中文网:北美健康美容线上零售商
2020/08/26 全球购物
平面设计的岗位职责
2013/11/08 职场文书
国税会议欢迎词
2014/01/16 职场文书
土木工程师职业规划范文
2014/03/07 职场文书
爱护草坪标语
2014/06/24 职场文书
领导干部群众路线教育实践活动个人对照检查材料
2014/09/23 职场文书
2014年出纳工作总结与计划
2014/12/09 职场文书
标会主持词应该怎么写?
2019/08/15 职场文书
JS实现简单九宫格抽奖
2022/06/28 Javascript