python读取文本中数据并转化为DataFrame的实例


Posted in Python onApril 10, 2018

在技术问答中看到一个这样的问题,感觉相对比较常见,就单开一篇文章写下来。

从纯文本格式文件 “file_in”中读取数据,格式如下:

python读取文本中数据并转化为DataFrame的实例

需要输出成“file_out”,格式如下:

python读取文本中数据并转化为DataFrame的实例

数据的原格式是“类别:内容”,以空行“\n”为分条目,转换后变成一个条目一行,按照类别顺序依次写出内容。

建议读取后,使用pandas,把数据建立称DataFrame的表格。这样方便以后处理数据。但是原格式并不是通常的表格格式,所以要先做一些简单的处理。

#coding:utf8
import sys
from pandas import DataFrame  #DataFrame通常来装二维的表格
import pandas as pd      #pandas是流行的做数据分析的包
#建立字典,键和值都从文件里读出来。键是nam,age……,值是lili,jim……
dict_data={}
#打开文件
with open('file_in.txt','r')as df:
  #读每一行
  for line in df:
    #如果这行是换行符就跳过,这里用'\n'的长度来找空行
    if line.count('\n') == len(line):
      continue
    #对每行清除前后空格(如果有的话),然后用":"分割
    for kv in [line.strip().split(':')]:
      #按照键,把值写进去
      dict_data.setdefault(kv[0],[]).append(kv[1])
#print(dict_data)看看效果
#这是把键读出来成为一个列表
columnsname=list(dict_data.keys())
#建立一个DataFrame,列名即为键名,也就是nam,age……
frame = DataFrame(dict_data,columns=columnsname)
#把DataFrame输出到一个表,不要行名字和列名字
frame.to_csv('file_out0.txt',index=False,header=False)

以上这篇python读取文本中数据并转化为DataFrame的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现在线程里运行scrapy的方法
Apr 07 Python
python中enumerate函数用法实例分析
May 20 Python
Python中urllib+urllib2+cookielib模块编写爬虫实战
Jan 20 Python
如何用itertools解决无序排列组合的问题
May 18 Python
Python编程使用tkinter模块实现计算器软件完整代码示例
Nov 29 Python
python获取指定字符串中重复模式最高的字符串方法
Jun 29 Python
Python实现图片拼接的代码
Jul 02 Python
Python实现定制自动化业务流量报表周报功能【XlsxWriter模块】
Mar 11 Python
pyCharm 实现关闭代码检查
Jun 09 Python
python 实现两个npy档案合并
Jul 01 Python
python中spy++的使用超详细教程
Jan 29 Python
浅谈Python3中datetime不同时区转换介绍与踩坑
Aug 02 Python
python实现百度语音识别api
Apr 10 #Python
Python Selenium Cookie 绕过验证码实现登录示例代码
Apr 10 #Python
浅谈pandas中Dataframe的查询方法([], loc, iloc, at, iat, ix)
Apr 10 #Python
python pandas dataframe 行列选择,切片操作方法
Apr 10 #Python
python3下实现搜狗AI API的代码示例
Apr 10 #Python
Python基于pycrypto实现的AES加密和解密算法示例
Apr 10 #Python
浅谈Pandas中map, applymap and apply的区别
Apr 10 #Python
You might like
全国FM电台频率大全 - 27 陕西省
2020/03/11 无线电
PHP Smarty生成EXCEL文档的代码
2008/08/23 PHP
PHP在字符串中查找指定字符串并删除的代码
2008/10/02 PHP
php中explode与split的区别介绍
2012/10/03 PHP
php定时执行任务设置详解
2015/02/06 PHP
PHP生成推广海报的方法分享
2018/04/22 PHP
浅谈PHPANALYSIS提取关键字
2019/03/08 PHP
checkbox 复选框不能为空
2009/07/11 Javascript
javascript控制frame,iframe的src属性代码
2009/12/31 Javascript
jquery 新建的元素事件绑定问题解决方案
2014/06/12 Javascript
Javascript动态创建div的方法
2015/02/09 Javascript
javascript实现数独解法
2015/03/14 Javascript
Javascript实现字数统计
2015/07/03 Javascript
js实现prototype扩展的方法(字符串,日期,数组扩展)
2016/01/14 Javascript
bootstrap网页框架的使用方法
2016/05/10 Javascript
关于session和cookie的简单理解
2016/06/08 Javascript
微信小程序组件 marquee实例详解
2017/06/23 Javascript
vue实现引入本地json的方法分析
2018/07/12 Javascript
js实现坦克移动小游戏
2019/10/28 Javascript
JS实现时间校验的代码
2020/05/25 Javascript
[00:37]DOTA2上海特级锦标赛 Secert 战队宣传片
2016/03/03 DOTA
Python中处理unchecked未捕获异常实例
2015/01/17 Python
Python Web框架Tornado运行和部署
2020/10/19 Python
python模块和包的应用BASE_PATH使用解析
2019/12/14 Python
pytorch学习教程之自定义数据集
2020/11/10 Python
python中最小二乘法详细讲解
2021/02/19 Python
HTML5单页面手势滑屏切换原理
2016/03/21 HTML / CSS
Probikekit欧盟:在线公路自行车专家
2019/07/12 全球购物
澳大利亚床上用品、浴巾和家居用品购物网站:Bambury
2020/04/16 全球购物
销售工作人员的自我评价分享
2013/11/10 职场文书
应届大学生自荐信
2013/12/05 职场文书
岗位廉政承诺书
2014/03/27 职场文书
安全宣传标语
2014/06/10 职场文书
python实现简易名片管理系统
2021/04/11 Python
python爬取某网站原图作为壁纸
2021/06/02 Python
通过shell脚本对mysql的增删改查及my.cnf的配置
2021/07/07 MySQL