python读取各种文件数据方法解析


Posted in Python onDecember 29, 2018

python读取.txt(.log)文件 、.xml 文件 、excel文件数据,并将数据类型转换为需要的类型,添加到list中详解

1.读取文本文件数据(.txt结尾的文件)或日志文件(.log结尾的文件)

以下是文件中的内容,文件名为data.txt(与data.log内容相同),且处理方式相同,调用时改个名称就可以了:

python读取各种文件数据方法解析

以下是python实现代码:

# -*- coding:gb2312 -*-
import json
def read_txt_high(filename):
  with open(filename, 'r') as file_to_read:
    list0 = [] #文件中的第一列数据
    list1 = [] #文件中的第二列数据
    while True:
      lines = file_to_read.readline() # 整行读取数据
      if not lines:
        break
      item = [i for i in lines.split()]
      data0 = json.loads(item[0])#每行第一个值
      data1 = json.loads(item[1])#每行第二个值
      list0.append(data0)
      list1.append(data1)
  return list0,list1

list0与list1分别为文档中的第一列数据与第二列数据。运行若是文本文件(.txt结尾的文件)输入以下:

aa,bb = read_txt_high('data.txt')
print aa
print bb

若是日志文件(.log结尾的文件),输入以下:

aa,bb = read_txt_high('data.log')
print aa
print bb

运行结果如下:

python读取各种文件数据方法解析

2.读取.xml结尾的文件

XML文件的名称为abc.xml, 内容如下图所示:

python读取各种文件数据方法解析

以下是实现代码:

# -*- coding:gb2312 -*-
# coding = utf-8
from pylab import *
import xml.dom.minidom
def read_xml():
  dom = xml.dom.minidom.parse('abc.xml')#打开xml文档
  cc=dom.getElementsByTagName('caption')
  list_str = [] #字符串
  for item in cc:
    list_str.append(str(item.firstChild.data))

  bb = dom.getElementsByTagName('maxid')
  list_fig = []
  for item in bb:
    list_fig.append(item.firstChild.data)
  su = list_fig[0].encode("gbk")
  list_fig2 = su.split(",")
  list_fig_num = []
  for i in list_fig2:
    list_fig_num.append(int(i))

  ee = dom.getElementsByTagName('time')
  list_tim = []
  for item in ee:
    list_tim.append(item.firstChild.data)
  sg = list_tim[0].encode("gbk")
  list_time = sg.split(",")

  gg = dom.getElementsByTagName('font_size')
  g1 = []
  for item in gg:
    g1.append(item.firstChild.data)
  su = g1[0].encode("gbk")
  return list_str,list_fig_num,list_time,su

调用此函数如下所示:

a,b,c,d = read_xml()
print a
print b
print c
print d

输出结果如下图所示:

python读取各种文件数据方法解析

3.读取excel文件数据,并将其存入list列表中

excel表格中的数据如下图所示,表格命名为data.xlsx:

python读取各种文件数据方法解析

首先将ID列中的数据保存到列表list_col中,实现代码如下所示:

# -*- coding: utf-8 -*-
import xlrd
import json

def read_ex_stop_PTline():
  # 打开文件
  workbook = xlrd.open_workbook(r'data.xlsx')
  sheet = workbook.sheet_by_name('PTline')
  list_col = []
  for i in range(1,sheet.nrows):
    c = sheet.cell(i,3).value
    list_col.append(int(c))
  print list_col

调用此函数,输出结果如下:

python读取各种文件数据方法解析

以下将linkIDsequence列数据存放到一个list中,即list_ele中,实现代码如下:

# -*- coding: utf-8 -*-
import xlrd
import json

def read_ex_stop_PTline():
  # 打开文件
  workbook = xlrd.open_workbook(r'data.xlsx')
  sheet = workbook.sheet_by_name('PTline')
  list_ele = [] #第八列的所有数据放入一个list中
  for i in range(1,sheet.nrows):
    c = sheet.cell(i, 8).value
    cc = json.loads(c) #第八列的每个单元格处理为一个list
    for j in range(len(cc)):
      list_ele.append(cc[j])
  print list_ele

调用函数read_ex_stop_PTline,输出结果如下图所示:

python读取各种文件数据方法解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python3实现生成随机密码的方法
Aug 23 Python
Python深入学习之装饰器
Aug 31 Python
使用PDB模式调试Python程序介绍
Apr 05 Python
Python使用BeautifulSoup库解析HTML基本使用教程
Mar 31 Python
Python实现JSON反序列化类对象的示例
Jan 31 Python
python3实现往mysql中插入datetime类型的数据
Mar 02 Python
Python自动化测试笔试面试题精选
Mar 12 Python
keras .h5转移动端的.tflite文件实现方式
May 25 Python
Keras 利用sklearn的ROC-AUC建立评价函数详解
Jun 15 Python
python 利用toapi库自动生成api
Oct 19 Python
Pandas自定义选项option设置
Jul 25 Python
Python中的matplotlib绘制百分比堆叠柱状图,并为每一个类别设置不同的填充图案
Apr 20 Python
python 读取鼠标点击坐标的实例
Dec 29 #Python
对python for 文件指定行读写操作详解
Dec 29 #Python
Python实现二维曲线拟合的方法
Dec 29 #Python
python修改txt文件中的某一项方法
Dec 29 #Python
神经网络相关之基础概念的讲解
Dec 29 #Python
Python实现的KMeans聚类算法实例分析
Dec 29 #Python
Python使用pyshp库读取shapefile信息的方法
Dec 29 #Python
You might like
php中debug_backtrace、debug_print_backtrace和匿名函数用法实例
2014/12/01 PHP
php检查日期函数checkdate用法实例
2015/03/19 PHP
ThinkPHP开发--使用七牛云储存
2017/09/14 PHP
tp5 实现列表数据根据状态排序
2019/10/18 PHP
Display SQL Server Version Information
2007/06/21 Javascript
jQuery中prevAll()方法用法实例
2015/01/08 Javascript
jQuery EasyUI 获取tabs的实例解析
2016/12/06 Javascript
js继承实现方法详解
2016/12/16 Javascript
原生JS+Canvas实现五子棋游戏实例
2017/06/19 Javascript
js实现城市级联菜单的2种方法
2017/06/23 Javascript
vue 父组件通过v-model接收子组件的值的代码
2019/10/27 Javascript
解决vue 给window添加和移除resize事件遇到的坑
2020/07/21 Javascript
[10:24]郎朗助力完美“圣”典,天籁交织奏响序曲
2016/12/18 DOTA
跟老齐学Python之玩转字符串(2)
2014/09/14 Python
Windows下安装python2.7及科学计算套装
2015/03/05 Python
Python中的面向对象编程详解(上)
2015/04/13 Python
使用pip发布Python程序的方法步骤
2018/10/11 Python
python 分离文件名和路径以及分离文件名和后缀的方法
2018/10/21 Python
django项目登录中使用图片验证码的实现方法
2019/08/15 Python
python3获取url文件大小示例代码
2019/09/18 Python
Python实现aes加密解密多种方法解析
2020/05/15 Python
Python collections模块的使用方法
2020/10/09 Python
基于python爬取梨视频实现过程解析
2020/11/09 Python
Python Selenium XPath根据文本内容查找元素的方法
2020/12/07 Python
法国时尚童装网站:Melijoe
2016/08/10 全球购物
联想哥伦比亚网上商城:Lenovo Colombia
2017/01/10 全球购物
理肤泉英国官网:La Roche-Posay英国
2019/01/14 全球购物
Perfume’s Club法国站:购买香水和化妆品
2019/05/02 全球购物
大学生活动策划方案
2014/02/10 职场文书
喝酒检查书范文
2014/02/23 职场文书
家长对孩子的感言
2014/03/10 职场文书
装修协议书范本
2014/04/21 职场文书
妇联领导班子剖析材料
2014/08/21 职场文书
优秀工作者事迹材料
2014/12/26 职场文书
红领巾广播站广播稿
2015/08/19 职场文书
《现实主义勇者的王国再建记》第三弹OST全曲试听片段公开
2022/04/04 日漫