python 使用openpyxl读取excel数据


Posted in Python onFebruary 18, 2021

openpyxl介绍

​ openpyxl是一个开源项目,它是一个用于读取/写入Excel 2010文档(如xlsx 、xlsm 、xltx 、xltm文件 )的Python库,如果要处理更早格式的Excel文档(xls),需要用到其它库(如:xlrd、xlwt等),这是openpyxl比较其他模块的不足之处。openpyxl是一款比较综合的工具,不仅能够同时读取和修改Excel文档,而且可以对Excel文件内单元格进行详细设置,包括单元格样式等内容,甚至还支持图表插入、打印设置等内容。

​ python中与excel操作相关的模块:

  • ? xlrd库:从excel中读取数据,支持xls、xlsx格式
  • ? xlwt库:对excel进行修改操作,但不支持对xlsx格式的修改
  • ? xlutils库:在xlwt和xlrd中,对一个已存在文件进行修改
  • ? openpyxl库:主要针对xlsx格式的excel进行读取和编辑

openpyxl安装

pip install openpyxl

openpyxl基本概念

  • WorkBook:工作簿对象
  • Sheet:表单对象
  • Cell:表格对象

​ 也就是我们使用excel时可以看到的三个对象,我们操作excel的步骤是打开工作簿,选中表单,对单元格进行操作,而openpyxl的工作原理也是如此。

python 使用openpyxl读取excel数据

openpyxl对excel进行操作

新建excel

import openpyxl

# 创建一个工作簿
workbook = openpyxl.Workbook()
# 创建一个表单
sheet = workbook.create_sheet('表单1')
# 写入一个数据
sheet.cell(row=1, column=1, value="python")
# 保存
workbook.save('test.xlsx')

​ ? 注意点:如果保存的文件名已存在,将会覆盖原来的文件

打开已存在的文件

  • 打开已存在的文件:load_workbook()
  • 获取表单:workbook['表单名']
  • 读取指定表格:cell(row, column).value
import openpyxl

# 打开工作簿
workbook = openpyxl.load_workbook('test.xlsx')
# 获取表单
sheet = workbook['表单1']
# 读取指定的单元格数据
cell = sheet.cell(row=1, column=1).value
print(cell)

​ 运行结果:

C:\software\python\python.exe D:/learn/python24/python_base/test.py
python

Process finished with exit code 0

读取单个单元格

# 方式一:读取A6单元格的值
cell1 = sheet['A6'].value

# 方式二:读取第3行,第4列单元格的值
cell2 = sheet.cell(row=3, column=4).value

读取多个单元格

# 方式一:读取A6单元格的值
cell1 = sheet['A6'].value

# 方式二:读取第3行,第4列单元格的值
cell2 = sheet.cell(row=3, column=4).value

​ 读取多个单元格时,都是以元组的形式返回

其他相关操作

关键代码 相关描述
cell(row, column, value) 写入数据,三个参数分别是行,列,值
cell(row, column).value 获取指定单元格的值,两个参数分别是行,列
workbook.remove('表单名') 删除表单
del workbook['表单名'] 删除表单
workbook.save('文件名') 保存工作簿
sheet.max_row 获取表单数据的总行数
sheet.max_column 获取表单数据的总列数
sheet.rows 获取按行所有的数据
sheet.columns 获取按列所有的数据

​ ? 注意点:

  • openpyxl中列和行的起始标识都是1,不是从0开始
  • 从excel中读取出来的数据只有两种类型,即数值类型和字符串类型
  • 不要随便在表格中敲空格,会影响判断最大行数和最大列数
  • 运行操作excel的代码时,要先关闭在操作系统中打开的相关excel表,否则可能会无法读取/写入数据
  • 写入数据时要执行保存
import openpyxl

# 打开工作簿
wb = openpyxl.load_workbook('test.xlsx')
# 获取表单
sh = wb['表单1']
# 读取指定的单元格数据
res1 = sh.cell(row=1, column=1).value
print(res1)

# 获取最大行数
print(sh.max_row)
# 获取最大列数
print(sh.max_column)

# 按列读取所有数据,每一列的单元格放入一个元组中
print(sh.columns) # 直接打印,打印结果是一个可迭代对象,我们可以转换成列表来查看

# 按行读取所有数据,每一行的单元格放入一个元组中
rows = sh.rows
# print(list(rows)) # 转换成列表之后打印结果为具体的单元格,如下
# [(<Cell '表单1'.A1>, <Cell '表单1'.B1>, <Cell '表单1'.C1>, <Cell '表单1'.D1>, <Cell '表单1'.E1>, <Cell '表单1'.F1>, <Cell '表单1'.G1>),
# (<Cell '表单1'.A2>, <Cell '表单1'.B2>, <Cell '表单1'.C2>, <Cell '表单1'.D2>, <Cell '表单1'.E2>, <Cell '表单1'.F2>, <Cell '表单1'.G2>),
# (<Cell '表单1'.A3>, <Cell '表单1'.B3>, <Cell '表单1'.C3>, <Cell '表单1'.D3>, <Cell '表单1'.E3>, <Cell '表单1'.F3>, <Cell '表单1'.G3>)]


# 我们可以通过for循环以及value来查看单元格的值
for row in list(rows): # 遍历每行数据
 case = [] # 用于存放一行数据
 for c in row: # 把每行的每个单元格的值取出来,存放到case里
  case.append(c.value)
 print(case)

​ 运行结果:

C:\software\python\python.exe D:/learn/python24/python_base/test.py
case_id
3
7
<generator object Worksheet._cells_by_col at 0x0000012FEF90D8B8>
['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected']
[1, 'login', '登录成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'OK'}"]
[2, 'login', '登录失败-手机号为空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手机号码为空'}"]

​ excel表中的原数据如下图:

python 使用openpyxl读取excel数据

openpyxl封装

​ 在测试过程中,我们会经常需要访问excel读取测试数据,如果?胺梦室淮挝颐蔷偷饔靡淮?penpyxl,进行打开excel,选取表单,读取数据等操作,将会增加我们的工作量和代码量。凡是需要重复使用的,我们都可以对它进行二次封装,写成我们自己的版本,还可以在封装过程中加入我们想要的内容,使用的时候直接调用即可。

​ 在封装openpyxl时,读取excel时我写了两种实现方法,第一种是读取数据后,把每条测试数据的键值保存到一个字典中,再把字典存到一个列表,这种方式比较容易理解,但是调用的时候需要多敲几个括号或者引号;第二种是把每条测试数据的键值存到一个实例对象的属性中,再把每个实例存到一个列表。实际上他们的作用是一样,只是第二种方式调用时更简单。

# read_excel.py
import openpyxl


class CasesData:
 """用于保存测试用例数据"""
 pass


class ReadExcel:

 def __init__(self, file_name, sheet_name):
  self.file_name = file_name
  self.sheet_name = sheet_name

 def open(self):
  self.wb = openpyxl.load_workbook(self.file_name)
  self.sh = self.wb[self.sheet_name]

 def close(self):
  self.wb.close()

 def read_data(self):
  """按行读取数据,最后返回一个存储字典的列表"""
  self.open()
  rows = list(self.sh.rows)
  titles = []
  for t in rows[0]:
   title = t.value
   titles.append(title)
  cases = []
  for row in rows[1:]:
   case = []
   for r in row:
    case.append(r.value)
   cases.append(dict(zip(titles, case))) # 通过zip聚合打包用例的标题和数据
  self.close()
  return cases

 def read_data_obj(self):
  """按行读取数据,最后返回的是一个存储实例对象的列表"""
  self.open()
  rows = list(self.sh.rows)
  titles = []
  for t in rows[0]:
   title = t.value
   titles.append(title)
  cases = []
  for row in rows[1:]:
   case_obj = CasesData() # 创建一个对象用来保存该行用例数据
   case = []
   for r in row:
    case.append(r.value)
   case_info = dict(zip(titles, case))
   for k, v in case_info.items():
    setattr(case_obj, k, v)
   cases.append(case_obj)
  self.close()
  return cases

 def write_data(self, row, column, msg):
  self.open()
  self.sh.cell(row=row, column=column, value=msg)
  self.wb.save(self.file_name)
  self.close()


if __name__ == '__main__':
 # 直接运行本文件时执行,下面是一个应用实例
 # 需要读取excel时直接调用ReadExcel类
 test = ReadExcel('cases.xlsx', 'login')
 res = test.read_data_obj()	# 最后返回的是一个存储实例对象的列表
 print(res[0].case_id)	# 打印第1个用例的case_id
 print(res[3].title)		# 打印第4个用例的title
 
 test2 = ReadExcel('cases.xlsx', 'login')
 res2 = test2.read_data()	# 最后返回一个存储字典的列表
 print(res2[0]['case_id'])	# 打印第1个用例的case_id
 print(res2[3]['title'])		# 打印第4个用例的title

​ 上面封装的openpyxl中,应用实例的excel表结构如下:

python 使用openpyxl读取excel数据

以上就是python 使用openpyxl读取excel数据的详细内容,更多关于python openpyxl读取excel数据的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python命名空间详解
Aug 18 Python
详解Python在七牛云平台的应用(一)
Dec 05 Python
JavaScript实现一维数组转化为二维数组
Apr 17 Python
对Python中type打开文件的方式介绍
Apr 28 Python
win10下python3.5.2和tensorflow安装环境搭建教程
Sep 19 Python
pygame游戏之旅 添加游戏界面按键图形
Nov 20 Python
在python3中pyqt5和mayavi不兼容问题的解决方法
Jan 08 Python
Python远程视频监控程序的实例代码
May 05 Python
使用Python和Prometheus跟踪天气的使用方法
May 06 Python
简单了解python单例模式的几种写法
Jul 01 Python
python实现集中式的病毒扫描功能详解
Jul 09 Python
python多进程下实现日志记录按时间分割
Jul 22 Python
Python用SSH连接到网络设备
Feb 18 #Python
python 实现IP子网计算
Feb 18 #Python
详解python3 GUI刷屏器(附源码)
Feb 18 #Python
基于Python-turtle库绘制路飞的草帽骷髅旗、美国队长的盾牌、高达的源码
Feb 18 #Python
Python如何telnet到网络设备
Feb 18 #Python
Python运算符+与+=的方法实例
Feb 18 #Python
python 获取计算机的网卡信息
Feb 18 #Python
You might like
一些关于PHP的知识
2006/11/17 PHP
PHP编码转换
2012/11/05 PHP
Yii获取当前url和域名的方法
2015/06/08 PHP
点击下载链接 弹出页面实现代码
2009/10/01 Javascript
一个基于jquery的文本框记数器
2012/09/19 Javascript
基于JavaScript 声明全局变量的三种方式详解
2013/05/07 Javascript
用RadioButten或CheckBox实现div的显示与隐藏
2013/09/21 Javascript
jQuery Form 页面表单提交的小例子
2013/11/15 Javascript
javascript 面向对象封装与继承
2014/11/27 Javascript
深入浅析JS的数组遍历方法(推荐)
2016/06/15 Javascript
原生JS实现简单放大镜效果
2017/02/08 Javascript
jQuery EasyUI Draggable拖动组件
2017/03/01 Javascript
解决v-for中使用v-if或者v-bind:class失效的问题
2018/09/25 Javascript
VUE脚手架具体使用方法
2019/05/20 Javascript
JavaScript模块管理的简单实现方式详解
2019/06/15 Javascript
jQuery实现简单弹幕效果
2019/11/28 jQuery
Vue+axios封装请求实现前后端分离
2020/10/23 Javascript
探究Python多进程编程下线程之间变量的共享问题
2015/05/05 Python
简单谈谈Python中的几种常见的数据类型
2017/02/10 Python
Django实现自定义404,500页面教程
2017/03/26 Python
python实现redis三种cas事务操作
2017/12/19 Python
[原创]Python入门教程2. 字符串基本操作【运算、格式化输出、常用函数】
2018/10/29 Python
使用python判断你是青少年还是老年人
2018/11/29 Python
详解pandas安装若干异常及解决方案总结
2019/01/10 Python
Django之无名分组和有名分组的实现
2019/04/16 Python
flask框架单元测试原理与用法实例分析
2019/07/23 Python
python匿名函数用法实例分析
2019/08/03 Python
Python3 requests文件下载 期间显示文件信息和下载进度代码实例
2019/08/16 Python
利用python实现逐步回归
2020/02/24 Python
用 python 进行微信好友信息分析
2020/11/28 Python
香港士多网上超级市场:Ztore
2021/01/09 全球购物
什么是数组名
2012/05/10 面试题
社区母亲节活动记录
2014/03/06 职场文书
关于护士节的演讲稿
2014/05/26 职场文书
双拥工作宣传标语
2014/06/26 职场文书
Mysql - 常用函数 每天积极向上
2021/04/05 MySQL