如何用python处理excel表格


Posted in Python onJune 09, 2020

openpyxl是一个第三方库,可以处理xlsx格式的Excel文件。pip install openpyxl安装。

读取Excel文件

需要导入相关函数

from openpyxl import load_workbook
# 默认可读写,若有需要可以指定write_only和read_only为True
wb = load_workbook('pythontab.xlsx')
默认打开的文件为可读写,若有需要可以指定参数read_only为True。

获取工作表--Sheet

# 获得所有sheet的名称
print(wb.get_sheet_names())
# 根据sheet名字获得sheet
a_sheet = wb.get_sheet_by_name('Sheet1')
# 获得sheet名
print(a_sheet.title)
# 获得当前正在显示的sheet, 也可以用wb.get_active_sheet()
sheet = wb.active

获取单元格

# 获取某个单元格的值,观察excel发现也是先字母再数字的顺序,即先列再行
b4 = sheet['B4']
# 分别返回
print(f'({b4.column}, {b4.row}) is {b4.value}') # 返回的数字就是int型
# 除了用下标的方式获得,还可以用cell函数, 换成数字,这个表示B2
b4_too = sheet.cell(row=4, column=2)
print(b4_too.value)

b4.column返回B, b4.row返回4, value则是那个单元格的值。另外cell还有一个属性coordinate, 像b4这个单元格返回的是坐标B4。

获得最大行和最大列

获取行和列

sheet.rows为生成器, 里面是每一行的数据,每一行又由一个tuple包裹。

sheet.columns类似,不过里面是每个tuple是每一列的单元格。

# 因为按行,所以返回A1, B1, C1这样的顺序
for row in sheet.rows:
 for cell in row:
  print(cell.value)
# A1, A2, A3这样的顺序
for column in sheet.columns:
 for cell in column:
  print(cell.value)

上面的代码就可以获得所有单元格的数据。如果要获得某行的数据呢?给其一个索引就行了,因为sheet.rows是生成器类型,不能使用索引,转换成list之后再使用索引,list(sheet.rows)[2]这样就获取到第二行的tuple对象。

for cell in list(sheet.rows)[2]:
print(cell.value)

如何获得任意区间的单元格?

可以使用range函数,下面的写法,获得了以A1为左上角,B3为右下角矩形区域的所有单元格。注意range从1开始的,因为在openpyxl中为了和Excel中的表达方式一致,并不和编程语言的习惯以0表示第一个值。

for i in range(1, 4):
 for j in range(1, 3):
  print(sheet.cell(row=i, column=j))
# out
<Cell pythontab.A1>
<Cell pythontab.B1>
<Cell pythontab.A2>
<Cell pythontab.B2>
<Cell pythontab.A3>
<Cell pythontab.B3>

还可以像使用切片那样使用。sheet['A1':'B3']返回一个tuple,该元组内部还是元组,由每行的单元格构成一个元组。

for row_cell in sheet['A1':'B3']:
 for cell in row_cell:
  print(cell)
for cell in sheet['A1':'B3']:
 print(cell)
# out
(<Cell pythontab.A1>, <Cell pythontab.B1>)
(<Cell pythontab.A2>, <Cell pythontab.B2>)
(<Cell pythontab.A3>, <Cell pythontab.B3>)

根据字母获得列号,根据列号返回字母

需要导入, 这两个函数存在于openpyxl.utils

from openpyxl.utils import get_column_letter, column_index_from_string
# 根据列的数字返回字母
print(get_column_letter(2)) # B
# 根据字母返回列的数字
print(column_index_from_string('D')) # 4

将数据写入Excel

工作表相关

需要导入WorkBook

from openpyxl import Workbook
wb = Workbook()

这样就新建了一个新的工作表(只是还没被保存)。

若要指定只写模式,可以指定参数write_only=True。一般默认的可写可读模式就可以了。

print(wb.get_sheet_names()) # 提供一个默认名叫Sheet的表,office2016下新建提供默认Sheet1
# 直接赋值就可以改工作表的名称
sheet.title = 'Sheet1'
# 新建一个工作表,可以指定索引,适当安排其在工作簿中的位置
wb.create_sheet('Data', index=1) # 被安排到第二个工作表,index=0就是第一个位置
# 删除某个工作表
wb.remove(sheet)
del wb[sheet]

写入单元格

还可以使用公式

# 直接给单元格赋值就行
sheet['A1'] = 'good'
# B9处写入平均值
sheet['B9'] = '=AVERAGE(B2:B8)'

但是如果是读取的时候需要加上data_only=True这样读到B9返回的就是数字,如果不加这个参数,返回的将是公式本身'=AVERAGE(B2:B8)'

append函数

可以一次添加多行数据,从第一行空白行开始(下面都是空白行)写入。

# 添加一行
row = [1 ,2, 3, 4, 5]
sheet.append(row)
# 添加多行
rows = [
 ['Number', 'data1', 'data2'],
 [2, 40, 30],
 [3, 40, 25],
 [4, 50, 30],
 [5, 30, 10],
 [6, 25, 5],
 [7, 50, 10],
]

由于append函数只能按行写入。如果我们想按列写入呢。append能实现需求么?如果把上面的列表嵌套看作矩阵。只要将矩阵转置就可以了。使用zip()函数可以实现,不过内部的列表变成了元组就是了。都是可迭代对象,不影响。

list(zip(*rows))
# out
[('Number', 2, 3, 4, 5, 6, 7),
 ('data1', 40, 40, 50, 30, 25, 50),
 ('data2', 30, 25, 30, 10, 5, 10)]

解释下上面的list(zip(*rows))首先*rows将列表打散,相当于填入了若干个参数,zip从某个列表中提取第1个值组合成一个tuple,再从每个列表中提取第2个值组合成一个tuple,一直到最短列表的最后一个值提取完毕后结束,更长列表的之后的值被舍弃,换句话,最后的元组个数是由原来每个参数(可迭代对象)的最短长度决定的。比如现在随便删掉一个值,最短列表长度为2,data2那一列(竖着看)的值全部被舍弃。

rows = [
 ['Number', 'data1', 'data2'],
 [2, 40],
 [3, 40, 25],
 [4, 50, 30],
 [5, 30, 10],
 [6, 25, 5],
 [7, 50, 10],
]
# out
[('Number', 2, 3, 4, 5, 6, 7), ('data1', 40, 40, 50, 30, 25, 50)]

最后zip返回的是zip对象,看不到数据的。使用list转换下就好了。使用zip可以方便实现将数据按列写入。

字体

bold_itatic_24_font = Font(name='等线', size=24, italic=True, color=colors.RED, bold=True)
sheet['A1'].font = bold_itatic_24_font

上面的代码指定了等线24号加粗斜体,字体颜色红色。直接使用cell的font属性,将Font对象赋值给它。

对齐方式

也是直接使用cell的属性aligment,这里指定垂直居中和水平居中。除了center,还可以使用right、left等等参数。

# 设置B1中的数据垂直居中和水平居中
sheet['B1'].alignment = Alignment(horizontal='center', vertical='center')

设置行高和列宽

有时候数据太长显示不完,就需要拉长拉高单元格

# 第2行行高
sheet.row_dimensions[2].height = 40
# C列列宽
sheet.column_dimensions['C'].width = 30

合并和拆分单元格

所谓合并单元格,即以合并区域的左上角的那个单元格为基准,覆盖其他单元格使之称为一个大的单元格。

相反,拆分单元格后将这个大单元格的值返回到原来的左上角位置。

# 合并单元格, 往左上角写入数据即可
sheet.merge_cells('B1:G1') # 合并一行中的几个单元格
sheet.merge_cells('A1:C3') # 合并一个矩形区域中的单元格

合并后只可以往左上角写入数据,也就是区间中:左边的坐标。

如果这些要合并的单元格都有数据,只会保留左上角的数据,其他则丢弃。换句话说若合并前不是在左上角写入数据,合并后单元格中不会有数据。

以下是拆分单元格的代码。拆分后,值回到A1位置。

sheet.unmerge_cells('A1:C3')

实例代码扩展:

# coding=utf-8

import xlrd

# 打开文件
data = xlrd.open_workbook('file/demo.xlsx')

# 查看工作表
data.sheet_names()
print("sheets:" + str(data.sheet_names()))

# 通过文件名获得工作表,获取工作表1
table = data.sheet_by_name('工作表1')

# 打印data.sheet_names()可发现,返回的值为一个列表,通过对列表索引操作获得工作表1
# table = data.sheet_by_index(0)

# 获取行数和列数
# 行数:table.nrows
# 列数:table.ncols
print("总行数:" + str(table.nrows))
print("总列数:" + str(table.ncols))

# 获取整行的值 和整列的值,返回的结果为数组
# 整行值:table.row_values(start,end)
# 整列值:table.col_values(start,end)
# 参数 start 为从第几个开始打印,
# end为打印到那个位置结束,默认为none
print("整行值:" + str(table.row_values(0)))
print("整列值:" + str(table.col_values(1)))

# 获取某个单元格的值,例如获取B3单元格值
cel_B3 = table.cell(3,2).value
print("第三行第二列的值:" + cel_B3)

到此这篇关于如何用python处理excel表格的文章就介绍到这了,更多相关python处理excel表格详解内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python中PDB模块中的命令来调试Python代码的教程
Mar 30 Python
Python中的pass语句使用方法讲解
May 14 Python
python连接数据库的方法
Oct 19 Python
python的exec、eval使用分析
Dec 11 Python
python并发编程之线程实例解析
Dec 27 Python
一道python走迷宫算法题
Jan 22 Python
TensorFlow实现非线性支持向量机的实现方法
Apr 28 Python
python 执行终端/控制台命令的例子
Jul 12 Python
python 求10个数的平均数实例
Dec 16 Python
Python面向对象特殊属性及方法解析
Sep 16 Python
Python如何使用ElementTree解析xml
Oct 12 Python
python opencv通过按键采集图片源码
May 20 Python
使用Keras 实现查看model weights .h5 文件的内容
Jun 09 #Python
Python使用Chrome插件实现爬虫过程图解
Jun 09 #Python
Python导入数值型Excel数据并生成矩阵操作
Jun 09 #Python
Python带参数的装饰器运行原理解析
Jun 09 #Python
Python sorted对list和dict排序
Jun 09 #Python
python初步实现word2vec操作
Jun 09 #Python
Python生成随机验证码代码实例解析
Jun 09 #Python
You might like
php 网上商城促销设计实例代码
2012/02/17 PHP
关于php程序报date()警告的处理(date_default_timezone_set)
2013/10/22 PHP
PHP入门教程之日期与时间操作技巧总结(格式化,验证,获取,转换,计算等)
2016/09/11 PHP
Javascript实例教程(19) 使用HoTMetal(2)
2006/12/23 Javascript
javascript 播放器 控制
2007/01/22 Javascript
js的with语句使用方法
2007/09/21 Javascript
JavaScript 类似flash效果的立体图片浏览器
2010/02/08 Javascript
jQuery asp.net 用json格式返回自定义对象
2010/04/07 Javascript
JS生成随机字符串的多种方法
2014/06/10 Javascript
js使用心得分享
2015/01/13 Javascript
JavaScript识别网页关键字并进行描红的方法
2015/11/09 Javascript
JavaScript如何禁止Backspace键
2015/12/02 Javascript
Bootstrap table分页问题汇总
2016/05/30 Javascript
NodeJs模拟登陆正方教务
2017/04/28 NodeJs
js Dom实现换肤效果
2017/10/21 Javascript
webpack vue 项目打包生成的文件,资源文件报404问题的修复方法(总结篇)
2018/01/09 Javascript
了解JavaScript表单操作和表单域
2019/05/27 Javascript
vue使用高德地图点击下钻上浮效果的实现思路
2019/10/12 Javascript
微信小程序如何实现在线客服功能
2019/10/16 Javascript
javascript实现时间日期的格式化的方法汇总
2020/08/06 Javascript
谈谈JavaScript中的函数
2020/09/08 Javascript
Python中使用PDB库调试程序
2015/04/05 Python
使用Python的Scrapy框架编写web爬虫的简单示例
2015/04/17 Python
30秒轻松实现TensorFlow物体检测
2018/03/14 Python
Python爬虫信息输入及页面的切换方法
2018/05/11 Python
深入了解Python枚举类型的相关知识
2019/07/09 Python
为什么从Python 3.6开始字典有序并效率更高
2019/07/15 Python
决策树剪枝算法的python实现方法详解
2019/09/18 Python
Python Django中的STATIC_URL 设置和使用方式
2020/03/27 Python
浅谈sklearn中predict与predict_proba区别
2020/06/28 Python
中专毕业生自我鉴定
2013/11/21 职场文书
县优秀教师事迹材料
2014/01/31 职场文书
通知的写法
2015/04/23 职场文书
餐厅开业活动方案
2019/07/08 职场文书
创业计划书之校园跑腿公司
2019/09/24 职场文书
在CSS中映射鼠标位置并实现通过鼠标移动控制页面元素效果(实例代码)
2021/04/22 HTML / CSS