Python 自由定制表格的实现示例


Posted in Python onMarch 20, 2020

很多开发者说自从有了 Python/Pandas,Excel 都不怎么用了,用它来处理与可视化表格非常快速。

下面我来举几个例子。

1. 删除重复行和空行

我们直接用dict.fromkeys的方法把当前的数据转为字典,默认的值为None因为用不到,也就无所谓了。然后我们再用list直接对结果进行类型转换,转换为list。

In [135]:
for row in rows4:
  print(row)
('name', 'address')
('tom li', 'beijing')
('tom li', 'beijing')
('',)
('mary wang', 'shandong')
('mary wang', 'shandong')
('',)
('de8ug', 'guangzhou')
In [148]:
dict.fromkeys(rows4)
Out[148]:
{('name', 'address'): None,
 ('tom li', 'beijing'): None,
 ('',): None,
 ('mary wang', 'shandong'): None,
 ('de8ug', 'guangzhou'): None}
In [137]:
list(dict.fromkeys(rows4))
Out[137]:
[('name', 'address'),
 ('tom li', 'beijing'),
 ('',),
 ('mary wang', 'shandong'),
 ('de8ug', 'guangzhou')]

这时候,重复数据直接去掉了,注意我们这里的dict是python3新版本的,所以顺序没有影响,如果你还在用python2或者python3.5以下,建议升级一下python版本。

接下来,就是空数据的处理了。观察('',)是个元组,第一个位置的数据为空字符串,那么整体长度为1,可以直接通过循环来去掉。这里的循环我们可以用Python中的语法糖写法,直接一行搞定,最后加个判断只留下长度大于1,最后用list转换为列表。

In [179]:
list(x for x in dict.fromkeys(rows4) if len(x[0])>1)
Out[179]:
[('name', 'address'),
 ('tom li', 'beijing'),
 ('mary wang', 'shandong'),
 ('de8ug', 'guangzhou')]

上面的研究搞定了,直接把研究结果放到函数中解决重复行和空行的问题。

注意这时候我们处理的行数据,所以就不再按列循环了。而且,当前的sheet中处理之后,每一行的内容都会修改位置或删除。所以我们先用old_rows = [x for x in sheet.values]取到旧的每一行的数据,注意这里的sheet后直接用values取到数据,而不是cell对象。这里的old_rows是个列表,就可以用刚才的研究直接转为删除重复和空行的数据了。

接下来,用sheet.delete_rows(1, sheet.max_row)

删除所有行,第一个参数表示从第一行开始,第二个参数为最大行数。最后,用循环新的行数据的方式,把新数据写入当前的sheet。

In [189]:
def handle_duplicate(wb, sheetname):
  """
  去除重复行,空行
  先取出每一行,清空sheet,处理后写回
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  old_rows = [x for x in sheet.values]
  print('修改前:', old_rows)
  new_rows = list(x for x in dict.fromkeys(old_rows) if len(x[0])>1)
  print('修改后-》》', new_rows)

  # 删除所有行
  sheet.delete_rows(1, sheet.max_row)
  # 写入新数据
  for row in new_rows:
    sheet.append(row)

运行测试,查看结果。再说一次,一定记得测试啊!如果有错误就根据错误提示,查看代码,反复调试,去除bugs。

In [190]:
wb = load_data()
handle_duplicate(wb, '重复行')
save_as(wb)

2.删除空格

删除空格也需要用到字符串的函数,所以这里还是简单研究一下。如果我们想去除字符串中间的空格,可以用split默认进行分割,然后把分割的结果用''.join方法连接起来就可以了。注意join前是空的字符串。这里也用不到strip去除两端的空格了,因为split分割后只有几个最后的字符串组成的列表。

In [192]:
a="a b c  "
In [194]:
a.strip()
Out[194]:
'a b c'
In [195]:
a.split()
Out[195]:
['a', 'b', 'c']
In [196]:
''.join(a.split())
Out[196]:
'abc'
In [ ]:

研究成功后,写入函数。这次命名为handle_blank。

In [197]:
def handle_blank(wb, sheetname):
  """
  按列循环, 通过参数确认目标
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  for col in sheet.iter_cols(): # 不加参数,循环所有列
    for cell in col:
      print('修改前:', cell.value, end='')
      cell.value = ''.join(cell.value.split())
      print('修改后-》》',cell.value)
In [198]:
handle_blank(wb, '空格')

3.修改日期和时间格式

有时候,我们需要对表格中时间相关的单元格进行格式修改,这里需要用到Python中时间模块datetime,将需要的格式进行拼接后,用strftime进行转换。

假设这里我们想把之前简单的1/11月日格式,更改为年月日的样式,中间加上分隔符/或-,就需要用"%x"或"%Y-%m-%d"来进行操作了。注意这里的%加字母都是官方定义好的格式而已,我们用到时候进行拼接,传给函数就可以了。

具体更多的拼接格式如下:

In [199]:
import datetime
In [209]:
d=datetime.datetime(2019,1,11)
In [203]:
d.strftime("%x")
Out[203]:
'01/11/19'
In [205]:
d.strftime("%Y-%m-%d")
Out[205]:
'2019-01-11'

研究完成后,我们编写函数。

首先需要用m, d = cell.value.split('/')把之前简单的日期进行分割,得到m,代表月份和日期,然后用datetime进行转换,生成时间相关的对象day,注意里面的参数是数字,所以用int转换,最后把day进行格式化输出。编写函数后,一定记得测试。

In [218]:
def handle_time(wb, sheetname):
  """
  按列循环, 通过参数确认目标
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  for col in sheet.iter_cols(max_col=1, min_row=2): # 找到时间的列, 第一列,从第二行开始
    for cell in col:
      print('修改前:', cell.value, end='')
      m, d = cell.value.split('/')
      day = datetime.datetime(2019, int(m), int(d))
      cell.value = day.strftime("%Y-%m-%d")
      print('修改后-》》',cell.value)

In [220]:
wb = load_data()
handle_time(wb, '时间')
save_as(wb)

4.修复数字和符号

接下来,处理数字和符号相关的操作。加入我们之前的价格,很多是有小数点的,这时候还想保存两位小数,并加上人民币符号为前缀。就需要新的一波研究了。

有小数点,一是要保证位数,我们这里要求2位,二是要对多余的位数四舍五入。可以有以下俩个方式完成,一个用Decimal一个用round,两个的区别是Decimal("0.00")指定位数后,会自动补0,而round遇到0就自动舍掉了。而且round在四舍五入的计算中,还有点特殊。具体可查看官方文档。

我们这里用Decimal来完成函数内相关操作。记得测试啊!

In [227]:
from decimal import Decimal
In [240]:
a = 3.1
b=Decimal(a).quantize(Decimal("0.00"))
print(b)
3.10
In [244]:
round(a,2) # 位数自动省略0
Out[244]:
3.1

In [247]:
def handle_num(wb, sheetname):
  """
  按列循环, 通过参数确认目标
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  for col in sheet.iter_cols(min_col=3, max_col=3, min_row=2): # 找到时间的列, 第一列,从第二行开始
    for cell in col:
      print('修改前:', cell.value, end='')
#       cell.value = round(float(cell.value), 3)
      cell.value = '¥' + str(Decimal(cell.value).quantize(Decimal("0.00")))
      print('修改后-》》',cell.value)
In [249]:
wb = load_data()
handle_num(wb, '数字符号')
save_as(wb)

到此这篇关于Python 自由定制表格的实现示例的文章就介绍到这了,更多相关Python 自由定制表格内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
详解Django中的form库的使用
Jul 18 Python
详解python的数字类型变量与其方法
Nov 20 Python
Python实现excel转sqlite的方法
Jul 17 Python
Python图像处理之识别图像中的文字(实例讲解)
May 10 Python
对Python中list的倒序索引和切片实例讲解
Nov 15 Python
pygame游戏之旅 载入小车图片、更新窗口
Nov 20 Python
numpy库与pandas库axis=0,axis= 1轴的用法详解
May 27 Python
PyQt5创建一个新窗口的实例
Jun 20 Python
Python3视频转字符动画的实例代码
Aug 29 Python
python实现静态服务器
Sep 05 Python
如何清空python的变量
Jul 05 Python
手残删除python之后的补救方法
Jun 26 Python
python实现opencv+scoket网络实时图传
Mar 20 #Python
python实现同一局域网下传输图片
Mar 20 #Python
python实现udp传输图片功能
Mar 20 #Python
python实现UDP协议下的文件传输
Mar 20 #Python
python实现TCP文件传输
Mar 20 #Python
python实现FTP循环上传文件
Mar 20 #Python
python实现ftp文件传输功能
Mar 20 #Python
You might like
PHP实现Soap通讯的方法
2014/11/03 PHP
php针对cookie操作的队列操作类实例
2014/12/10 PHP
php+mysqli实现将数据库中一张表信息打印到表格里的方法
2015/01/28 PHP
四种php中webservice实现的简单架构方法及实例
2015/02/03 PHP
CI框架网页缓存简单用法分析
2018/12/26 PHP
jQuery代码优化 选择符篇
2011/11/01 Javascript
jQuery中获取checkbox选中项等操作及注意事项
2013/11/24 Javascript
基于JavaScript代码实现兼容各浏览器的设为首页和加入收藏
2016/01/07 Javascript
jQuery.deferred对象使用详解
2016/03/18 Javascript
js前端解决跨域问题的8种方案(最新最全)
2016/11/18 Javascript
脚本div实现拖放功能(两种)
2017/02/13 Javascript
JS实现含有中文字符串的友好截取功能分析
2017/03/13 Javascript
正则表达式基本语法及表单验证操作详解【基于JS】
2017/04/07 Javascript
AngularJS实现的简单拖拽功能示例
2018/01/02 Javascript
解决vue路由name同名,路由重复的问题
2020/08/05 Javascript
[48:35]2018DOTA2亚洲邀请赛 4.1 小组赛 A组加赛 TNC vs Optic
2018/04/03 DOTA
Python中的__new__与__init__魔术方法理解笔记
2014/11/08 Python
Python yield 使用方法浅析
2017/05/20 Python
Python中工作日类库Busines Holiday的介绍与使用
2017/07/06 Python
Python2包含中文报错的解决方法
2018/07/09 Python
python中的插值 scipy-interp的实现代码
2018/07/23 Python
详解如何用django实现redirect的几种方法总结
2018/11/22 Python
详解Python连接MySQL数据库的多种方式
2019/04/16 Python
Django框架反向解析操作详解
2019/11/28 Python
Django如何实现防止XSS攻击
2020/10/13 Python
python基于win32api实现键盘输入
2020/12/09 Python
详解CSS3原生支持div铺满浏览器的方法
2018/08/30 HTML / CSS
servlet面试题
2012/08/20 面试题
数控技术专业推荐信
2013/11/01 职场文书
年终工作总结范文2014
2014/11/27 职场文书
幼儿园三八妇女节活动总结
2015/02/06 职场文书
学生逃课万能检讨书2000字
2015/02/17 职场文书
小学生读书笔记
2015/07/01 职场文书
六年级作文之家庭作文
2019/12/12 职场文书
OpenCV-Python模板匹配人眼的实例
2021/06/08 Python
windows系统安装配置nginx环境
2022/06/28 Servers