Python 自由定制表格的实现示例


Posted in Python onMarch 20, 2020

很多开发者说自从有了 Python/Pandas,Excel 都不怎么用了,用它来处理与可视化表格非常快速。

下面我来举几个例子。

1. 删除重复行和空行

我们直接用dict.fromkeys的方法把当前的数据转为字典,默认的值为None因为用不到,也就无所谓了。然后我们再用list直接对结果进行类型转换,转换为list。

In [135]:
for row in rows4:
  print(row)
('name', 'address')
('tom li', 'beijing')
('tom li', 'beijing')
('',)
('mary wang', 'shandong')
('mary wang', 'shandong')
('',)
('de8ug', 'guangzhou')
In [148]:
dict.fromkeys(rows4)
Out[148]:
{('name', 'address'): None,
 ('tom li', 'beijing'): None,
 ('',): None,
 ('mary wang', 'shandong'): None,
 ('de8ug', 'guangzhou'): None}
In [137]:
list(dict.fromkeys(rows4))
Out[137]:
[('name', 'address'),
 ('tom li', 'beijing'),
 ('',),
 ('mary wang', 'shandong'),
 ('de8ug', 'guangzhou')]

这时候,重复数据直接去掉了,注意我们这里的dict是python3新版本的,所以顺序没有影响,如果你还在用python2或者python3.5以下,建议升级一下python版本。

接下来,就是空数据的处理了。观察('',)是个元组,第一个位置的数据为空字符串,那么整体长度为1,可以直接通过循环来去掉。这里的循环我们可以用Python中的语法糖写法,直接一行搞定,最后加个判断只留下长度大于1,最后用list转换为列表。

In [179]:
list(x for x in dict.fromkeys(rows4) if len(x[0])>1)
Out[179]:
[('name', 'address'),
 ('tom li', 'beijing'),
 ('mary wang', 'shandong'),
 ('de8ug', 'guangzhou')]

上面的研究搞定了,直接把研究结果放到函数中解决重复行和空行的问题。

注意这时候我们处理的行数据,所以就不再按列循环了。而且,当前的sheet中处理之后,每一行的内容都会修改位置或删除。所以我们先用old_rows = [x for x in sheet.values]取到旧的每一行的数据,注意这里的sheet后直接用values取到数据,而不是cell对象。这里的old_rows是个列表,就可以用刚才的研究直接转为删除重复和空行的数据了。

接下来,用sheet.delete_rows(1, sheet.max_row)

删除所有行,第一个参数表示从第一行开始,第二个参数为最大行数。最后,用循环新的行数据的方式,把新数据写入当前的sheet。

In [189]:
def handle_duplicate(wb, sheetname):
  """
  去除重复行,空行
  先取出每一行,清空sheet,处理后写回
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  old_rows = [x for x in sheet.values]
  print('修改前:', old_rows)
  new_rows = list(x for x in dict.fromkeys(old_rows) if len(x[0])>1)
  print('修改后-》》', new_rows)

  # 删除所有行
  sheet.delete_rows(1, sheet.max_row)
  # 写入新数据
  for row in new_rows:
    sheet.append(row)

运行测试,查看结果。再说一次,一定记得测试啊!如果有错误就根据错误提示,查看代码,反复调试,去除bugs。

In [190]:
wb = load_data()
handle_duplicate(wb, '重复行')
save_as(wb)

2.删除空格

删除空格也需要用到字符串的函数,所以这里还是简单研究一下。如果我们想去除字符串中间的空格,可以用split默认进行分割,然后把分割的结果用''.join方法连接起来就可以了。注意join前是空的字符串。这里也用不到strip去除两端的空格了,因为split分割后只有几个最后的字符串组成的列表。

In [192]:
a="a b c  "
In [194]:
a.strip()
Out[194]:
'a b c'
In [195]:
a.split()
Out[195]:
['a', 'b', 'c']
In [196]:
''.join(a.split())
Out[196]:
'abc'
In [ ]:

研究成功后,写入函数。这次命名为handle_blank。

In [197]:
def handle_blank(wb, sheetname):
  """
  按列循环, 通过参数确认目标
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  for col in sheet.iter_cols(): # 不加参数,循环所有列
    for cell in col:
      print('修改前:', cell.value, end='')
      cell.value = ''.join(cell.value.split())
      print('修改后-》》',cell.value)
In [198]:
handle_blank(wb, '空格')

3.修改日期和时间格式

有时候,我们需要对表格中时间相关的单元格进行格式修改,这里需要用到Python中时间模块datetime,将需要的格式进行拼接后,用strftime进行转换。

假设这里我们想把之前简单的1/11月日格式,更改为年月日的样式,中间加上分隔符/或-,就需要用"%x"或"%Y-%m-%d"来进行操作了。注意这里的%加字母都是官方定义好的格式而已,我们用到时候进行拼接,传给函数就可以了。

具体更多的拼接格式如下:

In [199]:
import datetime
In [209]:
d=datetime.datetime(2019,1,11)
In [203]:
d.strftime("%x")
Out[203]:
'01/11/19'
In [205]:
d.strftime("%Y-%m-%d")
Out[205]:
'2019-01-11'

研究完成后,我们编写函数。

首先需要用m, d = cell.value.split('/')把之前简单的日期进行分割,得到m,代表月份和日期,然后用datetime进行转换,生成时间相关的对象day,注意里面的参数是数字,所以用int转换,最后把day进行格式化输出。编写函数后,一定记得测试。

In [218]:
def handle_time(wb, sheetname):
  """
  按列循环, 通过参数确认目标
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  for col in sheet.iter_cols(max_col=1, min_row=2): # 找到时间的列, 第一列,从第二行开始
    for cell in col:
      print('修改前:', cell.value, end='')
      m, d = cell.value.split('/')
      day = datetime.datetime(2019, int(m), int(d))
      cell.value = day.strftime("%Y-%m-%d")
      print('修改后-》》',cell.value)

In [220]:
wb = load_data()
handle_time(wb, '时间')
save_as(wb)

4.修复数字和符号

接下来,处理数字和符号相关的操作。加入我们之前的价格,很多是有小数点的,这时候还想保存两位小数,并加上人民币符号为前缀。就需要新的一波研究了。

有小数点,一是要保证位数,我们这里要求2位,二是要对多余的位数四舍五入。可以有以下俩个方式完成,一个用Decimal一个用round,两个的区别是Decimal("0.00")指定位数后,会自动补0,而round遇到0就自动舍掉了。而且round在四舍五入的计算中,还有点特殊。具体可查看官方文档。

我们这里用Decimal来完成函数内相关操作。记得测试啊!

In [227]:
from decimal import Decimal
In [240]:
a = 3.1
b=Decimal(a).quantize(Decimal("0.00"))
print(b)
3.10
In [244]:
round(a,2) # 位数自动省略0
Out[244]:
3.1

In [247]:
def handle_num(wb, sheetname):
  """
  按列循环, 通过参数确认目标
  """
  print(f'开始处理工作表:{sheetname}'.center(18, '-'))
  sheet = wb[sheetname]
  for col in sheet.iter_cols(min_col=3, max_col=3, min_row=2): # 找到时间的列, 第一列,从第二行开始
    for cell in col:
      print('修改前:', cell.value, end='')
#       cell.value = round(float(cell.value), 3)
      cell.value = '¥' + str(Decimal(cell.value).quantize(Decimal("0.00")))
      print('修改后-》》',cell.value)
In [249]:
wb = load_data()
handle_num(wb, '数字符号')
save_as(wb)

到此这篇关于Python 自由定制表格的实现示例的文章就介绍到这了,更多相关Python 自由定制表格内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中input和raw_input的一点区别
Oct 21 Python
Python压缩解压缩zip文件及破解zip文件密码的方法
Nov 04 Python
深入学习Python中的上下文管理器与else块
Aug 27 Python
python使用循环打印所有三位数水仙花数的实例
Nov 13 Python
python常用函数与用法示例
Jul 02 Python
python调用支付宝支付接口流程
Aug 15 Python
python生成大写32位uuid代码
Mar 03 Python
Python使用requests xpath 并开启多线程爬取西刺代理ip实例
Mar 06 Python
Python实现的北京积分落户数据分析示例
Mar 27 Python
在django中实现choices字段获取对应字段值
Jul 12 Python
python按顺序重命名文件并分类转移到各个文件夹中的实现代码
Jul 21 Python
Django DRF APIView源码运行流程详解
Aug 17 Python
python实现opencv+scoket网络实时图传
Mar 20 #Python
python实现同一局域网下传输图片
Mar 20 #Python
python实现udp传输图片功能
Mar 20 #Python
python实现UDP协议下的文件传输
Mar 20 #Python
python实现TCP文件传输
Mar 20 #Python
python实现FTP循环上传文件
Mar 20 #Python
python实现ftp文件传输功能
Mar 20 #Python
You might like
第八节 访问方式 [8]
2006/10/09 PHP
将RTF格式的文件转成HTML并在网页中显示的代码
2006/10/09 PHP
腾讯微博提示missing parameter errorcode 102 错误的解决方法
2014/12/22 PHP
Laravel框架控制器的request与response用法示例
2019/09/30 PHP
js版本A*寻路算法
2006/12/22 Javascript
jQuery 如何先创建、再修改、后添加DOM元素
2014/05/20 Javascript
javascript中通过arguments参数伪装方法重载
2014/10/08 Javascript
javascript实现Table排序的方法
2015/05/15 Javascript
简介JavaScript中的push()方法的使用
2015/06/09 Javascript
JavaScript使用DeviceOne开发实战(四)仿优酷视频应用
2015/12/02 Javascript
关于获取DIV内部内容报错的原因分析及解决办法
2016/01/29 Javascript
Node.js实现数据推送
2016/04/14 Javascript
ES6概念 Symbol.keyFor()方法
2016/12/25 Javascript
BootStrap 导航条实例代码
2017/05/18 Javascript
使用InstantClick.js让页面提前加载200ms
2017/09/12 Javascript
JS开发 富文本编辑器TinyMCE详解
2019/07/19 Javascript
JavaScript设计模式之观察者模式与发布订阅模式详解
2020/05/07 Javascript
解决vue打包报错Unexpected token: punc的问题
2020/10/24 Javascript
React实现todolist功能
2020/12/28 Javascript
[01:15:00]LGD vs Mineski Supermajor 胜者组 BO3 第一场 6.5
2018/06/06 DOTA
深入分析python中整型不会溢出问题
2018/06/18 Python
python集合常见运算案例解析
2019/10/17 Python
Python笔记之facade模式
2019/11/20 Python
python生成word合同的实例方法
2021/01/12 Python
Python中Qslider控件实操详解
2021/02/20 Python
瑞典时尚服装购物网站:Miinto.se
2017/10/30 全球购物
尤妮佳moony海外旗舰店:日本殿堂级纸尿裤品牌
2018/02/23 全球购物
业务员岗位职责范本
2013/12/15 职场文书
社区中秋节活动方案
2014/01/29 职场文书
重大事项社会稳定风险评估方案
2014/06/15 职场文书
授权委托书
2015/01/28 职场文书
工会工作个人总结
2015/03/03 职场文书
2015年企业员工工作总结范文
2015/05/21 职场文书
高中历史教学反思
2016/02/19 职场文书
如何写好竞聘报告
2019/04/03 职场文书
javascript进阶篇深拷贝实现的四种方式
2022/07/07 Javascript