编程 Python

Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

Posted in Python onNovember 10, 2020

我就废话不多说了，大家还是直接看代码吧~

#!/usr/bin/python
# -*- coding: utf-8 -*-

import xlwt
import re

def host_regex(dataline):
 host_regex = r"<host>(.*?)</host>"
 host = re.findall(host_regex, dataline)
 if host:
  return host[0]

def ip_regex(dataline):
 ip_regex = r"<ip>(.*?)</ip>"
 ip = re.findall(ip_regex, dataline)
 if ip:
  return ip[0]

with open("zbx_export_hosts.xml", "r", encoding="utf8") as f:
 lines = f.readlines()
 alldatas = []
 hostlist = []
 iplist = []
 for line in lines:
  host = host_regex(line)
  ip = ip_regex(line)

  if host is not None:
   hostlist.append(host)
  if ip is not None:
   iplist.append(ip)
 hosts_ip = []
 # 构造数据结构,形如：[[a,b],[c,d],...]
 multi_list = map(list, zip(hostlist, iplist))
 for multi in multi_list:
  hosts_ip.append(multi)
 workbook = xlwt.Workbook()
 worksheet = workbook.add_sheet('test')
 # 关键代码
 for hi in enumerate(hosts_ip):
  for num in range(len(hi[1])):
   # 行、列、值
   worksheet.write(hi[0], num, hi[1][num])

 workbook.save('excelwrite.xls')

PS：其实有两行代码冗余，就不删了！

补充知识：通过python写入xlsx大量数据问题简述

以前批处理生成数据文件都是通过c程序直接按照逗号分隔方式写文本文件以csv保存的。但是由于有些处理的数据表直接给业务人员看，业务人员习惯使用xls，因此提了些需求改造，对于一些小于100w的数据均要求改为xlsx文件格式的报表。

考虑报表文件数据处理便捷，因此决定用python实现，最初使用了openpyxl库，这个python库拥有非常强大的xlsx的读写api，能够很方便的实现读写。但是在实际使用中发现在处理较大行数的xlsx时，占用内存非常严重，8个字段50w行数据在运行中内存高达10G，这不是我们应用服务器能够接受的范围。

因此寻求改善，在网上了解后，发现创建xlsx表时，指定write_only参数是openpyxl提供的大数据写入解决方案，以下摘自官网范例，在选择了此参数后，无法通过ws.cell(row=i, column=j).value = ？的方式复制，只能通过append的方式追加行。关于设置只写cell设置样式，可以直接查看官网

>>> from openpyxl import Workbook
>>> wb = Workbook(write_only=True)
>>> ws = wb.create_sheet()
>>>
>>> # now we'll fill it with 100 rows x 200 columns
>>>
>>> for irow in range(100):
...  ws.append(['%d' % i for i in range(200)]) #可以先将一行的数据写在一个list中，直接ws.append(list)
>>> # save the file
>>> wb.save('new_big_file.xlsx') # doctest: +SKIP

不过仅仅按上述范例修改write_only跑数时发现内存占用并没有缓解，再仔细阅读官网说明时才发现这么一句话“When you want to dump large amounts of data make sure you have lxml installed.”原来在openpyxl安装时，并没有把lxml作为强依赖，只是一个可选包，然后查实发现确实服务器上并没有安装lxml包。

于是与为了解决这个问题先在测试环境上安装lxml，安装过程也不是很顺利。

首先先要装libxml2以及libxslt，因为没有root权限，均为源码安装，且只能安装在用户目录。需要注意的是libxml2在安装时需要--with-python='python安装目录'，libxslt安装的时候需要指定libxml2安装目录。

尤其最后的lxml安装也是坑挺多的，主要是指定libxml2和libxslt，安装lxml时先python3 setup.py build_ext -i -I${libxml2includepath} -L${libxml2libpath} -I${libxsltincludepath} -L${libxsltlibpath} ，再python3 setup.py install。

全部安装完之后，确实openpyxl写xlsx不再增加内存，先在tmp目录一个临时文件中写，待调用save方法时，保存到正式文件。

此外在这个问题解决中，还了解到writexlsx库也可以处理大文件xlsx的写入，并且安装没有这么多的依赖，其实还是非常推荐，也很简介，官网有介绍。

操作大文件时指定{'constant_memory': True}即可。

filename = 'test.xlsx'
wb = xlsxwriter.Workbook(filename, {'constant_memory': True})
ws = wb.add_worksheet('大文件')
i = 0
data= []
data.append('中文')
data.append(1323)
data.append('abc')
ws.write_row(i, 0, data)
i = i + 1
wb.close() #直接关闭即可，不需要额外save

以上这篇Python 使用xlwt模块将多行多列数据循环写入excel文档的操作就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Python 使用xlwt模块将多行多列数据循环写入excel文档的操作

- Author -

Quincy379

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python之Scrapy爬虫框架安装及简单使用详解

Dec 22 Python

Python3.6连接Oracle数据库的方法详解

May 18 Python

pycharm 将django中多个app放到同个文件夹apps的处理方法

May 30 Python

python进行两个表格对比的方法

Jun 27 Python

Python通过调用有道翻译api实现翻译功能示例

Jul 19 Python

Python弹出输入框并获取输入值的实例

Jun 18 Python

python循环嵌套的多种使用方法解析

Nov 29 Python

PIL包中Image模块的convert()函数的具体使用

Feb 26 Python

详解python中groupby函数通俗易懂

May 14 Python

解决python执行较大excel文件openpyxl慢问题

May 15 Python

Python venv虚拟环境配置过程解析

Jul 08 Python

解决python对齐错误的方法

Jul 16 Python

详解vscode实现远程linux服务器上Python开发

Nov 10 #Python

Python调用飞书发送消息的示例

Nov 10 #Python

python中pyplot基础图标函数整理

Nov 10 #Python

python图片合成的示例

Nov 09 #Python

python 实现"神经衰弱"翻牌游戏

Nov 09 #Python

Python字典dict常用方法函数实例

Nov 09 #Python

Python实现哲学家就餐问题实例代码

Nov 09 #Python

You might like

PHP异步调用socket实现代码

2012/01/12 PHP

PHP框架Laravel的小技巧两则

2015/02/10 PHP

thinkphp的dump函数无输出实例代码

2016/11/15 PHP

PHP命名空间namespace及use的简单用法分析

2018/08/03 PHP

用js模拟JQuery的show与hide动画函数代码

2010/09/20 Javascript

jQuery插件zoom实现图片全屏放大弹出层特效

2015/04/15 Javascript

JavaScript字符集编码与解码详谈

2017/02/02 Javascript

原生js实现轮播图的示例代码

2017/02/20 Javascript

AngularJS中filter的使用实例详解

2017/08/25 Javascript

node.js学习之断言assert的使用示例

2017/09/28 Javascript

微信小程序使用slider设置数据值及switch开关组件功能【附源码下载】

2017/12/09 Javascript

mpvue中使用flyjs全局拦截的实现代码

2018/09/13 Javascript

Puppet的一些技巧

2018/09/17 Javascript

在vue中更换字体,本地存储字体非引用在线字体库的方法

2018/09/28 Javascript

node使用request请求的方法

2019/12/20 Javascript

Javascript实现鼠标点击冒泡特效

2019/12/24 Javascript

微信小程序实现吸顶特效

2020/01/08 Javascript

vue+springboot+element+vue-resource实现文件上传教程

2020/10/21 Javascript

Vue实现图书管理小案例

2020/12/03 Vue.js

[01:01:36]Optic vs paiN 2018国际邀请赛小组赛BO2 第一场 8.19

2018/08/21 DOTA

Python之eval()函数危险性浅析

2014/07/03 Python

Python实现的人工神经网络算法示例【基于反向传播算法】

2017/11/11 Python

centos 安装python3.6环境并配置虚拟环境的详细教程

2018/02/22 Python

Python实用技巧之利用元组代替字典并为元组元素命名

2018/07/11 Python

python3转换code128条形码的方法

2019/04/17 Python

Python MySQLdb 执行sql语句时的参数传递方式

2020/03/04 Python

Anaconda和ipython环境适配的实现

2020/04/22 Python

什么是python的列表推导式

2020/05/26 Python

CSS3实现的渐变幻灯片效果

2020/12/07 HTML / CSS

html5指南-3.如何实现html元素拖拽功能

2013/01/07 HTML / CSS

VC++笔试题

2014/10/13 面试题

酒店管理毕业生自荐信

2013/10/24 职场文书

个人贷款担保书

2014/04/01 职场文书

效能监察建议书

2014/05/19 职场文书

Pytest中conftest.py的用法

2021/06/27 Python

nginx配置之并发频次限制

2022/04/18 Servers