python使用pandas处理excel文件转为csv文件的方法示例


Posted in Python onJuly 18, 2019

由于客户提供的是excel文件,在使用时期望使用csv文件格式,且对某些字段内容需要做一些处理,如从某个字段中固定的几位抽取出来,独立作为一个字段等,下面记录下使用acaconda处理的过程;

import pandas
 
df = pandas.read_excel("/***/***.xlsx")
 
df.columns = [内部为你给你的excel每一列自定义的名称](比如我给我的excel自定义列表为:
["url","productName","***",。。。,"***"])

(下面开始你自己的表演,对每一列内容进行你自己需要的处理)

df["url"] = df["url"].str.replace("http", "https")
 
df["***"] = df["***"].str.replace("\n", " ")
 
df["stract_content"] = df["url"].str[-6:]

表演结束之后,就要保存了

df.drop_duplicates().fillna("").to_csv("/***/***.csv", index=False, encoding="utf-8", sep="\3")

上面为读取路径,下面为保存路径

结束之后,可以通过

df.head(5)来查看结果前5个,判断处理结果是否符合你的预期即可; 

下面总结一下将List内容存储到excel和csv:

直接上代码:

list存储到csv文件:下面代码使用codes包操作

with codecs.open("result.csv", "w", encoding="utf-8") as fw:
  for i in final_res:
    fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")

下面是使用pandas操作:

columns是字符串列表,作为表格的标题头

df = pandas.DataFrame(my_list)
df.columns = ["col1", "col2", ...]
df.to_excel("result.xlsx", index=False, encoding="utf-8")

也可以先存储为csv文件,然后使用pandas转化为excel:

with codecs.open("result.csv", "w", encoding="utf-8") as fw:
  for i in final_res:
    fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
 
with pandas.ExcelWriter('result.xlsx') as ew:
  pandas.read_csv("result.csv", sep='\3').to_excel(ew, index=False, header=["文件名", "query调用时间", "调用ip", "调用类型", "query结束时间", "行序号", "top5 sku", "文件总耗时"], sheet_name="result", encoding="utf-8")

或者:

with codecs.open("result.csv", "w", encoding="utf-8") as fw:
  for i in final_res:
    fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
 
df = pandas.read_csv("result.csv", sep="\3")
df.columns = ["col1", "col2", ...]
df.to_excel("result.xlsx", index=False, encoding="utf-8")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之做一个小游戏
Sep 28 Python
pandas 按照特定顺序输出的实现代码
Jul 10 Python
Python批量删除只保留最近几天table的代码实例
Apr 01 Python
树莓派用python中的OpenCV输出USB摄像头画面
Jun 22 Python
Django 数据库同步操作技巧详解
Jul 19 Python
pytorch实现线性拟合方式
Jan 15 Python
Python 炫技操作之合并字典的七种方法
Apr 10 Python
Python常用库Numpy进行矩阵运算详解
Jul 21 Python
python如何设置静态变量
Sep 07 Python
Python如何执行系统命令
Sep 23 Python
详解Open Folder as PyCharm Project怎么添加的方法
Dec 29 Python
opencv-python图像配准(匹配和叠加)的实现
Jun 23 Python
django 2.2和mysql使用的常见问题
Jul 18 #Python
详解Python二维数组与三维数组切片的方法
Jul 18 #Python
Django框架视图介绍与使用详解
Jul 18 #Python
python3 中的字符串(单引号、双引号、三引号)以及字符串与数字的运算
Jul 18 #Python
使用django实现一个代码发布系统
Jul 18 #Python
python 将字符串中的数字相加求和的实现
Jul 18 #Python
TensorFlow实现简单的CNN的方法
Jul 18 #Python
You might like
php强制下载类型的实现代码
2011/04/21 PHP
使用PHP接收POST数据,解析json数据
2013/06/28 PHP
YUI的Tab切换实现代码
2010/04/11 Javascript
javascript XMLHttpRequest对象全面剖析
2010/04/24 Javascript
js 距离某一时间点时间是多少实现代码
2013/10/14 Javascript
JavaScript setTimeout使用闭包功能实现定时打印数值
2015/12/18 Javascript
浅析AngularJS Filter用法
2015/12/28 Javascript
最简单的tab切换实例代码
2016/05/13 Javascript
React实现点击删除列表中对应项
2017/01/10 Javascript
JavaScript字符串检索字符的方法
2017/06/23 Javascript
JS获取子、父、兄节点方法小结
2017/08/14 Javascript
js+canvas实现滑动拼图验证码功能
2018/03/26 Javascript
Nodejs异步回调之异常处理实例分析
2018/06/22 NodeJs
小程序input数据双向绑定实现方法
2019/10/17 Javascript
Angular6项目打包优化的实现方法
2019/12/15 Javascript
Javascript数组及类数组相关原理详解
2020/10/29 Javascript
python中readline判断文件读取结束的方法
2014/11/08 Python
python中requests模块的使用方法
2015/04/08 Python
python获取当前时间对应unix时间戳的方法
2015/05/15 Python
Python打包可执行文件的方法详解
2016/09/19 Python
详解python中的json和字典dict
2018/06/22 Python
TensorFlow 合并/连接数组的方法
2018/07/27 Python
在django模板中实现超链接配置
2019/08/21 Python
为什么相对PHP黑python的更少
2020/06/21 Python
OpenCV Python实现图像指定区域裁剪
2021/03/12 Python
利用Python pandas对Excel进行合并的方法示例
2020/11/04 Python
Python 生成短8位唯一id实战教程
2021/01/13 Python
英国知名衬衫品牌美国网站:Charles Tyrwhitt美国
2016/08/28 全球购物
护理专业本科生自荐信
2013/10/01 职场文书
住房公积金接收函
2014/01/09 职场文书
实习公司领导推荐函
2014/05/21 职场文书
妇女工作先进事迹
2014/08/17 职场文书
“四风”问题的主要表现和危害思想汇报
2014/09/19 职场文书
学校拾金不昧表扬信
2015/01/16 职场文书
python如何做代码性能分析
2021/04/26 Python
Python中Numpy和Matplotlib的基本使用指南
2021/11/02 Python