python使用pandas处理excel文件转为csv文件的方法示例


Posted in Python onJuly 18, 2019

由于客户提供的是excel文件,在使用时期望使用csv文件格式,且对某些字段内容需要做一些处理,如从某个字段中固定的几位抽取出来,独立作为一个字段等,下面记录下使用acaconda处理的过程;

import pandas
 
df = pandas.read_excel("/***/***.xlsx")
 
df.columns = [内部为你给你的excel每一列自定义的名称](比如我给我的excel自定义列表为:
["url","productName","***",。。。,"***"])

(下面开始你自己的表演,对每一列内容进行你自己需要的处理)

df["url"] = df["url"].str.replace("http", "https")
 
df["***"] = df["***"].str.replace("\n", " ")
 
df["stract_content"] = df["url"].str[-6:]

表演结束之后,就要保存了

df.drop_duplicates().fillna("").to_csv("/***/***.csv", index=False, encoding="utf-8", sep="\3")

上面为读取路径,下面为保存路径

结束之后,可以通过

df.head(5)来查看结果前5个,判断处理结果是否符合你的预期即可; 

下面总结一下将List内容存储到excel和csv:

直接上代码:

list存储到csv文件:下面代码使用codes包操作

with codecs.open("result.csv", "w", encoding="utf-8") as fw:
  for i in final_res:
    fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")

下面是使用pandas操作:

columns是字符串列表,作为表格的标题头

df = pandas.DataFrame(my_list)
df.columns = ["col1", "col2", ...]
df.to_excel("result.xlsx", index=False, encoding="utf-8")

也可以先存储为csv文件,然后使用pandas转化为excel:

with codecs.open("result.csv", "w", encoding="utf-8") as fw:
  for i in final_res:
    fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
 
with pandas.ExcelWriter('result.xlsx') as ew:
  pandas.read_csv("result.csv", sep='\3').to_excel(ew, index=False, header=["文件名", "query调用时间", "调用ip", "调用类型", "query结束时间", "行序号", "top5 sku", "文件总耗时"], sheet_name="result", encoding="utf-8")

或者:

with codecs.open("result.csv", "w", encoding="utf-8") as fw:
  for i in final_res:
    fw.write(u"\3".join([j if isinstance(j, unicode) else str(j).decode("utf-8") for j in i]) + "\n")
 
df = pandas.read_csv("result.csv", sep="\3")
df.columns = ["col1", "col2", ...]
df.to_excel("result.xlsx", index=False, encoding="utf-8")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python显示进度条的方法
Sep 20 Python
python中sets模块的用法实例
Sep 30 Python
举例讲解如何在Python编程中进行迭代和遍历
Jan 19 Python
Python自动生产表情包
Mar 17 Python
Django Admin 实现外键过滤的方法
Sep 29 Python
Python实现按逗号分隔列表的方法
Oct 23 Python
Python3.5实现的三级菜单功能示例
Mar 25 Python
基于Python生成个性二维码过程详解
Mar 05 Python
Pycharm中安装Pygal并使用Pygal模拟掷骰子(推荐)
Apr 08 Python
jupyter 导入csv文件方式
Apr 21 Python
keras 指定程序在某块卡上训练实例
Jun 22 Python
全网最全python库selenium自动化使用详细教程
Jan 12 Python
django 2.2和mysql使用的常见问题
Jul 18 #Python
详解Python二维数组与三维数组切片的方法
Jul 18 #Python
Django框架视图介绍与使用详解
Jul 18 #Python
python3 中的字符串(单引号、双引号、三引号)以及字符串与数字的运算
Jul 18 #Python
使用django实现一个代码发布系统
Jul 18 #Python
python 将字符串中的数字相加求和的实现
Jul 18 #Python
TensorFlow实现简单的CNN的方法
Jul 18 #Python
You might like
简化php模板页面中分页代码的解析
2009/02/06 PHP
php图片的二进制转换实现方法
2014/12/15 PHP
WordPress中用于获取文章作者与分类信息的方法整理
2015/12/17 PHP
Thinkphp 框架扩展之数据库驱动常用方法小结
2020/04/23 PHP
JavaScript实现的石头剪刀布游戏源码分享
2014/08/22 Javascript
使用script的src实现跨域和类似ajax效果
2014/11/10 Javascript
Javascript中的getUTCHours()方法使用详解
2015/06/10 Javascript
JS制作类似选项卡切换的年历
2016/12/03 Javascript
vue + element-ui实现简洁的导入导出功能
2017/12/22 Javascript
vue2.0实现移动端的输入框实时检索更新列表功能
2018/05/08 Javascript
Python机器学习库scikit-learn安装与基本使用教程
2018/06/25 Python
对python自动生成接口测试的示例讲解
2018/11/30 Python
Python爬虫 bilibili视频弹幕提取过程详解
2019/07/31 Python
python实现爬虫抓取小说功能示例【抓取金庸小说】
2019/08/09 Python
python同步windows和linux文件
2019/08/29 Python
详解Django将秒转换为xx天xx时xx分
2019/09/27 Python
Python 实现数组相减示例
2019/12/27 Python
适合Python初学者的一些编程技巧
2020/02/12 Python
在python中实现求输出1-3+5-7+9-......101的和
2020/04/02 Python
使用sklearn对多分类的每个类别进行指标评价操作
2020/06/11 Python
tensorflow之读取jpg图像长和宽实例
2020/06/18 Python
Python使用sys.exc_info()方法获取异常信息
2020/07/23 Python
HTML5通过调用canvas对象的getContext()方法来获取绘图环境
2014/06/23 HTML / CSS
英国受欢迎的运动鞋和街头服装商店:Footasylum
2018/06/12 全球购物
绩效考核实施方案
2014/03/18 职场文书
关于爱国的标语
2014/06/24 职场文书
公司员工活动策划方案
2014/08/20 职场文书
暑期政治学习心得体会
2014/09/02 职场文书
单位实习鉴定评语
2015/01/04 职场文书
三潭印月的导游词
2015/02/12 职场文书
电气工程师岗位职责
2015/02/12 职场文书
2015年读书月活动总结
2015/03/26 职场文书
2016年法制宣传月活动总结
2016/04/01 职场文书
2019最新版火锅店的创业计划书 !
2019/07/12 职场文书
500字作文之难忘的同学
2019/12/20 职场文书
docker 制作mysql镜像并自动安装
2022/05/20 Servers