对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之字典,你还记得吗?
Sep 20 Python
Python标准异常和异常处理详解
Feb 02 Python
Python实现二分法算法实例
Feb 02 Python
python数组复制拷贝的实现方法
Jun 09 Python
Python设计模式中单例模式的实现及在Tornado中的应用
Mar 02 Python
Python3.5编程实现修改IIS WEB.CONFIG的方法示例
Aug 18 Python
利用Python进行数据可视化常见的9种方法!超实用!
Jul 11 Python
Windows系统下PhantomJS的安装和基本用法
Oct 21 Python
django中使用POST方法获取POST数据
Aug 20 Python
python:动态路由的Flask程序代码
Nov 22 Python
如何基于Python创建目录文件夹
Dec 31 Python
python playwright之元素定位示例详解
Jul 23 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
动漫女神老婆无限好,但日本女生可能就不是这么一回事了!
2020/03/04 日漫
php字符串替换函数substr_replace()用法实例
2015/03/17 PHP
PHP封装的数据库保存session功能类
2016/07/11 PHP
PHP排序算法之简单选择排序(Simple Selection Sort)实例分析
2018/04/20 PHP
PHP格式化显示时间date()函数代码
2018/10/03 PHP
PHP中引用类型和值类型功能与用法示例
2019/02/26 PHP
jQuery 定时局部刷新(setInterval)
2010/11/19 Javascript
通过JS来判断页面控件是否获取焦点
2014/01/03 Javascript
js控制href内容的连接内容的变化示例
2014/04/30 Javascript
js表单元素checked、radio被选中的几种方法(详解)
2016/08/22 Javascript
基于Vue如何封装分页组件
2016/12/16 Javascript
Bootstrap的基本应用要点浅析
2016/12/19 Javascript
jQuery实现菜单栏导航效果
2017/08/15 jQuery
JS获取字符对应的ASCII码实例
2017/09/10 Javascript
vue中上传视频或图片或图片和文字一起到后端的解决方法
2019/12/01 Javascript
js+canvas实现刮刮奖功能
2020/09/13 Javascript
[01:14]英雄,所敬略同——2018完美盛典宣传视频4K
2018/12/05 DOTA
Python3基础之list列表实例解析
2014/08/13 Python
python 打印对象的所有属性值的方法
2016/09/11 Python
Python内置函数delattr的具体用法
2017/11/23 Python
Django中url的反向查询的方法
2018/03/14 Python
对python数据切割归并算法的实例讲解
2018/12/12 Python
python+opencv实现车牌定位功能(实例代码)
2019/12/24 Python
django和flask哪个值得研究学习
2020/07/31 Python
python 实现性别识别
2020/11/21 Python
伦敦的高级牛仔布专家:Trilogy
2018/08/06 全球购物
Bibloo罗马尼亚网站:女装、男装、童装及鞋子和配饰
2019/07/20 全球购物
高三自我鉴定范文
2013/10/19 职场文书
关于抽烟的检讨书
2014/02/25 职场文书
《三峡》教学反思
2014/03/01 职场文书
人力资源部经理的岗位职责
2014/03/04 职场文书
寻找最美家庭活动方案
2014/08/20 职场文书
安徽导游词
2015/02/12 职场文书
分布式Redis Cluster集群搭建与Redis基本用法
2022/02/24 Redis
mybatis-plus模糊查询指定字段
2022/04/28 Java/Android
javascript进阶篇深拷贝实现的四种方式
2022/07/07 Javascript