对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python利用装饰器进行运算的实例分析
Aug 04 Python
通过Python 接口使用OpenCV的方法
Apr 02 Python
python学生信息管理系统(初级版)
Oct 17 Python
Python3中lambda表达式与函数式编程讲解
Jan 14 Python
numpy基础教程之np.linalg
Feb 12 Python
python环境路径配置以及命令行运行脚本
Apr 02 Python
Django基础知识 web框架的本质详解
Jul 18 Python
详解Python3 pickle模块用法
Sep 16 Python
新手常见Python错误及异常解决处理方案
Jun 18 Python
Python字典实现伪切片功能
Oct 28 Python
PyTorch 如何自动计算梯度
May 23 Python
Python 实现定积分与二重定积分的操作
May 26 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
PHP程序员最常犯的11个MySQL错误小结
2010/11/20 PHP
php 验证码(倾斜,正弦干扰线,黏贴,旋转)
2013/06/29 PHP
php中实现获取随机数组列表的自定义函数
2015/04/02 PHP
Swoole-1.7.22 版本已发布,修复PHP7相关问题
2015/12/31 PHP
利用404错误页面实现UrlRewrite的实现代码
2008/08/20 Javascript
[原创]js获取数组任意个不重复的随机数组元素
2010/03/15 Javascript
Js 获取Gridview选中行的内容操作步骤
2013/02/05 Javascript
可恶的ie8提示缺少id未定义
2014/03/20 Javascript
jquery删除ID为sNews的tr元素的内容
2014/04/10 Javascript
js获取ajax返回值代码
2014/04/30 Javascript
Nodejs学习笔记之Stream模块
2015/01/13 NodeJs
JS日期格式化之javascript Date format
2015/10/01 Javascript
前端框架Vue.js中Directive知识详解
2016/09/12 Javascript
JS编写函数实现对身份证号码最后一位的验证功能
2016/12/29 Javascript
Vue 框架之键盘事件、健值修饰符、双向数据绑定
2018/11/14 Javascript
微信小程序用户授权、位置授权及获取微信绑定手机号
2019/07/18 Javascript
javascript头像上传代码实例
2019/09/28 Javascript
vue中父子组件传值,解决钩子函数mounted只运行一次的操作
2020/07/27 Javascript
[03:21]【TI9纪实】Old Boys
2019/08/23 DOTA
python映射列表实例分析
2015/01/26 Python
python opencv之SIFT算法示例
2018/02/24 Python
Python 离线工作环境搭建的方法步骤
2019/07/29 Python
Django项目之Elasticsearch搜索引擎的实例
2019/08/21 Python
Django单元测试中Fixtures的使用方法
2020/02/26 Python
Jupyter notebook设置背景主题,字体大小及自动补全代码的操作
2020/04/13 Python
Python利用matplotlib绘制折线图的新手教程
2020/11/05 Python
应届毕业生应聘自荐信
2013/12/07 职场文书
服装设计行业个人的自我评价
2013/12/20 职场文书
合伙协议书
2014/04/23 职场文书
小学生读书活动总结
2014/06/30 职场文书
金榜题名主持词
2015/07/02 职场文书
因个人工作失误检讨书
2019/06/21 职场文书
Golang中异常处理机制详解
2021/06/08 Golang
MySQL实例精讲单行函数以及字符数学日期流程控制
2021/10/15 MySQL
JavaScript组合继承详解
2021/11/07 Javascript
mysql5.7的安装及Navicate长久免费使用的实现过程
2021/11/17 MySQL