对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python3利用SMTP协议发送E-mail电子邮件的方法
Sep 30 Python
Python3 处理JSON的实例详解
Oct 29 Python
DRF跨域后端解决之django-cors-headers的使用
Jan 27 Python
Python类的继承、多态及获取对象信息操作详解
Feb 28 Python
python opencv minAreaRect 生成最小外接矩形的方法
Jul 01 Python
django admin组件使用方法详解
Jul 19 Python
Pytorch基本变量类型FloatTensor与Variable用法
Jan 08 Python
Python3搭建http服务器的实现代码
Feb 11 Python
浅谈Django QuerySet对象(模型.objects)的常用方法
Mar 28 Python
Django Form设置文本框为readonly操作
Jul 03 Python
Python快速优雅的批量修改Word文档样式
May 20 Python
python数据可视化使用pyfinance分析证券收益示例详解
Nov 20 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
Windows中使用计划任务自动执行PHP程序实例
2014/05/09 PHP
PHP邮件发送类PHPMailer用法实例详解
2014/09/22 PHP
PHP使用header()输出图片缓存实例
2014/12/09 PHP
CentOS安装php v8js教程
2015/02/26 PHP
详解PHP使用Redis存储session时的一个Warning定位
2017/07/05 PHP
PHP中非常有用却鲜有人知的函数集锦
2019/08/17 PHP
几个javascript操作word的参考代码
2009/10/26 Javascript
Jquery下判断Id是否存在的代码
2011/01/06 Javascript
jquery ajax提交整个表单元素的快捷办法
2013/03/27 Javascript
js制作简易年历完整实例
2015/01/28 Javascript
深入理解JavaScript系列(31):设计模式之代理模式详解
2015/03/03 Javascript
js实现文本框选中的方法
2015/05/26 Javascript
jquery实现简单的自动播放幻灯片效果
2015/06/13 Javascript
Javascript HTML5 Canvas实现的一个画板
2020/04/12 Javascript
基于angular中的重要指令详解($eval,$parse和$compile)
2016/10/21 Javascript
无限循环轮播图之运动框架(原生JS实现)
2017/10/01 Javascript
Vue实现简单分页器
2018/12/29 Javascript
详解一个基于套接字实现长连接的express
2019/03/28 Javascript
javascript实现前端成语点击验证
2020/06/24 Javascript
[01:01]2020完美高校联赛(秋)西安落幕
2021/03/11 DOTA
python实现ip查询示例
2014/03/26 Python
Python ORM框架SQLAlchemy学习笔记之数据查询实例
2014/06/10 Python
使用Python下载歌词并嵌入歌曲文件中的实现代码
2015/11/13 Python
Python使用回溯法子集树模板解决迷宫问题示例
2017/09/01 Python
python添加模块搜索路径方法
2017/09/11 Python
100行Python代码实现自动抢火车票(附源码)
2018/01/11 Python
Tensorflow 利用tf.contrib.learn建立输入函数的方法
2018/02/08 Python
Python FTP文件定时自动下载实现过程解析
2019/11/12 Python
PyCharm2020.3.2安装超详细教程
2021/02/08 Python
师范生自我鉴定
2014/03/20 职场文书
学生社团文化节开幕式主持词
2014/03/28 职场文书
员工保密协议书
2014/09/27 职场文书
教师党员个人自我剖析材料
2014/09/29 职场文书
优秀团队申报材料
2014/12/26 职场文书
mysql 8.0.24版本安装配置方法图文教程
2021/05/12 MySQL
Python如何快速找到多个字典中的公共键(key)
2022/04/29 Python