对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python FTP操作类代码分享
May 13 Python
Python中几种操作字符串的方法的介绍
Apr 09 Python
Python中decorator使用实例
Apr 14 Python
使用python打印十行杨辉三角过程详解
Jul 10 Python
Python中typing模块与类型注解的使用方法
Aug 05 Python
Python使用mongodb保存爬取豆瓣电影的数据过程解析
Aug 14 Python
浅谈pytorch、cuda、python的版本对齐问题
Jan 15 Python
Python 实现黑客帝国中的字符雨的示例代码
Feb 20 Python
python实现五子棋程序
Apr 24 Python
Django用户登录与注册系统的实现示例
Jun 03 Python
Prometheus开发中间件Exporter过程详解
Nov 30 Python
Python之qq自动发消息的示例代码
Feb 18 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
PHP中的Memcache详解
2014/04/05 PHP
PHP随机生成信用卡卡号的方法
2015/03/23 PHP
zend framework重定向方法小结
2016/05/28 PHP
PHP如何实现跨域
2016/05/30 PHP
基于jquery的$.ajax async使用
2011/10/19 Javascript
js获取下拉列表框中的value和text的值示例代码
2014/01/11 Javascript
JavaScript数据结构和算法之二叉树详解
2015/02/11 Javascript
轻松掌握JavaScript中的Math object数学对象
2016/05/26 Javascript
jQuery常用样式操作实例分析(获取、设置、追加、删除、判断等)
2016/09/08 Javascript
jQuery模拟实现天猫购物车动画效果实例代码
2017/05/25 jQuery
浅谈 Vue 项目优化的方法
2017/12/16 Javascript
js解决软键盘遮挡输入框的问题分享
2017/12/19 Javascript
vue注册组件的几种方式总结
2018/03/08 Javascript
js+css实现打字效果
2020/06/24 Javascript
JavaScript之scrollTop、scrollHeight、offsetTop、offsetHeight等属性学习笔记
2020/07/15 Javascript
Vue 电商后台管理项目阶段性总结(推荐)
2020/08/22 Javascript
python获取指定目录下所有文件名列表的方法
2015/05/20 Python
python处理二进制数据的方法
2015/06/03 Python
Android应用开发中Action bar编写的入门教程
2016/02/26 Python
Python 基础教程之包和类的用法
2017/02/23 Python
NumPy 如何生成多维数组的方法
2018/02/05 Python
python3操作微信itchat实现发送图片
2018/02/24 Python
十分钟利用Python制作属于你自己的个性logo
2018/05/07 Python
Pandas GroupBy对象 索引与迭代方法
2018/11/16 Python
Python 项目转化为so文件实例
2019/12/23 Python
jupyter修改文件名方式(TensorFlow)
2020/04/21 Python
Python 实现图片转字符画的示例(静态图片,gif皆可)
2020/11/05 Python
python 生成正态分布数据,并绘图和解析
2020/12/21 Python
用CSS3的box-reflect来制作倒影效果
2016/11/15 HTML / CSS
简单的HTML5初步入门教程
2015/09/29 HTML / CSS
最新的小工具和卓越的产品设计:Oh That Tech!
2019/08/07 全球购物
英国最大的天然和有机产品在线零售商之一:Big Green Smile
2020/05/06 全球购物
高中同学聚会邀请函
2014/01/11 职场文书
初一学生评语大全
2014/04/24 职场文书
大学生心理健康活动总结
2015/05/08 职场文书
网络安全倡议书(3篇)
2019/09/18 职场文书