对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python通过poll实现异步IO的方法
Jun 04 Python
利用Python脚本实现ping百度和google的方法
Jan 24 Python
Python基于回溯法子集树模板解决找零问题示例
Sep 11 Python
Python Unittest自动化单元测试框架详解
Apr 04 Python
pyQt4实现俄罗斯方块游戏
Jun 26 Python
python利用插值法对折线进行平滑曲线处理
Dec 25 Python
python多任务及返回值的处理方法
Jan 22 Python
Python对接六大主流数据库(只需三步)
Jul 31 Python
pandas中DataFrame修改index、columns名的方法示例
Aug 02 Python
python实现差分隐私Laplace机制详解
Nov 25 Python
Python使用Socket实现简单聊天程序
Feb 28 Python
virtualenv介绍及简明教程
Jun 23 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
php实现ping
2006/10/09 PHP
PHP 面向对象详解
2012/09/13 PHP
深入phpMyAdmin的安装与配置的详细步骤
2013/05/07 PHP
PHP 开发者该知道的 5 个 Composer 小技巧
2016/02/03 PHP
图文详解phpstorm配置Xdebug进行调试PHP教程
2016/06/13 PHP
Yii框架函数简单用法分析
2019/09/09 PHP
jQuery中文入门指南,翻译加实例,jQuery的起点教程
2007/01/13 Javascript
一个可以显示阴历的JS代码
2007/03/05 Javascript
javascript使用isNaN()函数判断变量是否为数字
2013/09/21 Javascript
JS实现鼠标箭头变成一个燃烧烛光效果的方法
2015/02/28 Javascript
Node.js中防止错误导致的进程阻塞的方法
2016/08/11 Javascript
jquery删除数组中重复元素
2016/12/05 Javascript
Angular4的输入属性与输出属性实例详解
2017/11/29 Javascript
浅谈Vue.use的使用
2018/08/29 Javascript
vue单页应用的内存泄露定位和修复问题小结
2019/08/02 Javascript
Node.js之删除文件夹(含递归删除)代码实例
2019/09/09 Javascript
基于vue+echarts 数据可视化大屏展示的方法示例
2020/03/09 Javascript
JavaScript中clientWidth,offsetWidth,scrollWidth的区别
2021/01/25 Javascript
Vue项目打包部署到apache服务器的方法步骤
2021/02/01 Vue.js
[05:02][DOTA2]DOTA进化论 第一期
2013/09/27 DOTA
Python PyQt5标准对话框用法示例
2017/08/23 Python
Anaconda入门使用总结
2018/04/05 Python
python 实现登录网页的操作方法
2018/05/11 Python
Python 没有main函数的原因
2020/07/10 Python
Python基于execjs运行js过程解析
2020/11/27 Python
经济学人订阅:The Economist
2018/07/19 全球购物
潘多拉珠宝美国官方网站:Pandora US
2020/06/18 全球购物
如果NULL和0作为空指针常数是等价的,那我到底该用哪一个
2014/09/16 面试题
护士毕业生自我鉴定
2014/02/08 职场文书
篮球社团活动总结
2014/06/27 职场文书
第一批党的群众路线教育实践活动总结报告
2014/07/03 职场文书
优秀教师先进事迹材料
2014/12/15 职场文书
2015年社区党建工作汇报材料
2015/06/25 职场文书
幼儿园开学家长寄语(2016春季)
2015/12/03 职场文书
Mysql实现主从配置和多主多从配置
2021/06/02 MySQL
MySQL Server 层四个日志
2022/03/31 MySQL