对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中迭代器(iterator)用法实例分析
Apr 29 Python
python将字典内容存入mysql实例代码
Jan 18 Python
python3实现随机数
Jun 25 Python
python学习--使用QQ邮箱发送邮件代码实例
Apr 16 Python
Python如何爬取微信公众号文章和评论(基于 Fiddler 抓包分析)
Jun 28 Python
Python3 pandas 操作列表实例详解
Sep 23 Python
结合OpenCV与TensorFlow进行人脸识别的实现
Oct 10 Python
TensorFlow命名空间和TensorBoard图节点实例
Jan 23 Python
Python如何使用input函数获取输入
Aug 06 Python
Python之京东商品秒杀的实现示例
Jan 06 Python
用Python写一个简易版弹球游戏
Apr 13 Python
看看如何用Python绘制小米新版天价logo
Apr 20 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
phpMyadmin 用户权限中英对照
2010/04/02 PHP
深入解析PHP内存管理之谁动了我的内存
2013/06/20 PHP
php 不使用js实现页面跳转
2014/02/11 PHP
javascript getElementsByTagName
2011/01/31 Javascript
javascript结合html5 canvas实现(可调画笔颜色/粗细/橡皮)的涂鸦板
2013/04/27 Javascript
js实现全屏漂浮广告移入光标停止移动
2013/12/02 Javascript
跟我学Nodejs(二)--- Node.js事件模块
2014/05/21 NodeJs
seaJs的模块定义和模块加载浅析
2014/06/06 Javascript
jQuery实现批量判断表单中文本框非空的方法(2种方法)
2015/12/09 Javascript
AngularJS入门教程之XHR和依赖注入详解
2016/08/18 Javascript
canvas雪花效果核心代码分享
2017/02/19 Javascript
Vue2.0表单校验组件vee-validate的使用详解
2017/05/02 Javascript
原生JS实现的多个彩色小球跟随鼠标移动动画效果示例
2018/02/01 Javascript
elementui的默认样式修改方法
2018/02/23 Javascript
JavaScript实现封闭区域布尔运算的示例代码
2018/06/25 Javascript
详解Vue底部导航栏组件
2019/05/02 Javascript
微信小程序云开发(数据库)详解
2019/05/17 Javascript
vue-router的钩子函数用法实例分析
2019/10/26 Javascript
[01:08]2014DOTA2展望TI 剑指西雅图LGD战队专访
2014/06/30 DOTA
初学Python实用技巧两则
2014/08/29 Python
python实现在每个独立进程中运行一个函数的方法
2015/04/23 Python
解决python写入mysql中datetime类型遇到的问题
2018/06/21 Python
浅谈django orm 优化
2018/08/18 Python
利用python-pypcap抓取带VLAN标签的数据包方法
2019/07/23 Python
Python下利用BeautifulSoup解析HTML的实现
2020/01/17 Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
2020/02/17 Python
python+selenium+PhantomJS抓取网页动态加载内容
2020/02/25 Python
细数nn.BCELoss与nn.CrossEntropyLoss的区别
2020/02/29 Python
Python 3.8 新功能来一波(大部分人都不知道)
2020/03/11 Python
Electrolux伊莱克斯巴西商店:家用电器、小家电和配件
2018/05/23 全球购物
食品安全工作实施方案
2014/03/26 职场文书
浪漫婚礼主题活动策划方案
2014/09/15 职场文书
2015年导购员工作总结
2015/04/25 职场文书
2016年班主任新年寄语
2015/08/18 职场文书
html+css实现赛博朋克风格按钮
2021/05/26 HTML / CSS
JS的深浅复制详细
2021/10/16 Javascript