对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python从网络读取图片并直接进行处理的方法
May 22 Python
使用Python的Flask框架构建大型Web应用程序的结构示例
Jun 04 Python
机器学习10大经典算法详解
Dec 07 Python
Pycharm设置去除显示的波浪线方法
Oct 28 Python
python3 pygame实现接小球游戏
May 14 Python
搭建python django虚拟环境完整步骤详解
Jul 08 Python
python使用pip安装SciPy、SymPy、matplotlib教程
Nov 20 Python
Python.append()与Python.expand()用法详解
Dec 18 Python
pip/anaconda修改镜像源,加快python模块安装速度的操作
Mar 04 Python
Python超简单容易上手的画图工具库推荐
May 10 Python
pytorch中的 .view()函数的用法介绍
Mar 17 Python
Python中tqdm的使用和例子
Sep 23 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
php中使用getimagesize获取图片、flash等文件的尺寸信息实例
2014/04/29 PHP
新浪SAE云平台下使用codeigniter的数据库配置
2014/06/12 PHP
php数组合并array_merge()函数使用注意事项
2014/06/19 PHP
php合并数组中相同元素的方法
2014/11/13 PHP
Laravel框架实现定时发布任务的方法
2018/08/16 PHP
PHP实现抽奖功能实例代码
2020/06/30 PHP
一个用js实现的页内搜索代码
2007/05/23 Javascript
Firefox window.close()的使用注意事项
2009/04/11 Javascript
window.event快达到全浏览器支持了,以后使用就方便了
2011/11/30 Javascript
js 输出内容到新窗口具体实现代码
2013/05/31 Javascript
JavaScript中模拟实现jsonp
2015/06/19 Javascript
Angularjs的Controller间通信机制实例分析
2016/11/07 Javascript
Kendo Grid editing 自定义验证报错提示的解决方法
2016/11/18 Javascript
基于JavaScript实现五子棋游戏
2020/08/26 Javascript
OkHttp踩坑随笔为何 response.body().string() 只能调用一次
2018/01/08 Javascript
vue.js input框之间赋值方法
2018/08/24 Javascript
用Node写一条配置环境的指令
2019/11/14 Javascript
js实现跳一跳小游戏
2020/07/31 Javascript
jQuery实现简单全选框
2020/09/13 jQuery
django中SMTP发送邮件配置详解
2019/07/19 Python
Python3.8对可迭代解包的改进及用法详解
2019/10/15 Python
python十进制转二进制的详解
2020/02/07 Python
python代码中怎么换行
2020/06/17 Python
css3针对移动端卡顿问题的解决(动画性能优化)
2020/02/14 HTML / CSS
html5实现多图片预览上传及点击可拖拽控件
2018/03/15 HTML / CSS
可打印的优惠券、杂货和优惠券代码:Coupons.com
2018/06/12 全球购物
Sneaker Studio罗马尼亚网站:购买运动鞋
2018/11/04 全球购物
美国名牌香水折扣网站:Hottperfume
2021/02/10 全球购物
高考自主招生自荐信
2013/10/20 职场文书
项目建议书范文
2014/05/12 职场文书
人大调研汇报材料
2014/08/14 职场文书
万能检讨书2000字
2014/10/17 职场文书
2015年乡镇流动人口工作总结
2015/05/12 职场文书
员工手册编写范本
2015/05/14 职场文书
张丽莉观后感
2015/06/16 职场文书
python实现层次聚类的方法
2021/11/01 Python