对Python 2.7 pandas 中的read_excel详解


Posted in Python onMay 04, 2018

导入pandas模块:

import pandas as pd

使用import读入pandas模块,并且为了方便使用其缩写pd指代。

读入待处理的excel文件:

df = pd.read_excel('log.xls')

通过使用read_excel函数读入excel文件,后面需要替换成excel文件所在的路径。读入之后变为pandas的DataFrame对象。DataFrame是一个面向列(column-oriented)的二维表结构,且含有列表和行标,对excel文件的操作就转换为对DataFrame操作。另外,如果一个excel含有多个表,如果你只想读入其中一个可以:

df = pd.read_excel('log.xls', sheetname=1)

增加了一个参数sheetname,表示的是第几个表,从0开始计数。我上面设置的是1,也就是第二个表。

读入之后,可以先查看表头信息和每一列的数据类型:

df.dtypes

输出如下:

Member   object
Unnamed: 1 float64
Unnamed: 2 float64
Unnamed: 3 float64
Unnamed: 4 float64
Unnamed: 5 float64
家内外活动类型  object
Unnamed: 7  object
activity  object
dtype: object

提取每个member连续出现的最后一行数据:

new_df = df.drop_duplicates(subset='Member', keep='last')

以上语句的意思是根据Member字段去除掉多余的行,并且保留相同行的最后一行数据。这些就得到了每一个member最后一行的数据了,返回了经过筛选后的DataFrame。

接下来需要将处理后的结果,保存为excel文件:

out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

output.xls是你要保存的文件名,可以任取;然后将DataFrame的内容保存到该文件,最后保存该文件到系统的磁盘上。

接下来,你就可以在当前目录看到一个新的文件,可以直接使用excel打开查看。

Pandas还提供了很多的API,可以根据具体的任务,查找API文档,找到合适的函数来完成任务。

附:一个完整的示例

#coding=utf-8
import pandas as pd
 
# 读入excel文件中的第2个表
df = pd.read_excel('log.xls', sheetname=1)
# 查看表的数据类型
print df.dtypes
# 查看Member列的数据
print df['Member']
 
'''
# 新建一列,每一行的值是Member列和activity列相同行值的和
for i in df.index:
 df['activity_2'][i] = df['Member'][i] + df['activity'][i]
'''
 
# 根据Member字段去除掉多余的行,并且保留相同行的最后一行数据
new_df = df.drop_duplicates(subset='Member', keep='last')
# 导出结果
out = pd.ExcelWriter('output.xls')
new_df.to_excel(out)
out.save()

以上这篇对Python 2.7 pandas 中的read_excel详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Django的session中对于用户验证的支持
Jul 23 Python
Python Flask-web表单使用详解
Nov 18 Python
Pycharm远程调试openstack的方法
Nov 21 Python
python如何实现异步调用函数执行
Jul 08 Python
python:按行读入,排序然后输出的方法
Jul 20 Python
pyqt5 QScrollArea设置在自定义侧(任何位置)
Sep 25 Python
python计算无向图节点度的实例代码
Nov 22 Python
用python3读取python2的pickle数据方式
Dec 25 Python
Pandas —— resample()重采样和asfreq()频度转换方式
Feb 26 Python
Python CategoricalDtype自定义排序实现原理解析
Sep 11 Python
Python爬虫爬取全球疫情数据并存储到mysql数据库的步骤
Mar 29 Python
Python中的 No Module named ***问题及解决
Jul 23 Python
Python3读取Excel数据存入MySQL的方法
May 04 #Python
详解Django之admin组件的使用和源码剖析
May 04 #Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 #Python
使用python3+xlrd解析Excel的实例
May 04 #Python
对python中的xlsxwriter库简单分析
May 04 #Python
使用实现XlsxWriter创建Excel文件并编辑
May 04 #Python
Python实现获取前100组勾股数的方法示例
May 04 #Python
You might like
解析file_get_contents模仿浏览器头(user_agent)获取数据
2013/06/27 PHP
PHP实现下载断点续传的方法
2014/11/12 PHP
php实现计数器方法小结
2015/01/05 PHP
PHP7+Nginx的配置与安装教程详解
2016/05/10 PHP
php中mkdir()函数的权限问题分析
2016/09/24 PHP
php设计模式之策略模式应用案例详解
2019/06/17 PHP
xml文档转换工具,附图表例子(hta)
2010/11/17 Javascript
xml转json的js代码
2012/08/28 Javascript
原生js事件的添加和删除的封装
2014/07/01 Javascript
jQuery实现的漂亮表单效果代码
2015/08/18 Javascript
bootstrap表格分页实例讲解
2016/12/30 Javascript
jQuery编写textarea输入字数限制代码
2017/03/23 jQuery
使用nodejs爬取前程无忧前端技能排行
2017/05/06 NodeJs
详解Vue2.x-directive的学习笔记
2017/07/17 Javascript
探究react-native 源码的图片缓存问题
2017/08/24 Javascript
解析Vue.js中的组件
2018/02/02 Javascript
vue中如何让子组件修改父组件数据
2018/06/14 Javascript
mpvue+vant app搭建微信小程序的方法步骤
2019/02/11 Javascript
使用js实现一个简单的滚动条过程解析
2019/09/10 Javascript
JavaScript中clientWidth,offsetWidth,scrollWidth的区别
2021/01/25 Javascript
[03:24]DOTA2超级联赛专访hao 大翻盘就是逆袭
2013/05/24 DOTA
python按时间排序目录下的文件实现方法
2018/10/17 Python
pycharm配置pyqt5-tools开发环境的方法步骤
2019/02/11 Python
Python with关键字,上下文管理器,@contextmanager文件操作示例
2019/10/17 Python
Python Print实现在输出中插入变量的例子
2019/12/25 Python
python实现FTP循环上传文件
2020/03/20 Python
Python count函数使用方法实例解析
2020/03/23 Python
iPython pylab模式启动方式
2020/04/24 Python
英国马匹装备和马术用品购物网站:Equine Superstore
2019/03/03 全球购物
屈臣氏俄罗斯在线商店:Watsons俄罗斯
2020/08/03 全球购物
行政文员岗位职责
2013/11/08 职场文书
污水厂厂长岗位职责
2014/01/04 职场文书
祝寿主持词
2015/07/02 职场文书
HR必备:销售经理聘用合同范本
2019/08/21 职场文书
简单聊一聊SQL注入及防止SQL注入
2022/03/23 MySQL
MySQL 字符集 character
2022/05/04 MySQL