编程 Python

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

Posted in Python onFebruary 17, 2019

除了使用xlrd库或者xlwt库进行对excel表格的操作读与写，而且pandas库同样支持excel的操作；且pandas操作更加简介方便。

首先是pd.read_excel的参数：函数为：

pd.read_excel(io, sheetname=0,header=0,skiprows=None,index_col=None,names=None,
    arse_cols=None,date_parser=None,na_values=None,thousands=None, 
    convert_float=True,has_index_names=None,converters=None,dtype=None,
    true_values=None,false_values=None,engine=None,squeeze=False,**kwds)

表格数据：

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

常用参数解析：

io ：excel 路径；

In [10]: import pandas as pd
#定义路径IO
In [11]: IO = 'example.xls'
#读取excel文件
In [12]: sheet = pd.read_excel(io=IO)
#此处由于sheetname默认是0，所以返回第一个表
In [13]: sheet
Out[13]:
 姓名 年龄  出生日 爱好 关系
0 小王 23 1991-10-02 足球 朋友
1 小丽 23 1992-11-02 篮球 NaN
2 小黑 25 1991-10-18 游泳 同学
3 小白 21 1989-09-09 游戏 NaN
4 小红 25 1990-08-07 看剧 NaN
5 小米 24 1991-12-12 足球 NaN
6 大锤 26 1988-09-09 看剧 个人
#上述列表返回的结果和原表格存在合并单元格的差异

sheetname：默认是sheetname为0，返回多表使用sheetname=[0,1]，若sheetname=None是返回全表。注意：int/string返回的是dataframe，而none和list返回的是dict of dataframe。

In [7]: sheet = pd.read_excel('example.xls',sheetname= [0,1])
#参数为None时，返回全部的表格，是一个表格的字典；
#当参数为list = [0，1，2，3]此类时，返回的多表格同样是字典
In [8]: sheet
Out[8]:
{0: 姓名 年龄  出生日 爱好 关系
 0 小王 23 1991-10-02 足球 朋友
 1 小丽 23 1992-11-02 篮球 NaN
 2 小黑 25 1991-10-18 游泳 同学
 3 小白 21 1989-09-09 游戏 NaN
 4 小红 25 1990-08-07 看剧 NaN
 5 小米 24 1991-12-12 足球 NaN
 6 大锤 26 1988-09-09 看剧 个人, 1: 1 3 5 学生
 0 2 3 4 老师
 1 4 1 9 教授}
#value是一个多位数组
In [15]: sheet[0].values
Out[15]:
array([['小王', 23, Timestamp('1991-10-02 00:00:00'), '足球', '朋友'],
  ['小丽', 23, Timestamp('1992-11-02 00:00:00'), '篮球', nan],
  ['小黑', 25, Timestamp('1991-10-18 00:00:00'), '游泳', '同学'],
  ['小白', 21, Timestamp('1989-09-09 00:00:00'), '游戏', nan],
  ['小红', 25, Timestamp('1990-08-07 00:00:00'), '看剧', nan],
  ['小米', 24, Timestamp('1991-12-12 00:00:00'), '足球', nan],
  ['大锤', 26, Timestamp('1988-09-09 00:00:00'), '看剧', '个人']], dtype=object)

#同样可以根据表头名称或者表的位置读取该表的数据
#通过表名
In [17]: sheet = pd.read_excel('example.xls',sheetname= 'Sheet2')
In [18]: sheet
Out[18]:
 1 3 5 学生
0 2 3 4 老师
1 4 1 9 教授

#通过表的位置
In [19]: sheet = pd.read_excel('example.xls',sheetname= 1)

In [20]: sheet
Out[20]:
 1 3 5 学生
0 2 3 4 老师
1 4 1 9 教授

header ：指定作为列名的行，默认0，即取第一行，数据为列名行以下的数据；若数据不含列名，则设定 header = None；

#数据不含作为列名的行
In [21]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None)
In [22]: sheet
Out[22]:
 0 1 2 3
0 1 3 5 学生
1 2 3 4 老师
2 4 1 9 教授
#默认第一行数据作为列名
In [23]: sheet = pd.read_excel('example.xls',sheetname= 1,header =0)
In [24]: sheet
Out[24]:
 1 3 5 学生
0 2 3 4 老师
1 4 1 9 教授

skiprows：省略指定行数的数据

In [25]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skiprows= 1)
#略去1行的数据，自上而下的开始略去数据的行
In [26]: sheet
Out[26]:
 0 1 2 3
0 2 3 4 老师
1 4 1 9 教授

skip_footer：省略从尾部数的行数据

In [27]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1)
#从尾部开始略去行的数据
In [28]: sheet
Out[28]:
 0 1 2 3
0 1 3 5 学生
1 2 3 4 老师

index_col ：指定列为索引列，也可以使用 u'string'

#指定第二列的数据作为行索引
In [30]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1)

In [31]: sheet
Out[31]:
 0 2 3
1
3 1 5 学生
3 2 4 老师

names：指定列的名字，传入一个list数据

In [32]: sheet = pd.read_excel('example.xls',sheetname= 1,header = None,skip_footer= 1,index_col=1,names=['a','b','c'])
 ...:

In [33]: sheet
Out[33]:
 a b c
1
3 1 5 学生
3 2 4 老师

总体而言，pandas库的pd.read_excel和pd.read_csv的参数比较类似，且相较之前的xlrd库的读表操作更加简单，针对一般批量的数据处理最好选择pandas库操作。但是功能有待完善或者本次研究的不够深入，比如合并单元格的问题，欢迎一起讨论交流。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

详解pandas库pd.read_excel操作读取excel文件参数整理与实例

- Author -

brucewong0516

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python服务器与android客户端socket通信实例

Nov 12 Python

Python实现把回车符\r\n转换成\n

Apr 23 Python

用Python遍历C盘dll文件的方法

May 06 Python

python求解水仙花数的方法

May 11 Python

python判断图片宽度和高度后删除图片的方法

May 22 Python

详解python单例模式与metaclass

Jan 15 Python

Python中列表与元组的乘法操作示例

Feb 10 Python

使用python爬取抖音视频列表信息

Jul 15 Python

Django实现跨域的2种方法

Jul 31 Python

python3 常见解密加密算法实例分析【base64、MD5等】

Dec 19 Python

Python3爬虫中关于Ajax分析方法的总结

Jul 10 Python

Python线程之定位与销毁的实现

Feb 17 #Python

Pandas读取并修改excel的示例代码

Feb 17 #Python

Python实现去除列表中重复元素的方法总结【7种方法】

Feb 16 #Python

Python字符串逆序输出的实例讲解

Feb 16 #Python

强悍的Python读取大文件的解决方案

Feb 16 #Python

Python基础之文件读取的讲解

Feb 16 #Python

解决Python3 被PHP程序调用执行返回乱码的问题

Feb 16 #Python

You might like

php中删除字符串中最先出现某个字符的实现代码

2013/02/03 PHP

通过PHP current函数获取未知字符键名数组第一个元素的值

2013/06/24 PHP

PHP的Yii框架中创建视图和渲染视图的方法详解

2016/03/29 PHP

javascript:void(0)的真正含义实例分析

2008/08/20 Javascript

模仿JQuery sortable效果代码有错但值得看看

2009/11/05 Javascript

测试你的JS的掌握程度的代码

2009/12/09 Javascript

cookie中的path与domain属性详解

2013/12/18 Javascript

jquery批量设置属性readonly和disabled的方法

2014/01/24 Javascript

express的中间件basicAuth详解

2014/12/04 Javascript

JavaScript闭包详解

2015/02/02 Javascript

jQuery实现文本框输入同步的方法

2015/06/20 Javascript

jquery不常用方法汇总

2015/07/26 Javascript

Bootstrap表单Form全面解析

2016/06/13 Javascript

Javascript 获取鼠标当前的位置实现方法

2016/10/27 Javascript

jQuery 出现Cannot read property ‘msie’ of undefined错误的解决方法

2016/11/23 Javascript

Vue.js路由组件vue-router使用方法详解

2016/12/02 Javascript

js中Number数字数值运算后值不对的解决方法

2017/02/28 Javascript

一个简易的js图片轮播效果

2017/07/22 Javascript

原生JS实现随机点名项目的实例代码

2019/04/30 Javascript

详解javascript中var与ES6规范中let、const区别与用法

2020/01/11 Javascript

vue iview实现动态新增和删除

2020/06/17 Javascript

日常整理python执行系统命令的常见方法(全)

2015/10/22 Python

浅谈Python中chr、unichr、ord字符函数之间的对比

2016/06/16 Python

python topN 取最大的N个数或最小的N个数方法

2018/06/04 Python

基于Python3.6+splinter实现自动抢火车票

2018/09/25 Python

使用python画社交网络图实例代码

2019/07/10 Python

基于Django实现日志记录报错信息

2019/12/17 Python

CSS3 函数技巧用css 实现js实现的事情(clac Counters Tooltip)

2017/08/15 HTML / CSS

HTML5组件Canvas实现图像灰度化(步骤+实例效果)

2013/04/22 HTML / CSS

安全生产检查通报

2014/01/29 职场文书

责任心演讲稿

2014/05/14 职场文书

师德师风学习材料

2014/12/19 职场文书

门店店长岗位职责

2015/04/14 职场文书

Go 在 MongoDB 中常用查询与修改的操作

2021/05/07 Golang

教你用python控制安卓手机

2021/05/13 Python

Python中的turtle画箭头,矩形,五角星

2022/03/16 Python