Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python中requests模块的使用方法
Apr 08 Python
浅谈Python中chr、unichr、ord字符函数之间的对比
Jun 16 Python
Python中字典的浅拷贝与深拷贝用法实例分析
Jan 02 Python
python后端接收前端回传的文件方法
Jan 02 Python
python linecache 处理固定格式文本数据的方法
Jan 08 Python
Python matplotlib画图与中文设置操作实例分析
Apr 23 Python
python设计tcp数据包协议类的例子
Jul 23 Python
numpy中的meshgrid函数的使用
Jul 31 Python
python定间隔取点(np.linspace)的实现
Nov 27 Python
Python模拟FTP文件服务器的操作方法
Feb 18 Python
Python脚本导出为exe程序的方法
Mar 25 Python
Django框架获取form表单数据方式总结
Apr 22 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
深入Apache与Nginx的优缺点比较详解
2013/06/17 PHP
php读取csv文件后,uft8 bom导致在页面上显示出现问题的解决方法
2013/08/10 PHP
php使用FFmpeg接口获取视频的播放时长、码率、缩略图以及创建时间
2016/11/07 PHP
php数据库的增删改查 php与javascript之间的交互
2017/08/31 PHP
PHP生成短网址的思路以及实现方法的详解
2019/03/25 PHP
tp5修改(实现即点即改)
2019/10/18 PHP
javascript 学习之旅 (2)
2009/02/05 Javascript
javascript中动态加载js文件多种解决办法总结
2013/11/15 Javascript
JS模仿编辑器实时改变文本框宽度和高度大小的方法
2015/08/17 Javascript
JavaScript lodash常见用法系列小结
2016/08/24 Javascript
最实用的jQuery分页插件
2016/10/09 Javascript
jQuery点击页面其他部分隐藏下拉菜单功能
2018/11/27 jQuery
[02:29]DOTA2英雄基础教程 陈
2013/12/17 DOTA
[57:53]DOTA2上海特级锦标赛主赛事日 - 2 败者组第二轮#3OG VS VP
2016/03/03 DOTA
python更新列表的方法
2015/07/28 Python
Python操作Excel之xlsx文件
2017/03/24 Python
磁盘垃圾文件清理器python代码实现
2020/08/24 Python
浅谈python中requests模块导入的问题
2018/05/18 Python
python 对类的成员函数开启线程的方法
2019/01/22 Python
PyQt5 QTableView设置某一列不可编辑的方法
2019/06/25 Python
如何基于Python获取图片的物理尺寸
2019/11/25 Python
python3 配置logging日志类的操作
2020/04/08 Python
Python 实现将numpy中的nan和inf,nan替换成对应的均值
2020/06/08 Python
matplotlib 画双轴子图无法显示x轴的解决方法
2020/07/27 Python
python 实现学生信息管理系统的示例
2020/11/28 Python
CSS3圆角边框和边界图片效果实例
2016/07/01 HTML / CSS
详解CSS3 rem(设置字体大小) 教程
2017/11/21 HTML / CSS
小学毕业感言150字
2014/02/05 职场文书
北京申奥口号
2014/06/19 职场文书
"9.18"国耻日演讲稿范文
2014/09/14 职场文书
司法局群众路线教育实践活动开展情况总结
2014/10/25 职场文书
班级元旦晚会开幕词
2015/01/29 职场文书
残联2016年全国助残日活动总结
2016/04/01 职场文书
销区经理年终述职报告模板
2019/11/28 职场文书
MySQL分库分表详情
2021/09/25 MySQL
Python Matplotlib绘制等高线图与渐变色扇形图
2022/04/14 Python