Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
从零学python系列之从文件读取和保存数据
May 23 Python
Python类的多重继承问题深入分析
Nov 09 Python
Python浅拷贝与深拷贝用法实例
May 09 Python
python中管道用法入门实例
Jun 04 Python
在Django的视图中使用数据库查询的方法
Jul 16 Python
通过Python编写一个简单登录功能过程解析
Sep 04 Python
Pytorch模型转onnx模型实例
Jan 15 Python
Python多线程获取返回值代码实例
Feb 17 Python
Python接口自动化判断元素原理解析
Feb 24 Python
Python基于yaml文件配置logging日志过程解析
Jun 23 Python
Python的控制结构之For、While、If循环问题
Jun 30 Python
python实现从ftp上下载文件的实例方法
Jul 19 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
PHP中MD5函数使用实例代码
2008/06/07 PHP
Web程序工作原理详解
2014/12/25 PHP
CI框架中通过hook的方式实现简单的权限控制
2015/01/07 PHP
[原创]php实现数组按拼音顺序排序的方法
2017/05/03 PHP
Jquery从头学起第四讲 jquery入门教程
2010/08/01 Javascript
使用Nodejs开发微信公众号后台服务实例
2014/09/03 NodeJs
浅谈Webpack 持久化缓存实践
2018/03/22 Javascript
vue实例中data使用return包裹的方法
2018/08/27 Javascript
详解小程序如何改变onLoad的执行时机
2019/11/01 Javascript
浅析vue中的provide / inject 有什么用处
2019/11/10 Javascript
element中table高度自适应的实现
2020/10/21 Javascript
Python的Django框架中TEMPLATES项的设置教程
2015/05/29 Python
Python通过poll实现异步IO的方法
2015/06/04 Python
LRUCache的实现原理及利用python实现的方法
2017/11/21 Python
Linux下python与C++使用dlib实现人脸检测
2018/06/29 Python
NumPy 数学函数及代数运算的实现代码
2018/07/18 Python
python高级特性和高阶函数及使用详解
2018/10/17 Python
如何使用pyinstaller打包32位的exe程序
2019/05/26 Python
Django基础知识 URL路由系统详解
2019/07/18 Python
自定义Django Form中choicefield下拉菜单选取数据库内容实例
2020/03/13 Python
django rest framework serializers序列化实例
2020/05/13 Python
QML用PathView实现轮播图
2020/06/03 Python
Python类型转换的魔术方法详解
2020/12/23 Python
HTML5去掉输入框type为number时的上下箭头的实现方法
2020/01/03 HTML / CSS
Kathmandu新西兰官网:新西兰户外运动品牌
2019/07/27 全球购物
销售类个人求职信范文
2013/09/25 职场文书
技术学校毕业生求职信分享
2013/12/02 职场文书
工作个人的自我评价
2014/01/14 职场文书
2013年军训通讯稿
2014/02/05 职场文书
文明餐桌行动实施方案
2014/02/19 职场文书
2014年开学第一课活动方案
2014/03/06 职场文书
小学毕业演讲稿
2014/04/25 职场文书
员工合理化建议书
2014/05/19 职场文书
范文之农村基层党建工作报告
2019/10/24 职场文书
Python中的变量与常量
2021/11/11 Python
Windows Server 2019 安装DHCP服务及相关配置
2022/04/28 Servers