Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
在Linux系统上通过uWSGI配置Nginx+Python环境的教程
Dec 25 Python
Python模拟百度登录实例详解
Jan 20 Python
Python3网络爬虫之使用User Agent和代理IP隐藏身份
Nov 23 Python
PyQt5每天必学之像素图控件QPixmap
Apr 19 Python
Python 利用内置set函数对字符串和列表进行去重的方法
Jun 29 Python
使用python脚本实现查询火车票工具
Jul 19 Python
Python面向对象程序设计之类的定义与继承简单示例
Mar 18 Python
django的settings中设置中文支持的实现
Apr 28 Python
python向字符串中添加元素的实例方法
Jun 28 Python
pytorch中交叉熵损失(nn.CrossEntropyLoss())的计算过程详解
Jan 02 Python
python opencv 检测移动物体并截图保存实例
Mar 10 Python
keras 多gpu并行运行案例
Jun 10 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
PHP中调用ASP.NET的WebService的代码
2011/04/22 PHP
javascript cookie解码函数(兼容ff)
2008/03/17 Javascript
jquery的extend和fn.extend的使用说明
2011/01/09 Javascript
解决js正则匹配换行问题实现代码
2012/12/10 Javascript
jquery插件实现鼠标经过图片右侧显示大图的效果(类似淘宝)
2013/02/04 Javascript
jquery如何判断某元素是否具备指定的样式
2013/11/05 Javascript
Jquery 点击按钮自动高亮实现原理及代码
2014/04/25 Javascript
深入浅出理解javaScript原型链
2015/05/09 Javascript
$.extend 的一个小问题
2015/06/18 Javascript
利用Vue.js指令实现全选功能
2016/09/08 Javascript
细数JavaScript 一个等号,两个等号,三个等号的区别
2016/10/09 Javascript
一个极为简单的requirejs实现方法
2016/10/20 Javascript
jQuery简单绑定单个事件的方法示例
2017/06/10 jQuery
JavaScript截屏功能的实现代码
2017/07/28 Javascript
nginx部署访问vue-cli搭建的项目的方法
2018/02/12 Javascript
实例解析Vue.js下载方式及基本概念
2018/05/11 Javascript
vue-router的两种模式的区别
2019/05/30 Javascript
Python中的Numeric包和Numarray包使用教程
2015/04/13 Python
快速排序的算法思想及Python版快速排序的实现示例
2016/07/02 Python
浅谈Python的垃圾回收机制
2016/12/17 Python
Python编写登陆接口的方法
2017/07/10 Python
程序员写Python时的5个坏习惯,你有几条?
2018/11/26 Python
Django User 模块之 AbstractUser 扩展详解
2020/03/11 Python
在SQL Server中创建数据库主要有那种方式
2013/09/10 面试题
文员岗位职责
2013/11/09 职场文书
毕业求职自荐信格式是什么
2013/11/19 职场文书
教师实习自我鉴定
2013/12/13 职场文书
市场策划求职信
2014/08/07 职场文书
关心下一代工作先进事迹
2014/08/15 职场文书
新疆民族团结演讲稿
2014/08/27 职场文书
2014年保洁员工作总结
2014/11/19 职场文书
2014年图书馆个人工作总结
2014/12/18 职场文书
学校后勤工作总结2015
2015/05/15 职场文书
建党伟业观后感
2015/06/01 职场文书
Python中的变量与常量
2021/11/11 Python
vue如何清除浏览器历史栈
2022/05/25 Vue.js