Python使用pandas导入xlsx格式的excel文件内容操作代码


Posted in Python onDecember 24, 2022

Python使用pandas导入xlsx格式的excel文件内容

1. 基本导入

在 Python中使用pandas导入.xlsx文件的方法是read_excel()。

# coding=utf-8
import pandas as pd

df = pd.read_excel(r'G:\test.xlsx')
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

电脑中的文件路径默认使用\,这个时候需要在路径前面加一个r(转义符)避免路径里面的\被转义。也可以不加 r,但是需要把路径里面的所有\转换成/,这个规则在导入其他格式文件时也是一样的,我们一般选择在路径前面加r

2. 列标题与数据对齐

因为我们的表格中有中文,中文占用的字符和英文、数字占用的字符不一样,因此需要调用pd.set_option()使表格对齐显示。如果你是使用 Jupyter 来运行代码的,Jupyter 会自动渲染出一个表格,则无需这个设置。

import pandas as pd
#处理数据的列标题与数据无法对齐的情况
pd.set_option('display.unicode.ambiguous_as_wide', True)
#无法对齐主要是因为列标题是中文
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx')
print(df)

效果如下:

Python使用pandas导入xlsx格式的excel文件内容操作代码

3. 指定导入某个sheet

通过sheet_name参数可以指定要导入哪个sheet的内容。注意这里的名字是区分大小写的。

import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name='Sheet1')
print(df)

除了可以指定具体的sheet名字,还可以传入sheet的index下标,从0开始计数。例如:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0)
print(df)

如果不指定sheet_name参数,那么默认导入的都是第一个sheet的内容。

4. 指定行索引

在本地文件导入DataFrame时,行索引使用的从0开始的默认索引,可以通过设置index_col参数来设置。

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, index_col=0)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

5. 指定列索引

将本地文件导入DataFrame时,默认使用源数据表的第一行作为列索引,也可以通过设置header参数来设置列索引。 header参数值默认为0,即用第一行作为列索引;也可以是其他行,只需要传入具体的那一行即可;也可以使用默认从0开始的数作为列索引。

使用默认从0开始的数作为列索引示意:

# coding=utf-8
import pandas as pd
pd.set_option('display.unicode.ambiguous_as_wide', True)
pd.set_option('display.unicode.east_asian_width', True)
df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, header=None)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

6. 指定导入列

有的时候本地文件的列数太多,而我们又不需要那么多列时,我们就可以通过设定usecols参数来指定要导入的列。

Python使用pandas导入xlsx格式的excel文件内容操作代码

从参数的形式来看,可以通过以下几种形式来指定:

  • 通过列表指定,列表中是列的下标,从0开始计数。
  • 通过列表指定,列表中是列的名字
  • 通过元组指定, 元组中是列的名字

示例如下:

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=[0,1])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=['姓名','性别'])
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, usecols=('姓名','年龄'))
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

7. 指定导入的行数

如果文件很大,我们不想导入全部的行,只需要导入前面若干行进行分析即可,那么可以通过nrows参数来指定导入多少行数据

df = pd.read_excel(r'G:\test.xlsx', sheet_name=0, nrows=2)
print(df)

Python使用pandas导入xlsx格式的excel文件内容操作代码

8. 更多的参数

请参考pandas官方文档。

到此这篇关于Python使用pandas导入xlsx格式的excel文件内容的文章就介绍到这了,更多相关Python 导入xlsx格式的excel文件内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
利用Python绘制MySQL数据图实现数据可视化
Mar 30 Python
Python使用metaclass实现Singleton模式的方法
May 05 Python
Python中关键字nonlocal和global的声明与解析
Mar 12 Python
django中账号密码验证登陆功能的实现方法
Jul 15 Python
Python实现i人事自动打卡的示例代码
Jan 09 Python
Python递归及尾递归优化操作实例分析
Feb 01 Python
python GUI库图形界面开发之PyQt5 UI主线程与耗时线程分离详细方法实例
Feb 26 Python
Python基于Twilio及腾讯云实现国际国内短信接口
Jun 18 Python
Python识别验证码的实现示例
Sep 30 Python
Python接口自动化测试框架运行原理及流程
Nov 30 Python
Python: glob匹配文件的操作
Dec 11 Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 Python
Python 第三方库 openpyxl 的安装过程
Dec 24 #Python
python index() 与 rindex() 方法的使用示例详解
Dec 24 #Python
python+pyhyper实现识别图片中的车牌号思路详解
Dec 24 #Python
python pandas 解析(读取、写入)CSV 文件的操作方法
Dec 24 #Python
Python TypeError: ‘float‘ object is not subscriptable错误解决
Dec 24 #Python
python 使用pandas读取csv文件的方法
Dec 24 #Python
Python使用pandas导入csv文件内容的示例代码
Dec 24 #Python
You might like
laravel 4安装及入门图文教程
2014/10/29 PHP
关于php几种字符串连接的效率比较(详解)
2017/02/22 PHP
js 实现无缝滚动 兼容IE和FF
2009/07/15 Javascript
jQuery setTimeout传递字符串参数报错的解决方法
2014/06/09 Javascript
angularjs 处理多个异步请求方法汇总
2015/01/06 Javascript
浅析JSONP技术原理及实现
2016/06/08 Javascript
JS实现AES加密并与PHP互通的方法分析
2017/04/19 Javascript
ES6 javascript中class类的get与set用法实例分析
2017/10/30 Javascript
浅谈jquery fullpage 插件增加头部和版权的方法
2018/03/20 jQuery
快速解决bootstrap下拉菜单无法隐藏的问题
2018/08/10 Javascript
详解如何webpack使用DllPlugin
2018/09/30 Javascript
微信小程序实现自动定位功能
2018/10/31 Javascript
Node.js安装详细步骤教程(Windows版)详解
2019/09/01 Javascript
JS实现水平移动与垂直移动动画
2019/12/19 Javascript
Vue2.4+新增属性.sync、$attrs、$listeners的具体使用
2020/03/08 Javascript
js实现弹窗效果
2020/08/09 Javascript
vue实现路由懒加载的3种方法示例
2020/09/01 Javascript
可拖拽组件slider.js使用方法详解
2020/12/04 Javascript
[00:05]ChinaJoy现场 DOTA2玩家高呼“CN DOTA BEST DOTA”
2019/08/04 DOTA
以windows service方式运行Python程序的方法
2015/06/03 Python
Python的Django框架中从url中捕捉文本的方法
2015/07/20 Python
python使用tensorflow深度学习识别验证码
2018/04/03 Python
对命令行模式与python交互模式介绍
2018/05/12 Python
python pandas 如何替换某列的一个值
2018/06/09 Python
python集合是否可变总结
2019/06/20 Python
Django的models模型的具体使用
2019/07/15 Python
对Python生成器、装饰器、递归的使用详解
2019/07/19 Python
pytorch多进程加速及代码优化方法
2019/08/19 Python
Python面向对象封装操作案例详解 II
2020/01/02 Python
HTML5+WebSocket实现多文件同时上传的实例
2016/12/29 HTML / CSS
网络艺术零售业的先驱者:artrepublic
2017/09/26 全球购物
幼儿园的门卫岗位职责
2014/04/10 职场文书
物资采购方案
2014/06/12 职场文书
公司委托书怎么写
2014/08/02 职场文书
高职教师先进事迹材料
2014/08/24 职场文书
信用卡工作证明模板
2014/09/14 职场文书