教你漂亮打印Pandas DataFrames和Series


Posted in Python onMay 29, 2021

一、前言

当我们必须处理可能有多个列和行的大型DataFrames时,能够以可读格式显示数据是很重要的。这在调试代码时非常有用。

默认情况下,当打印出DataFrame且具有相当多的列时,仅列的子集显示到标准输出。 显示的列甚至可以多行打印出来。

二、问题

假设我们有以下DataFrame:

import pandas as pd 
import numpy as np


df = pd.DataFrame(
  np.random.randint(0, 100, size=(100, 25)), 
  columns=[f'column{i}' for i in range(0, 25)]
)

print(df)

现在,如果列数超过显示选项display.max_rows的值,则输出DataFrame可能不完整,如下所示。 仅显示一部分列(缺少第4列和第5列),而其余列以多行方式打印。

教你漂亮打印Pandas DataFrames和Series

尽管输出仍可读取,但绝对不建议保留列或将其打印在多行中。

三、如何漂亮打印Pandas的DataFrames

如果您的显示器足够宽并且能够容纳更多列,则可能需要调整一些显示选项。 我将在下面使用的值可能不适用于您的设置,因此请确保对其进行相应的调整。 就个人而言,我使用超宽显示器,可以在必要时打印出相当多的列。

如何在同一行打印所有列

现在,为了显示所有的列(如果你的显示器能够适合他们),并在短短一行所有你需要做的是设置显示选项expand_frame_repr为False:

pd.set_option('expand_frame_repr', False)

教你漂亮打印Pandas DataFrames和Series

display.expand_frame_repr 默认值:True

是否跨多行打印宽数据的完整DataFrame ,可以考虑使用max_columns,但是如果宽度超过display.width,则输出将在多个“页面”中回绕。

另外,您可以更改display.max_rows的值,而不是将expand_frame_repr设置为False:

pd.set_option(‘display.max_rows', False)

如果列仍打印在多页中,那么您可能还必须调整display.width。

四、如何打印所有行

现在,如果您的DataFrame包含的行数超过一定数目,那么将仅显示一些记录(来自df的头部和尾部):

import pandas as pd 
import numpy as np


df = pd.DataFrame(
  np.random.randint(0, 5, size=(100, 4)), 
  columns=[f'column{i}' for i in range(0, 4)]
)

print(df)

# column0  column1  column2  column3
# 0         4        0        0        0
# 1         2        2        4        2
# 2         2        4        0        2
# 3         0        0        0        4
# 4         3        4        3        3
# ..      ...      ...      ...      ...
# 95        3        1        1        2
# 96        1        4        0        0
# 97        0        3        2        1
# 98        3        3        4        2
# 99        0        3        0        3
# [100 rows x 4 columns]

如果要显示更大范围(甚至全部)的行,则需要将display.max_rows设置为要输出的行数。 如果要显示所有行,请将其设置为“None”:

pd.set_option('display.max_rows', None)

五、使用上下文管理器

更好的方法是使用option_context(),它是一个上下文管理器,可用于在with语句上下文中临时设置特定选项。

import pandas as pd 
import numpy as np

df = pd.DataFrame(
  np.random.randint(0, 100, size=(100, 25)), 
  columns=[f'column{i}' for i in range(0, 25)]
)

with pd.option_context('expand_frame_repr', False, 'display.max_rows', None): 
  print(df)

六、其他有用的显示选项

您可以调整更多显示选项,并更改Pandas DataFrames的显示方式。

display.max_colwidth:这是显示列名的最大字符数。 如果某个列名溢出,则将添加一个占位符(…)。

pd.set_option('display.max_colwidth', None)

display.precision:这是将用于浮点数的精度。 它指定小数点后的位数。

display.width:这是显示字符的总数。 如果要显示更多列,则可能有时还必须调整display.width。

您可以使用describe_option()找到完整的显示列表:

pd.describe_option(‘display') .

给Jupyter用户的注意事项

如果您正在使用Jupyter Notebooks,而不是print(df),只需使用display(df)即可相应地调整宽度。

七、总结

在今天的文章中,我们讨论了Pandas的一些显示选项,使您可以根据要显示的内容以及可能使用的显示器,漂亮地打印DataFrame。

熊猫带有一个设置系统,使用户可以调整和自定义显示功能。 我们仅涵盖了可用显示选项的一小部分。

到此这篇关于教你漂亮打印Pandas DataFrames和Series的文章就介绍到这了,更多相关打印Pandas DataFrames和Series内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python list使用示例 list中找连续的数字
Jan 27 Python
Python中super的用法实例
May 28 Python
python矩阵转换为一维数组的实例
Jun 05 Python
Python实现提取XML内容并保存到Excel中的方法
Sep 01 Python
Django Rest framework之权限的实现示例
Dec 17 Python
Python编程深度学习计算库之numpy
Dec 28 Python
详解python 模拟豆瓣登录(豆瓣6.0)
Apr 18 Python
python默认参数调用方法解析
Feb 09 Python
Django Haystack 全文检索与关键词高亮的实现
Feb 17 Python
Python不支持 i ++ 语法的原因解析
Jul 22 Python
利用python进行数据加载
Jun 20 Python
python ConfigParser库的使用及遇到的坑
Feb 12 Python
pytorch 实现多个Dataloader同时训练
python 如何做一个识别率百分百的OCR
基于PyTorch实现一个简单的CNN图像分类器
May 29 #Python
python 爬取华为应用市场评论
python 开心网和豆瓣日记爬取的小爬虫
May 29 #Python
Python趣味挑战之实现简易版音乐播放器
新手必备Python开发环境搭建教程
You might like
深入解析PHP的引用计数机制
2013/06/14 PHP
Yii分页用法实例详解
2014/12/04 PHP
3种php生成唯一id的方法
2015/11/23 PHP
关于PHP文件的自动运行方法分析
2016/05/13 PHP
php的常量和变量实例详解
2017/06/27 PHP
Laravel 批量更新多条数据的示例
2017/11/27 PHP
Javascript中Eval函数的使用说明
2008/10/11 Javascript
javascript 运算数的求值顺序
2011/08/23 Javascript
Javascript面向对象设计一 工厂模式
2011/12/20 Javascript
javascript获取设置div的高度和宽度兼容任何浏览器
2013/09/22 Javascript
javascript中clipboardData对象用法详解
2015/05/13 Javascript
js实现文字垂直滚动和鼠标悬停效果
2015/12/31 Javascript
JavaScript function函数种类详解
2016/02/22 Javascript
JQuery.validate在ie8下不支持的快速解决方法
2016/05/18 Javascript
KnockoutJS 3.X API 第四章之click绑定
2016/10/10 Javascript
JS使用正则实现去掉字符串左右空格的方法
2016/12/27 Javascript
使用openSpeDiv方法实现Ecshop登录弹窗框效果
2017/03/13 Javascript
JS实现运动缓冲效果的封装函数示例
2018/02/18 Javascript
加快Vue项目的开发速度的方法
2018/12/12 Javascript
JavaScript中import用法总结
2019/01/20 Javascript
JQuery常见节点操作实例分析
2019/05/15 jQuery
jQuery中getJSON跨域原理的深入讲解
2020/09/02 jQuery
[06:38]DOTA2怒掀电竞风暴 2013Chinajoy
2013/07/27 DOTA
Django之提交表单与前后端交互的方法
2019/07/19 Python
python super函数使用方法详解
2020/02/14 Python
python的数学算法函数及公式用法
2020/11/18 Python
CSS3 flex布局之快速实现BorderLayout布局
2015/12/03 HTML / CSS
css3实现多个元素依次显示效果
2017/12/12 HTML / CSS
全球知名的婚恋交友网站:Match.com
2017/01/05 全球购物
.NET程序员的数据库面试题
2012/10/10 面试题
产品质量承诺书
2014/03/27 职场文书
党员群众路线承诺书
2014/05/20 职场文书
审计局班子四风对照检查材料思想汇报
2014/10/07 职场文书
2014会计年终工作总结
2014/12/20 职场文书
2015年大学宣传部工作总结
2015/05/26 职场文书
了解MySQL查询语句执行过程(5大组件)
2022/08/14 MySQL