pandas参数设置的实用小技巧


Posted in Python onAugust 23, 2020

前言

在日常使用pandas的过程中,由于我们所分析的数据表规模、格式上的差异,使得同样的函数或方法作用在不同数据上的效果存在差异。

而pandas有着自己的一套参数设置系统,可以帮助我们在遇到不同的数据时灵活调节从而达到最好的效果,本文就将介绍pandas中常用的参数设置方面的知识。

pandas参数设置的实用小技巧
图1

1 设置DataFrame最大显示行数

pandas设置参数中的display.max_rows用于控制打印出的数据框的最大显示行数,我们使用pd.set_option()来有针对的设置参数,如下面的例子:

pandas参数设置的实用小技巧
图2

在修改display.max_rows的参数值之后,我们的数据框只会显示指定行数的数据,中间的部分都会以省略号的形式显示,当我们的数据框行数较多,可以加大这个参数以显示更多行数据。

2 设置DataFrame最大显示列数

类似display.max_rows,通过修改display.max_columns我们可以调节最大显示的数据框列数(默认是20列),这在我们的数据框字段较多又想全部查看的时候很有用:

pandas参数设置的实用小技巧
图3

3 设置每列的最大显示宽度

对于一些单元格内容长度较长的数据譬如长文本,在查看数据框时过长的部分会被简化为省略号,而通过修改display.max_colwidth参数我们可以在必要时,使得超长的部分也显示出来:

pandas参数设置的实用小技巧
图4

4 指定小于某个数的元素显示为0

通过display.chop_threshold参数我们在不修改原始数据的情况下,指定数据框中绝对值小于阈值的数显示为0:

pandas参数设置的实用小技巧
图5

5 格式化浮点数

通过display.float_format参数我们可以设置浮点数的显示格式,譬如这里我们给浮点数加上前缀并设定保留两位小数:

pandas参数设置的实用小技巧
图6

6 设置info()方法中非缺失值检查的行数上限

针对数据框的info()方法可以帮助我们查看数据框的一些概览信息,譬如每一列对应的非缺失值个数。

但默认情况下当数据框行数大于1690784行时,再查看info()信息,会处于计算效率的考虑略去缺失值检查信息。

这时我们可以通过设置display.max_info_rows参数来提高这个上限:

pandas参数设置的实用小技巧
图7

7 控制小数打印的精度

控制数据框中小数的显示精度除了上文提到的方法之外,还可以通过修改display.precision参数来控制,默认是6位小数:

pandas参数设置的实用小技巧
图8

8 临时修改参数

有些时候我们只希望在某张表上进行设置参数的修改,不希望影响到之后的其他表的显示。

这时除了用pd.reset_option()对指定的参数进行复原之外,我们还可以利用with关键词配合pd.option_context以临时的方式将指定的参数作用在局部范围内:

pandas参数设置的实用小技巧
图9

总结

到此这篇关于pandas参数设置实用小技巧的文章就介绍到这了,更多相关pandas参数设置技巧内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现的一个找零钱的小程序代码分享
Aug 25 Python
python实现堆栈与队列的方法
Jan 15 Python
使用Node.js和Socket.IO扩展Django的实时处理功能
Apr 20 Python
解决python3在anaconda下安装caffe失败的问题
Jun 15 Python
python pandas 对series和dataframe的重置索引reindex方法
Jun 07 Python
python-str,list,set间的转换实例
Jun 27 Python
Python操作Mongodb数据库的方法小结
Sep 10 Python
Python字典的概念及常见应用实例详解
Oct 30 Python
python数值基础知识浅析
Nov 19 Python
Python 字典一个键对应多个值的方法
Sep 29 Python
Python中读取文件名中的数字的实例详解
Dec 25 Python
python实现剪贴板的操作
Jul 01 Python
Python如何把字典写入到CSV文件的方法示例
Aug 23 #Python
Python tkinter界面实现历史天气查询的示例代码
Aug 23 #Python
套娃式文件夹如何通过Python批量处理
Aug 23 #Python
python进度条显示-tqmd模块的实现示例
Aug 23 #Python
基于python tkinter的点名小程序功能的实例代码
Aug 22 #Python
python+selenium 简易地疫情信息自动打卡签到功能的实现代码
Aug 22 #Python
python进度条显示之tqmd模块
Aug 22 #Python
You might like
通过ODBC连接的SQL SERVER实例
2006/10/09 PHP
php写的带缓存数据功能的mysqli类
2012/09/06 PHP
PHP面向对象程序设计之命名空间与自动加载类详解
2016/12/02 PHP
Laravel框架中VerifyCsrfToken报错问题的解决
2017/08/30 PHP
laravel admin实现分类树/模型树的示例代码
2020/06/10 PHP
通用JS事件写法实现代码
2009/01/07 Javascript
JQuery筛选器全系列介绍
2013/08/27 Javascript
让JavaScript和其它资源并发下载的方法
2014/10/16 Javascript
浅谈JavaScript function函数种类
2014/12/29 Javascript
异步安全加载javascript文件的方法
2015/07/21 Javascript
wap手机端解决返回上一页的js实例
2016/12/08 Javascript
jquery加载单文件vue组件的方法
2017/06/20 jQuery
Vue.js2.0中的变化小结
2017/10/24 Javascript
关于redux-saga中take使用方法详解
2018/02/27 Javascript
详解浏览器缓存和webpack缓存配置
2018/07/06 Javascript
Element-ui tree组件自定义节点使用方法代码详解
2018/09/17 Javascript
vue.js指令v-for使用以及下标索引的获取
2019/01/31 Javascript
jQuery中使用validate插件校验表单功能
2019/05/24 jQuery
30分钟用Node.js构建一个API服务器的步骤详解
2019/05/24 Javascript
Python3处理文件中每个词的方法
2015/05/22 Python
解决Python字典写入文件出行首行有空格的问题
2017/09/27 Python
Python实现可自定义大小的截屏功能
2018/01/20 Python
基于DataFrame筛选数据与loc的用法详解
2018/05/18 Python
Python中GIL的使用详解
2018/10/03 Python
Python中的集合介绍
2019/01/28 Python
python切片(获取一个子列表(数组))详解
2019/08/09 Python
Python实现银行账户资金交易管理系统
2020/01/03 Python
Anaconda3+tensorflow2.0.0+PyCharm安装与环境搭建(图文)
2020/02/18 Python
关于keras中keras.layers.merge的用法说明
2020/05/23 Python
Python绘图之二维图与三维图详解
2020/08/04 Python
使用iframe+postMessage实现页面跨域通信的示例代码
2020/01/14 HTML / CSS
Nayomi官网:沙特阿拉伯王国睡衣和内衣品牌
2020/12/19 全球购物
会计主管岗位职责
2014/01/03 职场文书
幼儿园班级工作总结2015
2015/05/25 职场文书
煤矿施工安全协议书
2016/03/22 职场文书
Python 统计序列中元素的出现频度
2022/04/26 Python