编程 Python

关于pandas的离散化,面元划分详解

Posted in Python onNovember 22, 2019

pd.cut

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

x：要分箱的输入数组，必须是一维的

bins：int或标量序列

若bins是一个int，它定义在x范围内的等宽单元的数量。然而，在这种情况下，x的范围在每一侧延伸0.1％以包括x的最小值或最大值

若bins是一个序列，它定义了允许非均匀bin宽度的bin边缘。在这种情况下不进行x的范围的扩展

right：bool，可选：决定区间的开闭，如果right == True（默认），则区间[1,2,3,4]指示（1,2]，（2,3]，（3,4]

labels：array或boolean，默认值为无：用作生成的区间的标签。必须与生成的区间的长度相同。如果为False，则只返回bin的整数指示符

retbins：bool，可选：是否返回bin。如果bin作为标量给出，则可能有用

precision：int：存储和显示容器标签的精度，默认保留三位小数

include_lowest：bool：第一个间隔是否应该包含左边

import numpy as np
import pandas as pd
# 使用pandas的cut函数划分年龄组
ages = [20,22,25,27,21,23,37,31,61,45,32]
bins = [18,25,35,60,100]
cats = pd.cut(ages,bins)
print(cats) # 分类时，当数据不在区间中将变为nan
# 统计落在各个区间的值数量
print(pd.value_counts(cats))
# 使用codes为年龄数据进行标号
print(cats.codes)
# 设置自己想要的面元名称
group_names = ['Youth','YoungAdult','MiddleAged','Senior']
print(pd.cut(ages, bins, labels=group_names))
# 设置区间数学符号为左闭右开
print(pd.cut(ages, bins, right=False))
# 向cut传入面元的数量，则会根据数据的最小值和最大值计算等长面元
print(pd.cut(ages, 4, precision=2)) # precision=2表示设置的精度

pd.qcut

与cut类似，它可以根据样本分位数对数据进行面元划分

pandas.qcut(x, q, labels=None, retbins=False, precision=3)

x：ndarray或Series

q：整数或分位数阵列分位数。十分位数为10，四分位数为4或者，分位数阵列，例如[0，.25，.5，.75，1.]四分位数

labels：array或boolean，默认值为无：用作生成的区间的标签。必须与生成的区间的长度相同。如果为False，则只返回bin的整数指示符。

retbins：bool，可选：是否返回bin。如果bin作为标量给出，则可能有用。

precision：int：存储和显示容器标签的精度

import numpy as np
import pandas as pd

# qcut可以根据样本分位数对数据进行面元划分
# data = np.random.randn(20) # 正态分布
data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
cats = pd.qcut(data, 4) # 按四分位数进行切割
print(cats)
print(pd.value_counts(cats))
print("-------------------------------------------------")
# 通过指定分位数（0到1之间的数值，包含端点）进行面元划分
cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1])
print(cats_2)
print(pd.value_counts(cats_2))

以上这篇关于pandas的离散化,面元划分详解就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

关于pandas的离散化,面元划分详解

- Author -

路在亻壬走

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python网络爬虫采集联想词示例

Feb 11 Python

Python 列表(List)操作方法详解

Mar 11 Python

python模拟登陆阿里妈妈生成商品推广链接

Apr 03 Python

浅析Python中else语句块的使用技巧

Jun 16 Python

使用python对多个txt文件中的数据进行筛选的方法

Jul 10 Python

python3多线程知识点总结

Sep 26 Python

python 3.7.4 安装 opencv的教程

Oct 10 Python

Django框架模板用法入门教程

Nov 04 Python

Python for循环及基础用法详解

Nov 08 Python

django formset实现数据表的批量操作的示例代码

Dec 06 Python

导致python中import错误的原因是什么

Jul 01 Python

PyQt5通过信号实现MVC的示例

Feb 06 Python

Python协程 yield与协程greenlet简单用法示例

Nov 22 #Python

使用pandas实现连续数据的离散化处理方式(分箱操作)

Nov 22 #Python

在OpenCV里使用Camshift算法的实现

Nov 22 #Python

利用Python的sympy包求解一元三次方程示例

Nov 22 #Python

Python matplotlib以日期为x轴作图代码实例

Nov 22 #Python

python快速排序的实现及运行时间比较

Nov 22 #Python

Python实现平行坐标图的绘制(plotly)方式

Nov 22 #Python

You might like

默默简单的写了一个模板引擎

2007/01/02 PHP

PHP+MYSQL会员系统的开发实例教程

2014/08/23 PHP

PHP将HTML转换成文本的实现代码

2015/01/21 PHP

使用PHP+AJAX让WordPress动态加载文章的教程

2015/12/11 PHP

Twig模板引擎用法入门教程

2016/01/20 PHP

PHP模拟post提交数据方法汇总

2016/02/16 PHP

PHP实现打包下载文件的方法示例

2017/10/07 PHP

ThinkPHP框架整合微信支付之Native 扫码支付模式一图文详解

2019/04/09 PHP

IE与FireFox中的childNodes区别

2011/10/20 Javascript

JQuery鼠标移到小图显示大图效果的方法

2015/06/10 Javascript

图解JavaScript中的this关键字

2020/05/28 Javascript

vue mixins组件复用的几种方式（小结）

2017/09/06 Javascript

js实现点击生成随机div

2020/01/16 Javascript

Vue实现input宽度随文字长度自适应操作

2020/07/29 Javascript

Antd表格滚动宽度自适应不换行的实例

2020/10/27 Javascript

动态创建类实例代码

2009/10/07 Python

python正则表达式去掉数字中的逗号(python正则匹配逗号)

2013/12/25 Python

python保存字符串到文件的方法

2015/07/01 Python

Python入门_浅谈字符串的分片与索引、字符串的方法

2017/05/16 Python

在django中使用自定义标签实现分页功能

2017/07/04 Python

Python实现图片转字符画的代码实例

2019/02/22 Python

Python函数定义及传参方式详解(4种)

2019/03/18 Python

Python 类，property属性(简化属性的操作)，@property，property()用法示例

2019/10/12 Python

python爬虫实现POST request payload形式的请求

2020/04/30 Python

如何基于Python Matplotlib实现网格动画

2020/07/20 Python

css3中背景尺寸background-size详解

2014/09/02 HTML / CSS

阿联酋航空丹麦官方网站：Emirates DK

2019/08/25 全球购物

商场经理竞聘演讲稿

2014/01/01 职场文书

十佳班主任事迹材料

2014/01/18 职场文书

医学类个人求职信范文

2014/02/05 职场文书

三方协议书范本

2014/04/22 职场文书

入党积极分子批评与自我批评思想汇报

2014/09/14 职场文书

西柏坡导游词

2015/02/05 职场文书

JavaScript实现显示和隐藏图片

2021/04/29 Javascript

Python包argparse模块常用方法

2021/06/04 Python

Python基于百度AI实现抓取表情包

2021/06/27 Python