关于pandas的离散化,面元划分详解


Posted in Python onNovember 22, 2019

pd.cut

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

x:要分箱的输入数组,必须是一维的

bins:int或标量序列

若bins是一个int,它定义在x范围内的等宽单元的数量。然而,在这种情况下,x的范围在每一侧延伸0.1%以包括x的最小值或最大值

若bins是一个序列,它定义了允许非均匀bin宽度的bin边缘。在这种情况下不进行x的范围的扩展

right:bool,可选:决定区间的开闭,如果right == True(默认),则区间[1,2,3,4]指示(1,2],(2,3],(3,4]

labels:array或boolean,默认值为无:用作生成的区间的标签。必须与生成的区间的长度相同。如果为False,则只返回bin的整数指示符

retbins:bool,可选:是否返回bin。如果bin作为标量给出,则可能有用

precision:int:存储和显示容器标签的精度,默认保留三位小数

include_lowest:bool:第一个间隔是否应该包含左边

import numpy as np
import pandas as pd
# 使用pandas的cut函数划分年龄组
ages = [20,22,25,27,21,23,37,31,61,45,32]
bins = [18,25,35,60,100]
cats = pd.cut(ages,bins)
print(cats) # 分类时,当数据不在区间中将变为nan
# 统计落在各个区间的值数量
print(pd.value_counts(cats))
# 使用codes为年龄数据进行标号
print(cats.codes)
# 设置自己想要的面元名称
group_names = ['Youth','YoungAdult','MiddleAged','Senior']
print(pd.cut(ages, bins, labels=group_names))
# 设置区间数学符号为左闭右开
print(pd.cut(ages, bins, right=False))
# 向cut传入面元的数量,则会根据数据的最小值和最大值计算等长面元
print(pd.cut(ages, 4, precision=2)) # precision=2表示设置的精度

pd.qcut

与cut类似,它可以根据样本分位数对数据进行面元划分

pandas.qcut(x, q, labels=None, retbins=False, precision=3)

x:ndarray或Series

q:整数或分位数阵列分位数。十分位数为10,四分位数为4或者,分位数阵列,例如[0,.25,.5,.75,1.]四分位数

labels:array或boolean,默认值为无:用作生成的区间的标签。必须与生成的区间的长度相同。如果为False,则只返回bin的整数指示符。

retbins:bool,可选:是否返回bin。如果bin作为标量给出,则可能有用。

precision:int:存储和显示容器标签的精度

import numpy as np
import pandas as pd

# qcut可以根据样本分位数对数据进行面元划分
# data = np.random.randn(20) # 正态分布
data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
cats = pd.qcut(data, 4) # 按四分位数进行切割
print(cats)
print(pd.value_counts(cats))
print("-------------------------------------------------")
# 通过指定分位数(0到1之间的数值,包含端点)进行面元划分
cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1])
print(cats_2)
print(pd.value_counts(cats_2))

以上这篇关于pandas的离散化,面元划分详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中os和shutil模块实用方法集锦
May 13 Python
python字典键值对的添加和遍历方法
Sep 11 Python
django2 快速安装指南分享
Jan 05 Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
Apr 18 Python
python删除字符串中指定字符的方法
Aug 13 Python
python实现杨氏矩阵查找
Mar 02 Python
python3 中的字符串(单引号、双引号、三引号)以及字符串与数字的运算
Jul 18 Python
简单了解python shutil模块原理及使用方法
Apr 28 Python
Pytho爬虫中Requests设置请求头Headers的方法
Sep 22 Python
Python APScheduler执行使用方法详解
Dec 10 Python
Linux系统下升级pip的完整步骤
Jan 31 Python
python图像处理 PIL Image操作实例
Apr 09 Python
Python协程 yield与协程greenlet简单用法示例
Nov 22 #Python
使用pandas实现连续数据的离散化处理方式(分箱操作)
Nov 22 #Python
在OpenCV里使用Camshift算法的实现
Nov 22 #Python
利用Python的sympy包求解一元三次方程示例
Nov 22 #Python
Python matplotlib以日期为x轴作图代码实例
Nov 22 #Python
python快速排序的实现及运行时间比较
Nov 22 #Python
Python实现平行坐标图的绘制(plotly)方式
Nov 22 #Python
You might like
php桌面中心(三) 修改数据库
2007/03/11 PHP
PHP实现图片裁剪、添加水印效果代码
2014/10/01 PHP
php过滤表单提交的html等危险代码
2014/11/03 PHP
php中文验证码实现方法
2015/06/18 PHP
thinkPHP中多维数组的遍历方法
2016/01/09 PHP
用PHP写的一个冒泡排序法的函数简单实例
2016/05/26 PHP
php基于curl实现随机ip地址抓取内容的方法
2016/10/11 PHP
Alliance vs Liquid BO3 第三场2.13
2021/03/10 DOTA
struts2+jquery+json实现异步加载数据(自写)
2013/06/24 Javascript
jQuery中选择器小问题(新人难免遇到)
2014/03/31 Javascript
基于jQuery实现的图片切换焦点图整理
2014/12/07 Javascript
JS+CSS相对定位实现的下拉菜单
2015/10/06 Javascript
深入理解js数组的sort排序
2016/05/28 Javascript
jQuery如何解决IE输入框不能输入的问题
2016/10/08 Javascript
在html中引入外部js文件,并调用带参函数的方法
2016/10/31 Javascript
jQuery插件FusionCharts绘制的2D双柱状图效果示例【附demo源码】
2017/05/13 jQuery
慕课网题目之js实现抽奖系统功能
2017/09/19 Javascript
基于模板引擎Jade的应用(详解)
2017/12/12 Javascript
React Native之prop-types进行属性确认详解
2017/12/19 Javascript
JavaScript图片处理与合成总结
2018/03/04 Javascript
nodejs爬虫初试superagent和cheerio
2018/03/05 NodeJs
npm 更改默认全局路径以及国内镜像的方法
2018/05/16 Javascript
JS实现常见的查找、排序、去重算法示例
2018/05/21 Javascript
基于jQuery使用Ajax动态执行模糊查询功能
2018/07/05 jQuery
使用vue2.0创建的项目的步骤方法
2018/09/25 Javascript
vue-cli项目中使用echarts图表实例
2018/10/22 Javascript
vue路由权限校验功能的实现代码
2020/06/07 Javascript
Python3网络爬虫中的requests高级用法详解
2019/06/18 Python
python的移位操作实现详解
2019/08/21 Python
Scrapy 配置动态代理IP的实现
2020/09/28 Python
使用HTML5 Canvas API绘制弧线的教程
2016/03/22 HTML / CSS
红领巾心向党广播稿
2014/01/19 职场文书
车队司机自我鉴定
2014/03/02 职场文书
小学生期末评语
2014/04/21 职场文书
坚守艰苦奋斗精神坚决反对享乐主义整改措施
2014/09/17 职场文书
大学考试作弊检讨书
2015/05/06 职场文书