关于pandas的离散化,面元划分详解


Posted in Python onNovember 22, 2019

pd.cut

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

x:要分箱的输入数组,必须是一维的

bins:int或标量序列

若bins是一个int,它定义在x范围内的等宽单元的数量。然而,在这种情况下,x的范围在每一侧延伸0.1%以包括x的最小值或最大值

若bins是一个序列,它定义了允许非均匀bin宽度的bin边缘。在这种情况下不进行x的范围的扩展

right:bool,可选:决定区间的开闭,如果right == True(默认),则区间[1,2,3,4]指示(1,2],(2,3],(3,4]

labels:array或boolean,默认值为无:用作生成的区间的标签。必须与生成的区间的长度相同。如果为False,则只返回bin的整数指示符

retbins:bool,可选:是否返回bin。如果bin作为标量给出,则可能有用

precision:int:存储和显示容器标签的精度,默认保留三位小数

include_lowest:bool:第一个间隔是否应该包含左边

import numpy as np
import pandas as pd
# 使用pandas的cut函数划分年龄组
ages = [20,22,25,27,21,23,37,31,61,45,32]
bins = [18,25,35,60,100]
cats = pd.cut(ages,bins)
print(cats) # 分类时,当数据不在区间中将变为nan
# 统计落在各个区间的值数量
print(pd.value_counts(cats))
# 使用codes为年龄数据进行标号
print(cats.codes)
# 设置自己想要的面元名称
group_names = ['Youth','YoungAdult','MiddleAged','Senior']
print(pd.cut(ages, bins, labels=group_names))
# 设置区间数学符号为左闭右开
print(pd.cut(ages, bins, right=False))
# 向cut传入面元的数量,则会根据数据的最小值和最大值计算等长面元
print(pd.cut(ages, 4, precision=2)) # precision=2表示设置的精度

pd.qcut

与cut类似,它可以根据样本分位数对数据进行面元划分

pandas.qcut(x, q, labels=None, retbins=False, precision=3)

x:ndarray或Series

q:整数或分位数阵列分位数。十分位数为10,四分位数为4或者,分位数阵列,例如[0,.25,.5,.75,1.]四分位数

labels:array或boolean,默认值为无:用作生成的区间的标签。必须与生成的区间的长度相同。如果为False,则只返回bin的整数指示符。

retbins:bool,可选:是否返回bin。如果bin作为标量给出,则可能有用。

precision:int:存储和显示容器标签的精度

import numpy as np
import pandas as pd

# qcut可以根据样本分位数对数据进行面元划分
# data = np.random.randn(20) # 正态分布
data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
cats = pd.qcut(data, 4) # 按四分位数进行切割
print(cats)
print(pd.value_counts(cats))
print("-------------------------------------------------")
# 通过指定分位数(0到1之间的数值,包含端点)进行面元划分
cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1])
print(cats_2)
print(pd.value_counts(cats_2))

以上这篇关于pandas的离散化,面元划分详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现竖排打印传单手机号码易撕条
Mar 16 Python
Python实现随机生成手机号及正则验证手机号的方法
Apr 25 Python
Django之Mode的外键自关联和引用未定义的Model方法
Dec 15 Python
python批量爬取下载抖音视频
Jun 17 Python
基于python 等频分箱qcut问题的解决
Mar 03 Python
利用Python脚本批量生成SQL语句
Mar 04 Python
windows、linux下打包Python3程序详细方法
Mar 17 Python
基于python实现生成指定大小txt文档
Jul 20 Python
Django DRF认证组件流程实现原理详解
Aug 17 Python
python pip如何手动安装二进制包
Sep 30 Python
pytorch实现线性回归以及多元回归
Apr 11 Python
总结Python变量的相关知识
Jun 28 Python
Python协程 yield与协程greenlet简单用法示例
Nov 22 #Python
使用pandas实现连续数据的离散化处理方式(分箱操作)
Nov 22 #Python
在OpenCV里使用Camshift算法的实现
Nov 22 #Python
利用Python的sympy包求解一元三次方程示例
Nov 22 #Python
Python matplotlib以日期为x轴作图代码实例
Nov 22 #Python
python快速排序的实现及运行时间比较
Nov 22 #Python
Python实现平行坐标图的绘制(plotly)方式
Nov 22 #Python
You might like
Yii中srbac权限扩展模块工作原理与用法分析
2016/07/14 PHP
PHP实现微信JS-SDK接口选择相册及拍照并上传的方法
2016/12/05 PHP
php实现简单加入购物车功能
2017/03/07 PHP
如何用javascript判断录入的日期是否合法
2007/01/08 Javascript
10个实用的脚本代码工具
2010/05/04 Javascript
js更优雅的兼容
2010/08/12 Javascript
NodeJS框架Express的模板视图机制分析
2011/07/19 NodeJs
浅析JavaScript中的类型和对象
2013/11/29 Javascript
JS对文本框值的判断示例
2014/03/10 Javascript
使用jQuery设置disabled属性与移除disabled属性
2014/08/21 Javascript
HTML5实现留言和回复页面样式
2015/07/22 Javascript
require、backbone等重构手机图片查看器
2016/11/17 Javascript
详解Node.js开发中的express-session
2017/05/19 Javascript
jQuery插件select2利用ajax高效查询大数据列表(可搜索、可分页)
2017/05/19 jQuery
vue实现表格增删改查效果的实例代码
2017/07/18 Javascript
ReactJs实现树形结构的数据显示的组件的示例
2017/08/18 Javascript
webpack构建的详细流程探底
2018/01/08 Javascript
Vue使用Proxy监听所有接口状态的方法实现
2019/06/07 Javascript
微信小程序服务器日期格式化问题
2020/01/07 Javascript
Python struct模块解析
2014/06/12 Python
让python同时兼容python2和python3的8个技巧分享
2014/07/11 Python
python实现数独算法实例
2015/06/09 Python
python实现下载文件的三种方法
2017/02/09 Python
python删除过期log文件操作实例解析
2018/01/31 Python
Python实现的微信好友数据分析功能示例
2018/06/21 Python
Python 实现数据结构-循环队列的操作方法
2019/07/17 Python
Django如何实现网站注册用户邮箱验证功能
2019/08/14 Python
如何在mac环境中用python处理protobuf
2019/12/25 Python
英国快时尚女装购物网站:PrettyLittleThing
2018/08/15 全球购物
波兰电子产品购物网站:Vobis
2019/05/26 全球购物
写一个在SQL Server创建表的SQL语句
2012/03/10 面试题
资深生产主管自我评价
2013/09/22 职场文书
环境工程专业自荐信范文
2014/03/18 职场文书
三年级上册科学教学计划
2015/01/21 职场文书
邮政营业员岗位职责
2015/04/14 职场文书
关于感恩的作文
2019/08/26 职场文书