Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
打开电脑上的QQ的python代码
Feb 10 Python
Python中输出ASCII大文字、艺术字、字符字小技巧
Apr 28 Python
python中argparse模块用法实例详解
Jun 03 Python
使用python实现省市三级菜单效果
Jan 20 Python
Python实现PS滤镜特效之扇形变换效果示例
Jan 26 Python
对python中使用requests模块参数编码的不同处理方法
May 18 Python
python numpy元素的区间查找方法
Nov 14 Python
基于Python实现迪杰斯特拉和弗洛伊德算法
May 27 Python
解决pyqt5中QToolButton无法使用的问题
Jun 21 Python
python批量读取文件名并写入txt文件中
Sep 05 Python
Selenium元素定位的30种方式(史上最全)
May 11 Python
深度学习详解之初试机器学习
Apr 14 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
德生9700DX电路分析
2021/03/02 无线电
php中使用exec,system等函数调用系统命令的方法(不建议使用,可导致安全问题)
2012/09/07 PHP
php中数字0和空值的区别分析
2014/06/05 PHP
Thinkphp使用mongodb数据库实现多条件查询方法
2014/06/26 PHP
PHP查询快递信息的方法
2015/03/07 PHP
php mysql_real_escape_string addslashes及mysql绑定参数防SQL注入攻击
2016/12/23 PHP
Yii框架批量插入数据扩展类的简单实现方法
2017/05/23 PHP
javascript 操作文件 实现方法小结
2009/07/02 Javascript
javascript转换字符串为dom对象(字符串动态创建dom)
2010/05/10 Javascript
javascript Array数组对象的扩展函数代码
2010/05/22 Javascript
计算新浪Weibo消息长度(还可以输入119字)
2013/07/02 Javascript
javascript中怎么做对象的类型判断
2013/11/11 Javascript
JavaScript让Textarea支持tab按键的方法
2015/06/26 Javascript
全面解析JavaScript里的循环方法之forEach,for-in,for-of
2020/04/20 Javascript
javascript实现一个网页加载进度loading
2017/01/04 Javascript
微信小程序 仿美团分类菜单 swiper分类菜单
2017/04/12 Javascript
javascript 玩转Date对象(实例讲解)
2017/07/11 Javascript
nodejs 十六进制字符串型数据与btye型数据相互转换
2018/07/30 NodeJs
vue data引入本地图片的两种方式小结
2019/11/13 Javascript
Python读写ini文件的方法
2015/05/28 Python
python RC4加密操作示例【测试可用】
2019/09/26 Python
python3 mmh3安装及使用方法
2019/10/09 Python
详解Python中如何将数据存储为json格式的文件
2020/11/18 Python
美国南部最大的家族百货公司:Belk
2017/01/30 全球购物
迪卡侬荷兰官网:Decathlon荷兰
2017/10/29 全球购物
美国最值得信赖的宠物药房:Allivet
2019/03/23 全球购物
3分钟演讲稿
2014/04/30 职场文书
韩语专业职业生涯规划范文:成功之路就在我们脚下
2014/09/11 职场文书
环境工程专业毕业生求职信
2014/09/30 职场文书
捐资助学感谢信
2015/01/21 职场文书
建筑工地资料员岗位职责
2015/04/13 职场文书
2016优秀大学生个人事迹材料范文
2016/03/01 职场文书
毕业生自我鉴定范文
2019/05/13 职场文书
有趣的二维码:使用MyQR和qrcode来制作二维码
2021/05/10 Python
vue3不同环境下实现配置代理
2022/05/25 Vue.js
Docker容器harbor私有仓库部署和管理
2022/08/05 Servers