Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现域名系统(DNS)正向查询的方法
Apr 19 Python
Python实现代码统计工具(终极篇)
Jul 04 Python
python实现对csv文件的列的内容读取
Jul 04 Python
Python延时操作实现方法示例
Aug 14 Python
Python自动发送邮件的方法实例总结
Dec 08 Python
微信公众号token验证失败解决方案
Jul 22 Python
Python使用matplotlib绘制三维参数曲线操作示例
Sep 10 Python
python反转列表的三种方式解析
Nov 08 Python
Pycharm远程连接服务器并实现代码同步上传更新功能
Feb 25 Python
设置jupyter中DataFrame的显示限制方式
Apr 12 Python
python软件都是免费的吗
Jun 18 Python
学python爬虫能做什么
Jul 29 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
PHP中去掉字符串首尾空格的方法
2012/05/19 PHP
php实现根据字符串生成对应数组的方法
2014/09/22 PHP
浅谈php优化需要注意的地方
2014/11/27 PHP
PHP获取数组最后一个值的2种方法
2015/01/21 PHP
json格式化/压缩工具 Chrome插件扩展版
2010/05/25 Javascript
jquery禁用右键单击功能屏蔽F5刷新
2014/03/17 Javascript
JQuery 给元素绑定click事件多次执行的解决方法
2014/09/09 Javascript
详解JavaScript中的every()方法
2015/06/08 Javascript
AngularJS+Node.js实现在线聊天室
2015/08/28 Javascript
jQuery控制DIV层实现由大到小,由远及近动画变化效果
2015/10/09 Javascript
JavaScript实现弹出模态窗体并接受传值的方法
2016/02/12 Javascript
三个js循环的关键字示例(for与while)
2016/02/16 Javascript
jquery实现一个简单的表单验证实例
2016/03/30 Javascript
12个非常实用的JavaScript小技巧【推荐】
2016/05/18 Javascript
Ionic快速安装教程
2016/06/03 Javascript
分享JS数组求和与求最大值的方法
2016/08/11 Javascript
JS实现PC手机端和嵌入式滑动拼图验证码三种效果
2017/02/15 Javascript
webpack的CSS加载器的使用
2018/09/11 Javascript
Node.js 的 GC 机制详解
2019/06/03 Javascript
vue-cli配置flexible过程详解
2019/07/04 Javascript
.netcore+vue 实现压缩文件下载功能
2020/09/24 Javascript
[09:31]2016国际邀请赛中国区预选赛Yao赛后采访 答题送礼
2016/06/27 DOTA
Python中的面向对象编程详解(上)
2015/04/13 Python
python爬虫之自动登录与验证码识别
2020/06/15 Python
浅谈python的dataframe与series的创建方法
2018/11/12 Python
Python读取分割压缩TXT文本文件实例
2020/02/14 Python
python如何通过闭包实现计算器的功能
2020/02/22 Python
python实现梯度下降和逻辑回归
2020/03/24 Python
CSS3 Columns分列式布局方法简介
2014/05/03 HTML / CSS
html5 canvas移动浏览器上实现图片压缩上传
2016/03/11 HTML / CSS
学校师德师风自我剖析材料
2014/09/29 职场文书
2014年学生会主席工作总结
2014/11/07 职场文书
技术员岗位职责
2015/02/04 职场文书
《活见鬼》教学反思
2016/02/24 职场文书
只需要这一行代码就能让python计算速度提高十倍
2021/05/24 Python
MySQL开启事务的方式
2021/06/26 MySQL