Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Django框架中的视图级缓存
Jul 23 Python
Python语法快速入门指南
Oct 12 Python
Python实现新浪博客备份的方法
Apr 27 Python
Python创建二维数组实例(关于list的一个小坑)
Nov 07 Python
python爬虫之urllib,伪装,超时设置,异常处理的方法
Dec 19 Python
Python多线程处理实例详解【单进程/多进程】
Jan 30 Python
python 中Arduino串口传输数据到电脑并保存至excel表格
Oct 14 Python
手把手教你Python yLab的绘制折线图的画法
Oct 23 Python
Python实现Word表格转成Excel表格的示例代码
Apr 16 Python
django模板获取list中指定索引的值方式
May 14 Python
实现ECharts双Y轴左右刻度线一致的例子
May 16 Python
如何解决.cuda()加载用时很长的问题
May 24 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
解析CI的AJAX分页 另类实现方法
2013/06/27 PHP
php自定义错误处理用法实例
2015/03/20 PHP
php+ajax实现文件切割上传功能示例
2020/03/03 PHP
PHP网站常见安全漏洞,及相应防范措施总结
2021/03/01 PHP
jquery创建div 实现代码
2009/04/27 Javascript
JavaScript 数组运用实现代码
2010/04/13 Javascript
XMLHTTP 乱码的解决方法(UTF8,GB2312 编码 解码)
2011/01/12 Javascript
javascript实现删除前弹出确认框
2015/06/04 Javascript
详解jQuery中的empty、remove和detach
2016/04/11 Javascript
jQuery插件echarts实现的多柱子柱状图效果示例【附demo源码下载】
2017/03/04 Javascript
Vue2组件tree实现无限级树形菜单
2017/03/29 Javascript
解决Mac node版本升级失败的问题
2018/05/16 Javascript
vue项目初始化到登录login页面的示例
2019/10/31 Javascript
[01:51]2014DOTA2西雅图邀请赛 MVP 外卡赛black场间采访
2014/07/09 DOTA
[04:13]2018国际邀请赛典藏宝瓶Ⅱ饰品一览
2018/07/21 DOTA
python使用Pycharm创建一个Django项目
2018/03/05 Python
python 遍历目录(包括子目录)下所有文件的实例
2018/07/11 Python
java判断三位数的实例讲解
2019/06/10 Python
在PyCharm中控制台输出日志分层级分颜色显示的方法
2019/07/11 Python
使用python实现kNN分类算法
2019/10/16 Python
Python实现基于socket的udp传输与接收功能详解
2019/11/15 Python
Python入门基础之数字字符串与列表
2021/02/01 Python
实例讲解使用SVG制作loading加载动画的方法
2016/04/05 HTML / CSS
史泰博(Staples)中国官方网站:办公用品一站式采购
2016/09/05 全球购物
英国手工布艺沙发在线购买:Sofas & Stuff
2018/03/02 全球购物
美国滑雪板和装备购物网站:Skis.com
2018/12/20 全球购物
香港艺人陈冠希创办的潮流品牌:JUICESTORE
2021/03/04 全球购物
廉政教育心得体会
2014/01/01 职场文书
医院工作检讨书范文
2014/02/10 职场文书
会务接待方案
2014/02/27 职场文书
经理助理岗位职责
2014/03/05 职场文书
nginx搭建图片服务器的过程详解(root和alias的区别)
2021/03/31 Servers
Go Gin实现文件上传下载的示例代码
2021/04/02 Golang
PHP实现rar解压读取扩展包小结
2021/06/03 PHP
Redis分布式锁Redlock的实现
2021/08/07 Redis
Beekeeper Studio开源数据库管理工具比Navicat更炫酷
2022/06/21 数据库