Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现去除代码前行号的方法
Mar 10 Python
浅谈Python中range和xrange的区别
Dec 20 Python
Python Flask 搭建微信小程序后台详解
May 06 Python
python3.6环境安装+pip环境配置教程图文详解
Jun 20 Python
使用python来调用CAN通讯的DLL实现方法
Jul 03 Python
Python 类属性与实例属性,类对象与实例对象用法分析
Sep 20 Python
python函数不定长参数使用方法解析
Dec 14 Python
pytorch实现focal loss的两种方式小结
Jan 02 Python
解决pycharm中的run和debug失效无法点击运行
Jun 09 Python
Python 如何反方向迭代一个序列
Jul 28 Python
python 下载文件的几种方法汇总
Jan 06 Python
彻底解决pip下载pytorch慢的问题方法
Mar 01 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
PHP中array_map与array_column之间的关系分析
2014/08/19 PHP
PHP Smarty模版简单使用方法
2016/03/30 PHP
php构造函数与析构函数
2016/04/23 PHP
详解PHP中websocket的使用方法
2016/09/15 PHP
PHP房贷计算器实例代码,等额本息,等额本金
2017/04/01 PHP
URL地址中的#符号使用说明
2011/02/12 Javascript
jquery radio 操作代码
2011/03/16 Javascript
JS代码判断IE6,IE7,IE8,IE9的函数代码
2013/08/02 Javascript
jQuery中:radio选择器用法实例
2015/01/03 Javascript
javascript编写实用的省市选择器
2015/02/12 Javascript
JavaScript实现鼠标滑过图片变换效果的方法
2015/04/16 Javascript
JavaScript如何实现在文本框(密码框)输入提示语
2015/12/25 Javascript
vue2 中如何实现动态表单增删改查实例
2017/06/09 Javascript
jQuery:unbind方法的使用详解
2017/08/14 jQuery
vue监听scroll的坑的解决方法
2017/09/07 Javascript
微信小程序实现的涂鸦功能示例【附源码下载】
2018/01/12 Javascript
使用JS实现导航切换时高亮显示的示例讲解
2018/08/22 Javascript
JavaScript实现电灯开关小案例
2020/03/30 Javascript
Openlayers实现测量功能
2020/09/25 Javascript
[01:00:52]2018DOTA2亚洲邀请赛 4.4 淘汰赛 EG vs LGD 第一场
2018/04/05 DOTA
Python BeautifulSoup中文乱码问题的2种解决方法
2014/04/22 Python
在Python的Django框架中包装视图函数
2015/07/20 Python
Python实现的随机森林算法与简单总结
2018/01/30 Python
浅谈django orm 优化
2018/08/18 Python
Python判断以什么结尾以什么开头的实例
2018/10/27 Python
Python3获取电脑IP、主机名、Mac地址的方法示例
2019/04/11 Python
深入了解Python枚举类型的相关知识
2019/07/09 Python
Python Django Vue 项目创建过程详解
2019/07/29 Python
python3常用的数据清洗方法(小结)
2019/10/31 Python
python中什么是面向对象
2020/06/11 Python
Html5游戏开发之乒乓Ping Pong游戏示例(三)
2013/01/21 HTML / CSS
HTML5中indexedDB 数据库的使用实例
2017/05/11 HTML / CSS
正宗的日本零食和糖果订阅盒:Bokksu
2019/11/21 全球购物
戴森西班牙官网:Dyson西班牙
2020/02/04 全球购物
系统管理员的职责包括那些?管理的对象是什么?
2013/01/18 面试题
2016年大学生暑期社会实践活动总结
2016/04/06 职场文书