Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
ptyhon实现sitemap生成示例
Mar 30 Python
Python中的字符串操作和编码Unicode详解
Jan 18 Python
Python实现针对含中文字符串的截取功能示例
Sep 22 Python
python pandas 对时间序列文件处理的实例
Jun 22 Python
解决django 新增加用户信息出现错误的问题
Jul 28 Python
Django框架 querySet功能解析
Sep 04 Python
如何使用python3获取当前路径及os.path.dirname的使用
Dec 13 Python
PYQT5开启多个线程和窗口,多线程与多窗口的交互实例
Dec 13 Python
Python运行DLL文件的方法
Jan 17 Python
详解Python中string模块除去Str还剩下什么
Nov 30 Python
Python趣味实战之手把手教你实现举牌小人生成器
Jun 07 Python
利用Python第三方库实现预测NBA比赛结果
Jun 21 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
实用函数8
2007/11/08 PHP
PHP操作文件类的函数代码(文件和文件夹创建,复制,移动和删除)
2011/11/10 PHP
PHP函数篇之掌握ord()与chr()函数应用
2011/12/05 PHP
浅谈php serialize()与unserialize()的用法
2013/06/05 PHP
php+mysql查询优化简单实例
2015/01/13 PHP
解读PHP中上传文件的处理问题
2016/05/29 PHP
浅析PHP中的i++与++i的区别及效率
2016/06/15 PHP
PHP基于redis计数器类定义与用法示例
2018/02/08 PHP
jquery获取input表单值的代码
2010/04/19 Javascript
JavaScript 高级篇之函数 (四)
2012/04/07 Javascript
JS 按钮点击触发(兼容IE、火狐)
2013/08/07 Javascript
JavaScript模块随意拖动示例代码
2014/05/27 Javascript
简介JavaScript中的setTime()方法的使用
2015/06/11 Javascript
实例讲解使用原生JavaScript处理AJAX请求的方法
2016/05/10 Javascript
BootStrap 智能表单实战系列(十)自动完成组件的支持
2016/06/13 Javascript
easyUI实现(alert)提示框自动关闭的实例代码
2016/11/07 Javascript
jQuery实现Select下拉列表进行状态选择功能
2017/03/30 jQuery
使用 NodeJS+Express 开发服务端的简单介绍
2017/04/07 NodeJs
Bootstrap里的文件分别代表什么意思及其引用方法
2017/05/01 Javascript
Angular4自制一个市县二级联动组件示例
2017/11/21 Javascript
angular4 获取wifi列表中文显示乱码问题的解决
2018/10/20 Javascript
vue 表单输入框不支持focus及blur事件的解决方案
2020/11/17 Vue.js
[41:21]夜魇凡尔赛茶话会 第三期02:看图识人
2021/03/11 DOTA
Python基于回溯法子集树模板解决m着色问题示例
2017/09/07 Python
Python输入二维数组方法
2018/04/13 Python
Python编程中NotImplementedError的使用方法
2018/04/21 Python
html5 音乐播放器 audio 标签使用概述
2013/07/15 HTML / CSS
10个最常见的HTML5面试题 附答案
2016/06/06 HTML / CSS
英国花园药房: The Garden Pharmacy
2017/12/28 全球购物
加拿大拼图大师:Puzzle Master
2020/12/28 全球购物
Servlet面试题库
2015/07/18 面试题
社区先进事迹材料
2014/05/19 职场文书
教师求职信范文
2014/05/24 职场文书
2015新学期开学寄语
2015/02/26 职场文书
物业前台接待岗位职责
2015/04/03 职场文书
团日活动总结格式
2015/05/11 职场文书