Pandas数据离散化原理及实例解析


Posted in Python onNovember 16, 2019

这篇文章主要介绍了Pandas数据离散化原理及实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

为什么要离散化

  • 连续属性离散化的目的是为了简化数据结构,数据离散化技术可以用来减少给定连续属性值的个数。离散化方法经常作为数据挖掘的工具
  • 扔掉一些信息,可以让模型更健壮,泛化能力更强

什么是数据的离散化

连续属性的离散化就是在连续属性的值域上,将值域划分为若干个离散的区间,最后用不同的符号或整数 值代表落在每个子区间中的属性值

分箱

Pandas数据离散化原理及实例解析

案例

1.先读取股票的数据,筛选出p_change数据

data = pd.read_csv("./data/stock_day.csv")
p_change= data['p_change']

2.将股票涨跌幅数据进行分组

使用的工具:

  • pd.qcut(data, bins)——等深分箱:
    • 对数据进行分组将数据分组 一般会与value_counts搭配使用,统计每组的个数
  • series.value_counts():统计分组次数
# 自行分组
qcut = pd.qcut(p_change, 10)
# 计算分到每个组数据个数
qcut.value_counts()

自定义区间分组:

  • pd.cut(data, bins)——等宽分箱:
    • bins是整数—等宽
    • bins是列表--自定义分箱
# 自己指定分组区间
bins = [-100, -7, -5, -3, 0, 3, 5, 7, 100]
p_counts = pd.cut(p_change, bins)

Pandas数据离散化原理及实例解析

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python编写简单爬虫资料汇总
Mar 22 Python
用Python实现命令行闹钟脚本实例
Sep 05 Python
使用python存储网页上的图片实例
May 22 Python
Django框架使用富文本编辑器Uedit的方法分析
Jul 31 Python
pyhanlp安装介绍和简单应用
Feb 22 Python
Python3使用TCP编写一个简易的文件下载器功能
May 08 Python
python3使用print打印带颜色的字符串代码实例
Aug 22 Python
python 星号(*)的多种用途
Sep 21 Python
如何在Win10系统使用Python3连接Hive
Oct 15 Python
Prometheus开发中间件Exporter过程详解
Nov 30 Python
pytorch下的unsqueeze和squeeze的用法说明
Feb 06 Python
python 如何用terminal输入参数
May 25 Python
python实现XML解析的方法解析
Nov 16 #Python
Python实现自定义读写分离代码实例
Nov 16 #Python
Python大数据之网络爬虫的post请求、get请求区别实例分析
Nov 16 #Python
基于python实现雪花算法过程详解
Nov 16 #Python
Python大数据之使用lxml库解析html网页文件示例
Nov 16 #Python
Python大数据之从网页上爬取数据的方法详解
Nov 16 #Python
简单了解Pandas缺失值处理方法
Nov 16 #Python
You might like
PHP连接Access数据库的方法小结
2013/06/20 PHP
php解析json数据实例
2014/08/19 PHP
PHP编写文件多服务器同步程序
2016/07/02 PHP
推荐30个新鲜出炉的精美 jQuery 效果
2012/03/26 Javascript
利用javascript实现web页面中指定区域打印
2013/10/30 Javascript
用jquery写的一个万年历(自写)
2014/01/20 Javascript
Javascript高级技巧分享
2014/02/25 Javascript
JavaScript实现表格点击排序的方法
2015/05/11 Javascript
简单的jQuery banner图片轮播实例代码
2016/03/04 Javascript
基于bootstrap实现广告轮播带图片和文字效果
2016/07/22 Javascript
js 将图片连接转换成base64格式的简单实例
2016/08/10 Javascript
IE8利用自带的setCapture和releaseCapture解决iframe的拖拽事件方法
2016/10/25 Javascript
js中字符型和数值型数字的互相转化方法(必看)
2017/04/25 Javascript
Vue.js实现一个SPA登录页面的过程【推荐】
2017/04/29 Javascript
vue 打包后的文件部署到express服务器上的方法
2017/08/09 Javascript
webpack4简单入门实例
2018/09/06 Javascript
Angular ui-roter 和AngularJS 通过 ocLazyLoad 实现动态(懒)加载模块和依赖
2018/11/25 Javascript
vue弹出框组件封装实例代码
2019/10/31 Javascript
JS+HTML5本地存储Localstorage实现注册登录及验证功能示例
2020/02/10 Javascript
如何使用JavaScript检测空闲的浏览器选项卡
2020/05/28 Javascript
Python合并两个字典的常用方法与效率比较
2015/06/17 Python
Python实现修改文件内容的方法分析
2018/03/25 Python
win10下tensorflow和matplotlib安装教程
2018/09/19 Python
简单了解Python matplotlib线的属性
2019/06/29 Python
python plotly绘制直方图实例详解
2019/07/22 Python
python实现人工智能Ai抠图功能
2019/09/05 Python
python使用scapy模块实现ARP扫描的过程
2021/01/21 Python
No module named ‘win32gui‘ 的解决方法(踩坑之旅)
2021/02/18 Python
英国高级健康和美容产品零售商:Life and Looks
2019/08/01 全球购物
美国农场商店:Blain’s Farm & Fleet
2020/01/17 全球购物
初婚未育证明
2014/01/15 职场文书
给老婆的婚前保证书
2014/02/01 职场文书
刊首寄语大全
2014/04/11 职场文书
培训讲师开场白
2015/06/01 职场文书
教师节主题班会方案
2015/08/17 职场文书
Python字典的基础操作
2021/11/01 Python