Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
简单介绍Python的Django框架加载模版的方式
Jul 20 Python
Python随手笔记之标准类型内建函数
Dec 02 Python
Python中偏函数用法示例
Jun 07 Python
Linux系统(CentOS)下python2.7.10安装
Sep 26 Python
python实现简单的文字识别
Nov 27 Python
Python地图绘制实操详解
Mar 04 Python
ipython和python区别详解
Jun 26 Python
python SQLAlchemy 中的Engine详解
Jul 04 Python
在pytorch中查看可训练参数的例子
Aug 18 Python
浅谈在django中使用redirect重定向数据传输的问题
Mar 13 Python
keras CNN卷积核可视化,热度图教程
Jun 22 Python
django创建css文件夹的具体方法
Jul 31 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
PHP中auto_prepend_file与auto_append_file用法实例分析
2014/09/22 PHP
php在linux下检测mysql同步状态的方法
2015/01/15 PHP
PHP验证信用卡卡号是否正确函数
2015/05/27 PHP
phpinfo无法显示的原因及解决办法
2019/02/15 PHP
PHP 出现 http500 错误的解决方法
2021/03/09 PHP
用Jquery实现可编辑表格并用AJAX提交到服务器修改数据
2009/12/27 Javascript
Jquery 扩展方法
2010/05/06 Javascript
使用jQuery实现dropdownlist的联动效果(sharepoint 2007)
2011/03/30 Javascript
JQuery入门——用映射方式绑定不同事件应用示例
2013/02/05 Javascript
jCallout 轻松实现气泡提示功能
2013/09/22 Javascript
JavaScript实现维吉尼亚(Vigenere)密码算法实例
2013/11/22 Javascript
js toFixed()方法的重写实现精度的统一
2014/03/06 Javascript
jQuery 鼠标经过(hover)事件的延时处理示例
2014/04/14 Javascript
Node.js异步I/O学习笔记
2014/11/04 Javascript
JavaScript检测上传文件大小的方法
2015/07/22 Javascript
详解JavaScript逻辑Not运算符
2015/12/04 Javascript
两种JavaScript的AES加密方式(可与Java相互加解密)
2016/08/02 Javascript
基于axios 的responseType类型的设置方法
2019/10/29 Javascript
vue实现全屏滚动效果(非fullpage.js)
2020/03/07 Javascript
python简单实现基数排序算法
2015/05/16 Python
python之pexpect实现自动交互的例子
2019/07/25 Python
python每天定时运行某程序代码
2019/08/16 Python
python 实现兔子生兔子示例
2019/11/21 Python
python操作cfg配置文件方式
2019/12/22 Python
pytorch模型存储的2种实现方法
2020/02/14 Python
Python RabbitMQ实现简单的进程间通信示例
2020/07/02 Python
python怎么删除缓存文件
2020/07/19 Python
加拿大最大的五金、家居装修和园艺产品商店:RONA
2017/01/27 全球购物
W Concept美国:精选全球独立设计师
2017/02/22 全球购物
美国最灵活的移动提供商:Tello
2017/07/18 全球购物
有创意的广告词
2014/03/18 职场文书
《狼和小羊》教学反思
2014/04/20 职场文书
投标承诺书怎么写
2014/05/24 职场文书
揭牌仪式策划方案
2014/05/28 职场文书
2014年预备党员端正入党动机思想汇报
2014/09/13 职场文书
python绘制云雨图raincloud plot
2022/08/05 Python