Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python设置tmpfs来加速项目的教程
Apr 17 Python
Python socket编程实例详解
May 27 Python
Python numpy 提取矩阵的某一行或某一列的实例
Apr 03 Python
pandas 对每一列数据进行标准化的方法
Jun 09 Python
pip安装py_zipkin时提示的SSL问题对应
Dec 29 Python
浅析PEP572: 海象运算符
Oct 15 Python
Windows下PyCharm2018.3.2 安装教程(图文详解)
Oct 24 Python
在OpenCV里使用Camshift算法的实现
Nov 22 Python
python基于socket函数实现端口扫描
May 28 Python
python opencv把一张图片嵌入(叠加)到另一张图片上的实现代码
Jun 11 Python
基于Python爬取fofa网页端数据过程解析
Jul 13 Python
python 基于opencv 绘制图像轮廓
Dec 11 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
如何提高MYSQL数据库的查询统计速度 select 索引应用
2007/04/11 PHP
PHP设计模式 注册表模式
2012/02/05 PHP
PHP中使用Memache作为进程锁的操作类分享
2015/03/30 PHP
老生常谈PHP面向对象之解释器模式
2017/05/17 PHP
PHPMAILER实现PHP发邮件功能
2018/04/18 PHP
PHP7使用ODBC连接SQL Server2008 R2数据库示例【基于thinkPHP5.1框架】
2019/05/06 PHP
Javascript中的相等与不等运算
2010/04/25 Javascript
jQuery Validate 验证,校验规则写在控件中的具体实例
2014/02/27 Javascript
jquery常用特效方法使用示例
2014/04/25 Javascript
javascript生成img标签的3种实现方法(对象、方法、html)
2015/12/25 Javascript
AngularJs Dependency Injection(DI,依赖注入)
2016/09/02 Javascript
javascript数据结构之串的概念与用法分析
2017/04/12 Javascript
微信小程序 获取二维码实例详解
2017/06/23 Javascript
解决betterScroll在vue中存在图片时,出现拉不动的问题
2018/09/27 Javascript
javascript动态创建对象的属性详解
2018/11/07 Javascript
简单了解JavaScript中常见的反模式
2019/06/21 Javascript
JS正则表达式验证端口范围(0-65535)
2020/01/06 Javascript
详解vue3.0 diff算法的使用(超详细)
2020/07/01 Javascript
使用python调用浏览器并打开一个网址的例子
2014/06/05 Python
Django处理文件上传File Uploads的实例
2018/05/28 Python
使用Python读取二进制文件的实例讲解
2018/07/09 Python
python 代码实现k-means聚类分析的思路(不使用现成聚类库)
2020/06/01 Python
用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)
2020/06/04 Python
英国信箱在线鲜花速递公司:Bloom & Wild
2019/03/10 全球购物
澳大利亚和新西兰最大的在线旅行社之一:Aunt Betty
2019/08/07 全球购物
简述安装Slackware Linux系统的过程
2012/05/08 面试题
社团文化节策划书
2014/02/01 职场文书
3分钟英语演讲稿
2014/04/29 职场文书
村级四风对照检查材料
2014/08/24 职场文书
2014教师评职称工作总结
2014/11/10 职场文书
向女朋友道歉的话
2015/01/20 职场文书
关爱留守儿童主题班会
2015/08/13 职场文书
文明礼貌主题班会
2015/08/14 职场文书
Python OpenCV实现图形检测示例详解
2022/04/08 Python
python神经网络学习 使用Keras进行简单分类
2022/05/04 Python
mysql sock文件存储了什么信息
2022/07/15 MySQL