Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中使用scapy模拟数据包实现arp攻击、dns放大攻击例子
Oct 23 Python
Python实现的摇骰子猜大小功能小游戏示例
Dec 18 Python
Python实现通讯录功能
Feb 22 Python
python实现任意位置文件分割的实例
Dec 14 Python
Python从单元素字典中获取key和value的实例
Dec 31 Python
在macOS上搭建python环境的实现方法
Aug 13 Python
Django实现WebSSH操作物理机或虚拟机的方法
Nov 06 Python
Python线程threading模块用法详解
Feb 26 Python
在python中利用dict转json按输入顺序输出内容方式
Feb 27 Python
VS2019+python3.7+opencv4.1+tensorflow1.13配置详解
Apr 16 Python
Python实现查找数据库最接近的数据
Jun 08 Python
教你用Python写一个植物大战僵尸小游戏
Apr 25 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
ThinkPHP之A方法实例讲解
2014/06/20 PHP
ThinkPHP框架实现导出excel数据的方法示例【基于PHPExcel】
2018/05/12 PHP
PhpStorm+xdebug+postman调试技巧分享
2020/09/15 PHP
另类调用flash无须激活的方法
2006/12/27 Javascript
js对象的比较
2011/02/26 Javascript
javascript中常用编程知识
2013/04/08 Javascript
jQuery遍历之next()、nextAll()方法使用实例
2014/11/08 Javascript
javascript获取重复次数最多的字符
2015/07/08 Javascript
JS基于Ajax实现的网页Loading效果代码
2015/10/27 Javascript
JavaScript学习笔记之数组求和方法
2016/03/23 Javascript
修复jQuery tablesorter无法正确排序的bug(加千分位数字后)
2016/03/30 Javascript
基于javascript制作微博发布栏效果
2016/04/04 Javascript
DOM 事件的深入浅出(一)
2016/12/05 Javascript
NodeJs实现定时任务的示例代码
2017/12/05 NodeJs
JavaScript实现图片懒加载的方法分析
2018/07/05 Javascript
elementUI select组件默认选中效果实现的方法
2019/03/25 Javascript
javascript面向对象三大特征之多态实例详解
2019/07/24 Javascript
详解nuxt 微信公众号支付遇到的问题与解决
2019/08/26 Javascript
JavaScript实现简单随机点名器
2019/11/21 Javascript
微信小程序开发(一):服务器获取数据列表渲染操作示例
2020/06/01 Javascript
JS异步宏队列与微队列原理区别详解
2020/07/02 Javascript
vue 获取url里参数的两种方法小结
2020/11/12 Javascript
Python 时间操作例子和时间格式化参数小结
2014/04/24 Python
在Python中操作文件之truncate()方法的使用教程
2015/05/25 Python
python检查URL是否正常访问的小技巧
2017/02/25 Python
导入tensorflow时报错:cannot import name 'abs'的解决
2019/10/10 Python
Python多线程通信queue队列用法实例分析
2020/03/24 Python
CSS3 不定高宽垂直水平居中的几种方式
2020/03/26 HTML / CSS
怎样声明子类
2013/07/02 面试题
个人自我鉴定怎么写
2013/10/28 职场文书
海南地接欢迎词
2014/01/14 职场文书
保密工作目标责任书
2014/07/28 职场文书
社区五一劳动节活动总结
2015/02/09 职场文书
单身申明具结书
2015/02/26 职场文书
思想品德课教学反思
2016/02/24 职场文书
Python 数据可视化神器Pyecharts绘制图像练习
2022/02/28 Python