Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python+selenium开发环境搭建图文教程
Aug 11 Python
Python操作Sql Server 2008数据库的方法详解
May 17 Python
Python+threading模块对单个接口进行并发测试
Jun 25 Python
Python之pymysql的使用小结
Jul 01 Python
python实现批量修改服务器密码的方法
Aug 13 Python
Python 实现文件读写、坐标寻址、查找替换功能
Sep 11 Python
使用python远程操作linux过程解析
Dec 04 Python
python3.6.5基于kerberos认证的hive和hdfs连接调用方式
Jun 06 Python
PyCharm设置注释字体颜色以及是否倾斜的操作
Sep 16 Python
如何使用Python自动生成报表并以邮件发送
Oct 15 Python
python 提高开发效率的5个小技巧
Oct 19 Python
python 爬虫网页登陆的简单实现
Nov 30 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
用PHP编程开发“虚拟域名”系统
2006/10/09 PHP
smarty半小时快速上手入门教程
2014/10/27 PHP
php猴子选大王问题解决方法
2015/05/12 PHP
jQuery向下滚动即时加载内容实现的瀑布流效果
2016/01/07 PHP
php array_keys 返回数组的键名
2016/10/25 PHP
PHP抽象类与接口的区别详解
2019/03/21 PHP
理清apply(),call()的区别和关系
2011/08/14 Javascript
常见的原始JS选择器使用方法总结
2014/04/09 Javascript
JavaScript代码复用模式详解
2014/11/07 Javascript
jQuery 遍历函数详解
2015/07/05 Javascript
AngularJs concepts详解及示例代码
2016/09/01 Javascript
jQuery EasyUI右键菜单实现关闭标签/选项卡
2016/10/10 Javascript
jsp 网站引入外部css或者js失效问题解决
2016/10/31 Javascript
基于jquery实现二级联动效果
2017/03/30 jQuery
对angular2中的ngfor和ngif指令嵌套实例讲解
2018/09/12 Javascript
Koa 使用小技巧(小结)
2018/10/22 Javascript
JS获取当前时间的实例代码(昨天、今天、明天)
2018/11/13 Javascript
vue ssr 实现方式(学习笔记)
2019/01/18 Javascript
Vue实现星级评价效果实例详解
2019/12/30 Javascript
[17:13]DOTA2 HEROS教学视频教你分分钟做大人-斯拉克
2014/06/13 DOTA
Python 拷贝对象(深拷贝deepcopy与浅拷贝copy)
2008/09/06 Python
Python脚本实现集群检测和管理功能
2015/03/06 Python
进一步理解Python中的函数编程
2015/04/13 Python
Python数据类型详解(一)字符串
2016/05/08 Python
Python爬虫框架scrapy实现的文件下载功能示例
2018/08/04 Python
python调用百度REST API实现语音识别
2018/08/30 Python
python字符串切割:str.split()与re.split()的对比分析
2019/07/16 Python
深入浅析Python科学计算库Scipy及安装步骤
2019/10/12 Python
Python识别验证码的实现示例
2020/09/30 Python
python 检测nginx服务邮件报警的脚本
2020/12/31 Python
Sneaker Studio法国:购买运动鞋
2018/06/08 全球购物
2014最新自愿离婚协议书范本
2014/11/19 职场文书
会计求职自荐信
2015/03/26 职场文书
我的生日感言
2015/08/03 职场文书
施工安全责任协议书
2016/03/23 职场文书
《现实主义勇者的王国再建记》第三弹OST全曲试听片段公开
2022/04/04 日漫