Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中多线程的创建及基本调用方法
Jul 08 Python
深入理解 Python 中的多线程 新手必看
Nov 20 Python
Python tkinter实现的图片移动碰撞动画效果【附源码下载】
Jan 04 Python
Python列表推导式与生成器表达式用法示例
Feb 08 Python
解决python中os.listdir()函数读取文件夹下文件的乱序和排序问题
Oct 17 Python
Django中数据库的数据关系:一对一,一对多,多对多
Oct 21 Python
python实现AES加密解密
Mar 28 Python
python实现键盘输入的实操方法
Jul 16 Python
解决使用export_graphviz可视化树报错的问题
Aug 09 Python
Python中的None与 NULL(即空字符)的区别详解
Sep 24 Python
Python实现七个基本算法的实例代码
Oct 08 Python
python3中数组逆序输出方法
Dec 01 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
PHP+SQL 注入攻击的技术实现以及预防办法
2011/01/27 PHP
PHP开发不能违背的安全规则 过滤用户输入
2011/05/01 PHP
PHP框架Laravel的小技巧两则
2015/02/10 PHP
php使用simplexml_load_file加载XML文件并显示XML的方法
2015/03/19 PHP
Thinkphp框架开发移动端接口(1)
2016/08/18 PHP
Javascript 函数对象的多重身份
2009/06/28 Javascript
jqGrid jQuery 表格插件测试代码
2011/08/23 Javascript
JS实现用户注册时获取短信验证码和倒计时功能
2016/10/27 Javascript
javascript正则表达式模糊匹配IP地址功能示例
2017/01/06 Javascript
ES6学习教程之对象的扩展详解
2017/05/02 Javascript
javascript 中的继承实例详解
2017/05/05 Javascript
微信小程序联网请求的轮播图
2017/07/07 Javascript
vue-resouce设置请求头的三种方法
2017/09/12 Javascript
Mac下安装vue
2018/04/11 Javascript
JS+HTML实现的圆形可点击区域示例【3种方法】
2018/08/01 Javascript
浅谈在不使用ssr的情况下解决Vue单页面SEO问题(2)
2018/11/08 Javascript
Vue的双向数据绑定实现原理解析
2020/02/17 Javascript
基于JS+HTML实现弹窗提示是否确认提交功能
2020/06/17 Javascript
python将unicode转为str的方法
2017/06/21 Python
python不换行之end=与逗号的意思及用途
2017/11/21 Python
聊聊Python中的pypy
2018/01/12 Python
Python正则表达式实现简易计算器功能示例
2019/05/07 Python
PyQt5 QTableView设置某一列不可编辑的方法
2019/06/25 Python
30秒学会30个超实用Python代码片段【收藏版】
2019/10/15 Python
wxpython+pymysql实现用户登陆功能
2019/11/19 Python
HTML5 video标签(播放器)学习笔记(二):播放控制
2015/04/24 HTML / CSS
SAZAC的动物连体衣和动物睡衣:Kigurumi Shop
2020/03/14 全球购物
酒店管理求职信范文
2014/04/06 职场文书
关于安全的广播稿
2014/10/23 职场文书
答谢词范文
2015/01/05 职场文书
市场总监岗位职责
2015/02/11 职场文书
暑期工社会实践报告
2015/07/13 职场文书
卫生主题班会
2015/08/14 职场文书
2016婚礼主持词开场白
2015/11/24 职场文书
java设计模式--原型模式详解
2021/07/21 Java/Android
关于ObjectUtils.isEmpty() 和 null 的区别
2022/02/28 Java/Android