Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Django中创建URLconf相关的通用视图的方法
Jul 20 Python
Python学习小技巧之列表项的推导式与过滤操作
May 20 Python
Python使用三种方法实现PCA算法
Dec 12 Python
用python实现对比两张图片的不同
Feb 05 Python
python使用tkinter库实现五子棋游戏
Jun 18 Python
使用Rasterio读取栅格数据的实例讲解
Nov 26 Python
matlab、python中矩阵的互相导入导出方式
Jun 01 Python
Pytorch 使用opnecv读入图像由HWC转为BCHW格式方式
Jun 02 Python
python交互模式基础知识点学习
Jun 18 Python
python如何实现读取并显示图片(不需要图形界面)
Jul 08 Python
Python语言编写智力问答小游戏功能
Oct 13 Python
python程序的组织结构详解
Dec 06 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
php文件上传的例子及参数详解
2013/12/12 PHP
php实现文件下载简单示例(代码实现文件下载)
2014/03/10 PHP
浅析application/x-www-form-urlencoded和multipart/form-data的区别
2014/06/22 PHP
Yii使用技巧大汇总
2015/12/29 PHP
利用PHP访问MySql数据库的逻辑操作以及增删改查的实例讲解
2017/08/30 PHP
关于js类的定义
2011/06/28 Javascript
基于jquery实现的鼠标滑过按钮改变背景图片
2011/07/15 Javascript
详解JavaScript基于面向对象之继承
2015/12/13 Javascript
AngularJS基础 ng-mousemove 指令简单示例
2016/08/02 Javascript
微信小程序-拍照或选择图片并上传文件
2017/01/06 Javascript
简单实现nodejs上传功能
2017/01/14 NodeJs
微信浏览器禁止页面下拉查看网址实例详解
2017/06/28 Javascript
JavaScript 有用的代码片段和 trick
2018/02/22 Javascript
JS中双击和单击事件冲突的解决方法
2018/04/09 Javascript
解决layui中table异步数据请求不支持自定义返回数据格式的问题
2018/08/19 Javascript
微信小程序实现列表页的点赞和取消点赞功能
2018/11/02 Javascript
python实现图片变亮或者变暗的方法
2015/06/01 Python
Python进程间通信用法实例
2015/06/04 Python
Django中对数据查询结果进行排序的方法
2015/07/17 Python
Python 迭代器工具包【推荐】
2016/05/06 Python
利用Pandas读取文件路径或文件名称包含中文的csv文件方法
2018/07/04 Python
通过实例简单了解python yield使用方法
2020/08/06 Python
python实现简单贪吃蛇游戏
2020/09/29 Python
纽约通行卡:The New York Pass(免费游览纽约90多个景点)
2017/07/29 全球购物
社会保险接收函
2014/01/12 职场文书
回门宴答谢词
2014/01/13 职场文书
小区消防演习方案
2014/02/21 职场文书
入党积极分子自我鉴定范文
2014/03/25 职场文书
青春无悔演讲稿
2014/05/08 职场文书
停电放假通知
2015/04/14 职场文书
PyTorch的Debug指南
2021/05/07 Python
新手必备Python开发环境搭建教程
2021/05/28 Python
Javascript的promise,async和await的区别详解
2022/03/24 Javascript
python+pytest接口自动化之token关联登录的实现
2022/04/06 Python
Python Matplotlib绘制动画的代码详解
2022/05/30 Python
JS函数式编程实现XDM一
2022/06/16 Javascript