Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python脚本将文字转换为图片的实例分享
Aug 29 Python
Python调用SQLPlus来操作和解析Oracle数据库的方法
Apr 09 Python
Python 两个列表的差集、并集和交集实现代码
Sep 21 Python
Python网络编程之TCP套接字简单用法示例
Apr 09 Python
python 实现在txt指定行追加文本的方法
Apr 29 Python
python 实现矩阵上下/左右翻转,转置的示例
Jan 23 Python
Python3.5 Pandas模块之Series用法实例分析
Apr 23 Python
Python使用grequests(gevent+requests)并发发送请求过程解析
Sep 25 Python
导入tensorflow时报错:cannot import name 'abs'的解决
Oct 10 Python
Python3读取和写入excel表格数据的示例代码
Jun 09 Python
如何用Matlab和Python读取Netcdf文件
Feb 19 Python
pytorch实现手写数字图片识别
May 20 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
PHP脚本数据库功能详解(下)
2006/10/09 PHP
php array_map()数组函数使用说明
2011/07/12 PHP
基于PHP给大家讲解防刷票的一些技巧
2015/11/18 PHP
yii权限控制的方法(三种方法)
2015/12/28 PHP
基于jquery的$.ajax async使用
2011/10/19 Javascript
Javascript模块化编程(一)模块的写法最佳实践
2013/01/17 Javascript
JavaScript动态创建div属性和样式示例代码
2013/10/09 Javascript
js创建对象的区别示例介绍
2014/07/24 Javascript
jQuery实现渐变弹出层和弹出菜单的方法
2015/02/20 Javascript
原生Js实现简易烟花爆炸效果的方法
2015/03/20 Javascript
jquery实现图片水平滚动效果代码分享
2015/08/26 Javascript
jQuery实现伪分页的方法分享
2016/02/17 Javascript
JavaScript获取图片像素颜色并转换为box-shadow显示
2016/03/11 Javascript
Javascript将双字节字符转换成单字节字符并计算长度
2016/06/22 Javascript
Select下拉框模糊查询功能实现代码
2016/07/22 Javascript
深入浅析search 搜索框的写法
2016/08/02 Javascript
JavaScript数据结构之二叉树的查找算法示例
2017/04/13 Javascript
简单实现vue验证码60秒倒计时功能
2017/10/11 Javascript
使用Node搭建reactSSR服务端渲染架构
2018/08/30 Javascript
Vue事件处理原理及过程详解
2020/03/11 Javascript
使用js和canvas实现时钟效果
2020/09/08 Javascript
Vant+postcss-pxtorem 实现浏览器适配功能
2021/02/05 Javascript
[04:11]DOTA2亚洲邀请赛小组赛第一日 TOP10精彩集锦
2015/01/30 DOTA
python在windows下创建隐藏窗口子进程的方法
2015/06/04 Python
Python cookbook(数据结构与算法)从任意长度的可迭代对象中分解元素操作示例
2018/02/13 Python
python解决js文件utf-8编码乱码问题(推荐)
2018/05/02 Python
Python 比较文本相似性的方法(difflib,Levenshtein)
2018/10/15 Python
python买卖股票的最佳时机(基于贪心/蛮力算法)
2019/07/05 Python
Python实现常见的几种加密算法(MD5,SHA-1,HMAC,DES/AES,RSA和ECC)
2020/05/09 Python
Holland & Barrett爱尔兰:英国领先的健康零售商
2019/03/31 全球购物
信息技术专业个人自我评价
2013/12/11 职场文书
自荐信需注意事项
2014/01/25 职场文书
股东协议书范本
2014/04/14 职场文书
第一批党的群众路线教育实践活动总结报告
2014/07/03 职场文书
朋友圈早安励志语录!
2019/07/08 职场文书
利用正则表达式匹配浮点型数据
2022/05/30 Java/Android