Python箱型图处理离群点的例子


Posted in Python onDecember 09, 2019

首先我们简单地区分一下离群点(outlier)以及异常值(anomaly):

离群点:

Python箱型图处理离群点的例子

异常值:

个人觉着异常值和离群点是两个不同的概念,当然大家在数据预处理时对于这两个概念不做细致的区分,不如:姚明站在我们中间的时候,我觉着我们只能说他是一个离群点,我们能说他异常吗?异常的假设是姚明得了巨人症,可是他不是。

箱型图

Python箱型图处理离群点的例子

Python箱型图处理离群点的例子

代码块

餐饮销售数据离群点检测代码:

#-*- coding: utf-8 -*-
import pandas as pd

catering_sale = '../data/catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = u'日期') #读取数据,指定“日期”列为索引列

import matplotlib.pyplot as plt #导入图像库
plt.rcParams['font.sans-serif'] = ['SimHei'] #用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False #用来正常显示负号

plt.figure() #建立图像
p = data.boxplot(return_type='dict') #画箱线图,直接使用DataFrame的方法
x = p['fliers'][0].get_xdata() # 'fliers'即为离群点的标签
y = p['fliers'][0].get_ydata()
y.sort() #从小到大排序,该方法直接改变原对象

#用annotate添加注释
#其中有些相近的点,注解会出现重叠,难以看清,需要一些技巧来控制。
#以下参数都是经过调试的,需要具体问题具体调试。
for i in range(len(x)): 
 if i > 0:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i]))
 else:
  plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i]))

plt.show() #展示箱线图

运行结果:

Python箱型图处理离群点的例子

以上这篇Python箱型图处理离群点的例子就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python正则表达式介绍
Aug 06 Python
Python自定义函数的创建、调用和函数的参数详解
Mar 11 Python
理解python正则表达式
Jan 15 Python
python 拷贝特定后缀名文件,并保留原始目录结构的实例
Apr 27 Python
利用pandas将numpy数组导出生成excel的实例
Jun 14 Python
基于Python List的赋值方法
Jun 23 Python
使用urllib库的urlretrieve()方法下载网络文件到本地的方法
Dec 19 Python
Python参数解析模块sys、getopt、argparse使用与对比分析
Apr 02 Python
Django如何在不停机的情况下创建索引
Aug 02 Python
python 监控logcat关键字功能
Sep 04 Python
使用python画出逻辑斯蒂映射(logistic map)中的分叉图案例
Dec 11 Python
python 写一个水果忍者游戏
Jan 13 Python
Python实现非正太分布的异常值检测方式
Dec 09 #Python
python 实现检验33品种数据是否是正态分布
Dec 09 #Python
Python远程开发环境部署与调试过程图解
Dec 09 #Python
使用 Python 合并多个格式一致的 Excel 文件(推荐)
Dec 09 #Python
Python udp网络程序实现发送、接收数据功能示例
Dec 09 #Python
python3 tcp的粘包现象和解决办法解析
Dec 09 #Python
python绘制规则网络图形实例
Dec 09 #Python
You might like
解决PHP mysql_query执行超时(Fatal error: Maximum execution time …)
2013/07/03 PHP
php字符串过滤与替换小结
2015/01/26 PHP
php实现的微信红包算法分析(非官方)
2015/09/25 PHP
WordPress特定文章对搜索引擎隐藏或只允许搜索引擎查看
2015/12/31 PHP
学习ExtJS Column布局
2009/10/08 Javascript
javaScript array(数组)使用字符串作为数组下标的方法
2013/11/19 Javascript
jquery动态改变form属性提交表单
2014/06/03 Javascript
JS脚本根据手机浏览器类型跳转WAP手机网站(两种方式)
2015/08/04 Javascript
js文本框走动跑马灯效果代码分享
2015/08/25 Javascript
ThinkPHP+jquery实现“加载更多”功能代码
2017/03/11 Javascript
Angular实现一个简单的多选复选框的弹出框指令实例
2017/04/25 Javascript
react实现菜单权限控制的方法
2017/12/11 Javascript
vue中$set的使用(结合在实际应用中遇到的坑)
2018/07/10 Javascript
微信小程序实现图片滚动效果示例
2018/12/05 Javascript
layui在form表单页面通过Validform加入简单验证的方法
2019/09/06 Javascript
Python导出数据到Excel可读取的CSV文件的方法
2015/05/12 Python
python print 按逗号或空格分隔的方法
2018/05/02 Python
python创建文件备份的脚本
2018/09/11 Python
Python高级特性切片(Slice)操作详解
2018/09/27 Python
python计算无向图节点度的实例代码
2019/11/22 Python
在keras中获取某一层上的feature map实例
2020/01/24 Python
解决pyecharts运行后产生的html文件用浏览器打开空白
2020/03/11 Python
python和js交互调用的方法
2020/06/23 Python
纯CSS3实现自定义Tooltip边框涂鸦风格的教程
2014/11/05 HTML / CSS
详解CSS3中强大的filter(滤镜)属性
2017/06/29 HTML / CSS
一张图片能隐含千言万语之隐藏你的程序代码
2012/12/13 HTML / CSS
英国家庭、花园、汽车和移动解决方案:Easylife Group
2018/05/23 全球购物
英国最大的专业户外零售商:Mountain Warehouse
2018/06/06 全球购物
c++工程师面试问题
2013/08/04 面试题
数控技术应届生求职信
2013/11/13 职场文书
工业自动化毕业生自荐信范文
2014/01/04 职场文书
2014年秘书工作总结
2014/11/25 职场文书
2014业务员年终工作总结
2014/12/09 职场文书
2015年妇幼卫生工作总结
2015/05/23 职场文书
TS 类型收窄教程示例详解
2022/09/23 Javascript