Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解


Posted in Python onAugust 14, 2022

1. 箱图含义

箱图是一中用于统计数据分布的统计图,也可以粗略地看出数据是否具有对称性,分布的分散程度等信息。箱图中的信息含义如下:

Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解

最下方的横线表示最小值最上方的横线表示最大值黑色空心圆圈表示异常值黑色实心圆圈表示极端值箱子由下四分位数、中值以及上四分位数组成

异常值又称离群值,指大于1.5倍的四分位数间距的值。处于1.5倍~3倍四分位数间距的值用空心圆圈表示。极端值属于异常值中的一种。
极端值是指大于3倍的四分位数间距的值。

2.计算方法

首先找出一组数据的五个特征值,包括除异常值外的最小值(minimum)和最大值(maximum)、中位数(median)、两个四分位数(上四分位数Q1和下四分位Q3数);

中位数:将所有数值从小到大排列,如果是奇数个数值则取最中间一个值作为中位数,之后最中间的值在计算Q1和Q3时不再使用偶数个数值则取最中间两个数的平均数作为中位数,这两个数在计算Q1和Q3时继续使用

Q1:中位数将所有数据分成两部分,最小值到中位数的部分按取中位数的方法取中位数作为Q1。

Q3:同Q1取法,取中位数到最大值的中位数。

IQR(四分位数间距)=Q3-Q1

所有不在(Q1-1.5IQR,Q3+1.5IQR)的区间内的数为离群值,剩下的值最大的为最大值,最小的为最小值。

特征值(从下到上):最小值、Q1、中位数、Q3、最大值

将五个数值描绘在一个图上,五个特征值在一个直线上,最小值和Q1连接起来,Q1、中位数、Q3分别作平行等长线段
然后,连接两个四分位数构成箱子。

最后连接两个极值点与箱子,形成箱式图,然后点上离群值即可。

3.绘图

3.1 绘制单个箱图

import matplotlib.pyplot as plt
import numpy as np

#生成data数据
np.random.seed(100)
data = np.random.normal(size=(1000,),loc=0,scale=1)

# 绘图
plt.boxplot(data)
plt.show()

Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解

3.2 绘制多个箱图

import matplotlib.pyplot as plt
import numpy as np

np.random.seed(100)
data = np.random.normal(size=(1000,4),loc=0,scale=1)

plt.boxplot(data)

plt.show()

Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解

3.3实战

def plt_box_iamge(df):
    """
    snrr的五个范围为[5,10)、[10,15)、[15,20)、[20,30)、[30-),按照五个snrr范围计算对应redchi的箱图
    :param df:包含snrr以及redchi的csv数据(dataFrame)。
    :return:
    """
	# 根据snrr范围对redchi进行筛选。
    df1 = df.loc[df['lam_snrr'] >= 5]
    redchi_1 = df1.loc[df1['lam_snrr'] < 10].redchi

    df2 = df.loc[df['lam_snrr'] >= 10]
    redchi_2 = df2.loc[df2['lam_snrr'] < 15].redchi

    df3 = df.loc[df['lam_snrr'] >= 15]
    redchi_3 = df3.loc[df3['lam_snrr'] < 20].redchi

    df4 = df.loc[df['lam_snrr'] >= 20]
    redchi_4 = df4.loc[df4['lam_snrr'] < 30].redchi

    redchi_5 = df.loc[df['lam_snrr'] >= 30].redchi
    # 绘图
    ax = plt.subplot()
    ax.boxplot([redchi_1, redchi_2, redchi_3, redchi_4, redchi_5])
    # 设置轴坐标值刻度的标签
    ax.set_xticklabels(['5<=snrr<10', '10<=snrr<15', '15<=snrr<20', '20<=snrr<30', '30<=snrr'], fontsize=8)
	#	保存图片 
    plt.savefig('./images/box.jpg')
    plt.show()

if __name__ == '__main__':
    df = pd.read_csv('./inputfile/lamost6w_new.csv')
    df_sc = screening(df)  # 筛选数据 (lamost数据应该在正常值范围内,不然因为数值差过大会导致绘制不出图像!)
    plt_box_iamge(df_sc)

Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解

3.3 参数详解

plt.boxplot(x,                      # x:指定要绘制箱图的数据
            notch=None,           # notch:是否是凹口的形式展现箱线图,默认非凹口
            sym=None,              # sym:指定异常点的形状,默认为+号显示
            vert=None,              # vert:是否需要将箱线图垂直摆放,默认垂直摆放
            whis=None,             # whis:指定上下须与上下四分位的距离,默认为1.5倍的四分位差
            positions=None,   # positions:指定箱线图的位置,默认为[0,1,2…]
            widths=None,         # widths:指定箱线图的宽度,默认为0.5
            patch_artist=None,        # patch_artist:是否填充箱体的颜色
            meanline=None,             # meanline:是否用线的形式表示均值,默认用点来表示
            showmeans=None,       # showmeans:是否显示均值,默认不显示
            showcaps=None,           # showcaps:是否显示箱线图顶端和末端的两条线,默认显示
            showbox=None,             # showbox:是否显示箱线图的箱体,默认显示
            showfliers=None,          # showfliers:是否显示异常值,默认显示
            boxprops=None,           # boxprops:设置箱体的属性,如边框色,填充色等
            labels=None,                  # labels:为箱线图添加标签,类似于图例的作用
            flierprops=None,          # filerprops:设置异常值的属性,如异常点的形状、大小、填充色等
            medianprops=None,   # medianprops:设置中位数的属性,如线的类型、粗细等
            meanprops=None,       # meanprops:设置均值的属性,如点的大小、颜色等
            capprops=None,           # capprops:设置箱线图顶端和末端线条的属性,如颜色、粗细等
            whiskerprops=None)   # whiskerprops:设置须的属性,如颜色、粗细、线的类型等

3.4 常用方法

import matplotlib.pyplot as plt
import numpy as np

np.random.seed(100)
data = np.random.normal(size=(1000,4),loc=0,scale=1)

ax = plt.subplot()
ax.boxplot(data)                                 # 绘图
ax.set_xlim([0,5])                               # 设置x轴值的范围  rotation=30
# ax.set_xticks()  							      # 自定义x轴的值
ax.set_xlabel("xlabel")                  # 设置x轴的标签
ax.set_xticklabels(['A','B','C','D'],  rotation=30,fontsize=10)   # 设置x轴坐标值的标签 旋转角度 字体大小
ax.set_title("xcy")       					  # 设置图像标题
ax.legend(labels= ['A','B','C','D'],loc='best',)  # 增加图例
ax.text(x=0.2 , y=3.5 , s="test" ,fontsize=12)   # 增加注

plt.show()

参考:
百度百科
matplotlib官方文档

总结 

到此这篇关于Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解的文章就介绍到这了,更多相关plt.boxplot()函数绘制箱图内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python通过colorama模块在控制台输出彩色文字的方法
Mar 19 Python
python中如何正确使用正则表达式的详细模式(Verbose mode expression)
Nov 08 Python
使用python生成杨辉三角形的示例代码
Aug 29 Python
用xpath获取指定标签下的所有text的实例
Jan 02 Python
利用python将图片版PDF转文字版PDF
May 03 Python
Python图像处理PIL各模块详细介绍(推荐)
Jul 17 Python
Python如何基于rsa模块实现非对称加密与解密
Jan 03 Python
Python使用PyQt5/PySide2编写一个极简的音乐播放器功能
Feb 07 Python
详解Python 重学requests发起请求的基本方式
Feb 07 Python
Django 设置admin后台表和App(应用)为中文名的操作方法
May 10 Python
Python sorted对list和dict排序
Jun 09 Python
Python图片处理之图片裁剪教程
May 27 Python
基于Python实现nc批量转tif格式
Aug 14 #Python
LyScript实现绕过反调试保护的示例详解
Aug 14 #Python
LeetCode189轮转数组python示例
Aug 05 #Python
python语言中pandas字符串分割str.split()函数
Aug 05 #Python
python绘制云雨图raincloud plot
Aug 05 #Python
python计算列表元素与乘积详情
Aug 05 #Python
Pygame游戏开发之太空射击实战敌人精灵篇
Aug 05 #Python
You might like
php并发对MYSQL造成压力的解决方法
2013/02/21 PHP
360通用php防护代码(使用操作详解)
2013/06/18 PHP
php通过递归方式复制目录和子目录的方法
2015/03/13 PHP
PHP使用curl函数发送Post请求的注意事项
2016/11/26 PHP
PHP curl批处理及多请求并发实现方法分析
2018/08/15 PHP
兼容ie、firefox的图片自动缩放的css跟js代码分享
2012/01/21 Javascript
把input初始值不写value的具体实现方法
2013/07/04 Javascript
JQuery操作元素的css样式
2015/03/09 Javascript
javascript点击按钮实现隐藏显示切换效果
2016/02/03 Javascript
如何解决jQuery EasyUI 已打开Tab重新加载问题
2016/12/19 Javascript
Bootstrap和Java分页实例第二篇
2016/12/23 Javascript
JavaScript正则表达式替换字符串中图片地址(img src)的方法
2017/01/13 Javascript
基于BootStrap的文本编辑器组件Summernote
2017/10/27 Javascript
vue.js element-ui validate中代码不执行问题解决方法
2017/12/18 Javascript
深入理解 webpack 文件打包机制(小结)
2018/01/08 Javascript
再谈Angular4 脏值检测(性能优化)
2018/04/23 Javascript
代码分析vue中如何配置less
2018/09/28 Javascript
vue 表单之通过v-model绑定单选按钮radio
2019/05/13 Javascript
Jquery动态列功能完整实例
2019/08/30 jQuery
python中的闭包用法实例详解
2015/05/05 Python
Python协程的用法和例子详解
2017/09/09 Python
python书籍信息爬虫实例
2018/03/19 Python
python判断文件是否存在,不存在就创建一个的实例
2019/02/18 Python
Selenium 安装和简单使用的实现
2020/12/04 Python
麦当劳印度网上订餐:McDelivery
2020/03/16 全球购物
幼儿园实习自我鉴定
2013/12/15 职场文书
工作疏忽检讨书
2014/01/25 职场文书
幼儿园庆六一游园活动方案
2014/01/29 职场文书
门前三包责任书
2014/04/15 职场文书
舞蹈兴趣小组活动总结
2014/07/07 职场文书
教育专业毕业生推荐信
2014/07/10 职场文书
见习报告格式范文
2014/11/08 职场文书
工作推荐信模板
2015/03/25 职场文书
自主招生英文自荐信
2015/03/25 职场文书
少年犯观后感
2015/06/11 职场文书
Win11 Build 22000.51版本文件资源管理器“命令栏”和上下文菜单有什么新变化?
2021/11/21 数码科技