Python数据可视化之Seaborn的安装及使用


Posted in Python onApril 19, 2022

1. 安装 seaborn

安装:

pip install seaborn

导入:

import seaborn as sns

2.准备数据

正式开始之前我们先用如下代码准备一组数据,方便展示使用。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
pd.set_option('display.unicode.east_asian_width', True)

df1 = pd.DataFrame(
    {'数据序号': [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12],
     '厂商编号': ['001', '001', '001', '002', '002', '002', '003', '003', '003', '004', '004', '004'],
     '产品类型': ['AAA', 'BBB', 'CCC', 'AAA', 'BBB', 'CCC', 'AAA', 'BBB', 'CCC', 'AAA', 'BBB', 'CCC'],
     'A属性值': [40, 70, 60, 75, 90, 82, 73, 99, 125, 105, 137, 120],
     'B属性值': [24, 36, 52, 32, 49, 68, 77, 90, 74, 88, 98, 99],
     'C属性值': [30, 36, 55, 46, 68, 77, 72, 89, 99, 90, 115, 101]
    }
)
print(df1)

生成一组数据如下:

Python数据可视化之Seaborn的安装及使用

3.背景与边框

3.1 设置背景风格

设置风格使用的是sns.set_style()方法,且这里内置的风格,是用背景色表示名字的,但是实际内容不限于背景色。

sns.set_style()

可以选择的背景风格有:

  • whitegrid  白色网格
  • dark  灰色背景
  • white  白色背景
  • ticks  四周带刻度线的白色背景

sns.set()
sns.set_style(“darkgrid”)
sns.set_style(“whitegrid”)
sns.set_style(“dark”)
sns.set_style(“white”)
sns.set_style(“ticks”) 

其中sns.set()表示使用自定义样式,如果没有传入参数,则默认表示灰色网格背景风格。如果没有set()也没有set_style(),则为白色背景。

一个可能的bug:使用relplot()方法绘制出的图像,"ticks"样式无效。

3.2 其他

seaborn库是基于matplotlib库而封装的,其封装好的风格可以更加方便我们的绘图工作。而matplotlib库常用的语句,在使用seaborn库时也依然有效。

关于设置其他风格相关的属性,如字体,这里有一个细节需要注意的是,这些代码必须写在sns.set_style()的后方才有效。如将字体设置为黑体(避免中文乱码)的代码: 

plt.rcParams[‘font.sans-serif’] = [‘SimHei’]

如果在其后方设置风格,则设置好的字体会设置的风格覆盖,从而产生警告。其他属性也同理。

3.3 边框控制

sns.despine()方法

# 移除顶部和右部边框,只保留左边框和下边框
sns.despine()

# 使两个坐标轴相隔一段距离(以10长度为例)
sns.despine(offet=10,trim=True)

# 移除左边框
sns.despine(left=True)

# 移除指定边框 (以只保留底部边框为例)
sns.despine(fig=None, ax=None, top=True, right=True, left=True, bottom=False, offset=None, trim=False)

4. 绘制 散点图

使用seaborn库 绘制散点图,可以使用replot()方法,也可以使用scatter()方法。

replot方法的参数kind默认是’scatter’,表示绘制散点图。

hue参数表示 在该一维度上,用颜色区分

①对A属性值和数据序号绘制散点图,红色散点,灰色网格,保留左、下边框

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘SimHei']
sns.relplot(x=‘数据序号', y=‘A属性值', data=df1, color=‘red')
plt.show()

Python数据可视化之Seaborn的安装及使用

②对A属性值和数据序号绘制散点图,散点根据产品类型的不同显示不同的颜色,

白色网格,左、下边框:

sns.set_style(‘whitegrid')
plt.rcParams[‘font.sans-serif'] = [‘SimHei']
sns.relplot(x=‘数据序号', y=‘A属性值', hue=‘产品类型', data=df1)
plt.show()

Python数据可视化之Seaborn的安装及使用

③将A属性、B属性、C属性三个字段的值用不同的样式绘制在同一张图上(绘制散点图),x轴数据是[0,2,4,6,8…]

ticks风格(四个方向的框线都要),字体使用楷体

sns.set_style(‘ticks')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
df2 = df1.copy()
df2.index = list(range(0, len(df2)*2, 2))
dfs = [df2[‘A属性值'], df2[‘B属性值'], df2[‘C属性值']]
sns.scatterplot(data=dfs)
plt.show()

Python数据可视化之Seaborn的安装及使用

5. 绘制 折线图

使用seaborn库绘制折线图, 可以使用replot()方法,也可以使用lineplot()方法。

5.1 使用 replot()方法

sns.replot()默认绘制的是散点图,绘制折线图只需吧参数kind改为"line"。

①需求:绘制A属性值与数据序号的折线图,

灰色网格,全局字体为楷体;并调整标题、两轴标签 的字体大小,

以及坐标系与画布边缘的距离(设置该距离是因为字体没有显示完全):

sns.set(rc={‘font.sans-serif': “STKAITI”})
sns.relplot(x=‘数据序号', y=‘A属性值', data=df1, color=‘purple', kind=‘line')
plt.title(“绘制折线图”, fontsize=18)
plt.xlabel(‘num', fontsize=18)
plt.ylabel(‘A属性值', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

②需求:绘制不同产品类型的A属性折线(三条线一张图),whitegrid风格,字体楷体。

sns.set_style(“whitegrid”)
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.relplot(x=‘数据序号', y=‘A属性值', hue=‘产品类型', data=df1, kind=‘line')
plt.title(“绘制折线图”, fontsize=18)
plt.xlabel(‘num', fontsize=18)
plt.ylabel(‘A属性值', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

③需求:将A属性、B属性、C属性三个字段的值用不同的样式绘制在同一张图上(绘制折线图),x轴数据是[0,2,4,6,8…]

darkgrid风格(四个方向的框线都要),字体使用楷体,并加入x轴标签,y轴标签和标题。边缘距离合适。

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
df2 = df1.copy()
df2.index = list(range(0, len(df2)*2, 2))
dfs = [df2[‘A属性值'], df2[‘B属性值'], df2[‘C属性值']]
sns.relplot(data=dfs, kind=“line”)
plt.title(“绘制折线图”, fontsize=18)
plt.xlabel(‘num', fontsize=18)
plt.ylabel(‘A属性值', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

③多重子图

横向多重子图 col

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.relplot(data=df1, x=“A属性值”, y=“B属性值”, kind=“line”, col=“厂商编号”)
plt.subplots_adjust(left=0.05, right=0.95, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

纵向多重子图 row

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.relplot(data=df1, x=“A属性值”, y=“B属性值”, kind=“line”, row=“厂商编号”)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.95)
plt.show()

Python数据可视化之Seaborn的安装及使用

5.2 使用 lineplot()方法

使用lineplot()方法绘制折线图,其他细节基本同上,示例代码如下:

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.lineplot(x=‘数据序号', y=‘A属性值', data=df1, color=‘purple')
plt.title(“绘制折线图”, fontsize=18)
plt.xlabel(‘num', fontsize=18)
plt.ylabel(‘A属性值', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
df2 = df1.copy()
df2.index = list(range(0, len(df2)*2, 2))
dfs = [df2[‘A属性值'], df2[‘B属性值'], df2[‘C属性值']]
sns.lineplot(data=dfs)
plt.title(“绘制折线图”, fontsize=18)
plt.xlabel(‘num', fontsize=18)
plt.ylabel(‘A属性值', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

6. 绘制直方图 displot()

绘制直方图使用的是sns.displot()方法

  • bins=6 表示 分成六个区间绘图
  • rug=True 表示在x轴上显示观测的小细条
  • kde=True表示显示核密度曲线
sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.displot(data=df1[[‘C属性值']], bins=6, rug=True, kde=True)
plt.title(“直方图”, fontsize=18)
plt.xlabel(‘C属性值', fontsize=18)
plt.ylabel(‘数量', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

随机生成300个正态分布数据,并绘制直方图,显示核密度曲线

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
np.random.seed(13)
Y = np.random.randn(300)
sns.displot(Y, bins=9, rug=True, kde=True)
plt.title(“直方图”, fontsize=18)
plt.xlabel(‘C属性值', fontsize=18)
plt.ylabel(‘数量', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.1, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

7. 绘制条形图 barplot()

绘制条形图使用的是barplot()方法

以产品类型 字段数据作为x轴数据,A属性值数据作为y轴数据。按照厂商编号字段的不同进行分类。

具体如下:

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.barplot(x=“产品类型”, y=‘A属性值', hue=“厂商编号”, data=df1)
plt.title(“条形图”, fontsize=18)
plt.xlabel(‘产品类型', fontsize=18)
plt.ylabel(‘数量', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.15, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

8. 绘制线性回归模型

绘制线性回归模型使用的是lmplot()方法。

主要的参数为x, y, data。分别表示x轴数据、y轴数据和数据集数据。

除此之外,同上述所讲,还可以通过hue指定分类的变量;

通过col指定列分类变量,以绘制 横向多重子图;

通过row指定行分类变量,以绘制 纵向多重子图;

通过col_wrap控制每行子图的数量;

通过size可以控制子图的高度;

通过markers可以控制点的形状。

下边对 X属性值 和 Y属性值 做线性回归,代码如下:

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.lmplot(x=“A属性值”, y=‘B属性值', data=df1)
plt.title(“线性回归模型”, fontsize=18)
plt.xlabel(‘A属性值', fontsize=18)
plt.ylabel(‘B属性值', fontsize=16)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.15, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

9. 绘制 核密度图 kdeplot()

9.1 一般核密度图

绘制和密度图,可以让我们更直观地看出样本数据的分布特征。绘制核密度图使用的方法是kdeplot()方法。

对A属性值和B属性值绘制核密度图,

将shade设置为True可以显示包围的阴影,否则只有线条。

sns.set_style(‘darkgrid')
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.kdeplot(df1[“A属性值”], shade=True, data=df1, color=‘r')
sns.kdeplot(df1[“B属性值”], shade=True, data=df1, color=‘g')
plt.title(“核密度图”, fontsize=18)
plt.xlabel(‘Value', fontsize=18)
plt.subplots_adjust(left=0.15, right=0.9, bottom=0.15, top=0.9)
plt.show()

Python数据可视化之Seaborn的安装及使用

9.2 边际核密度图

绘制边际核密度图时使用的是sns.jointplot()方法。参数kind应为"kde"。使用该方法时,默认使用的是dark样式。且不建议手动添加其他样式,否则可能使图像无法正常显示。

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.jointplot(x=df1[“A属性值”], y=df1[“B属性值”], kind=“kde”, space=0)
plt.show()

Python数据可视化之Seaborn的安装及使用

10. 绘制 箱线图 boxplot()

绘制箱线图使用到的是boxplot()方法。

基本的参数有x, y, data。

除此之外 还可以有

hue 表示分类字段

width 可以调节箱体的宽度

notch 表示中间箱体是否显示缺口,默认False不显示。

鉴于前边的数据数据量不太够不便展示,这里再生成一组数据:

np.random.seed(13)
Y = np.random.randint(20, 150, 360)
df2 = pd.DataFrame(
{‘厂商编号': [‘001', ‘001', ‘001', ‘002', ‘002', ‘002', ‘003', ‘003', ‘003', ‘004', ‘004', ‘004'] * 30,
‘产品类型': [‘AAA', ‘BBB', ‘CCC', ‘AAA', ‘BBB', ‘CCC', ‘AAA', ‘BBB', ‘CCC', ‘AAA', ‘BBB', ‘CCC'] * 30,
‘XXX属性值': Y
}
)

生成好后,开始绘制箱线图:

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.boxplot(x=‘产品类型', y=‘XXX属性值', data=df2)
plt.show()

Python数据可视化之Seaborn的安装及使用

交换x、y轴数据后:

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.boxplot(y=‘产品类型', x=‘XXX属性值', data=df2)
plt.show()

可以看到箱线图的方向也随之改变

Python数据可视化之Seaborn的安装及使用

将厂商编号作为分类字段:

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.boxplot(x=‘产品类型', y=‘XXX属性值', data=df2, hue=“厂商编号”)
plt.show()

Python数据可视化之Seaborn的安装及使用

11. 绘制 提琴图 violinplot()

提琴图结合了箱线图和核密度图的特征,用于展示数据的分布形状。

使用violinplot()方法绘制提琴图。

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.violinplot(x=‘产品类型', y=‘XXX属性值', data=df2)
plt.show()

Python数据可视化之Seaborn的安装及使用

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.violinplot(x=‘XXX属性值', y=‘产品类型', data=df2)
plt.show()

Python数据可视化之Seaborn的安装及使用

plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
sns.violinplot(x=‘产品类型', y=‘XXX属性值', data=df2, hue=“厂商编号”)
plt.show()

Python数据可视化之Seaborn的安装及使用

12. 绘制 热力图 heatmap()

以双色球中奖号码数据为例绘制热力图,这里数据采用随机数生成。

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
 
sns.set()
plt.figure(figsize=(6,6))
plt.rcParams[‘font.sans-serif'] = [‘STKAITI']
 
s1 = np.random.randint(0, 200, 33)
s2 = np.random.randint(0, 200, 33)
s3 = np.random.randint(0, 200, 33)
s4 = np.random.randint(0, 200, 33)
s5 = np.random.randint(0, 200, 33)
s6 = np.random.randint(0, 200, 33)
s7 = np.random.randint(0, 200, 33)
data = pd.DataFrame(
{‘一': s1,
‘二': s2,
‘三': s3,
‘四':s4,
‘五':s5,
‘六':s6,
‘七':s7
}
)
 
plt.title(‘双色球热力图')
sns.heatmap(data, annot=True, fmt=‘d', lw=0.5)
plt.xlabel(‘中奖号码位数')
plt.ylabel(‘双色球数字')
x = [‘第1位', ‘第2位', ‘第3位', ‘第4位', ‘第5位', ‘第6位', ‘第7位']
plt.xticks(range(0, 7, 1), x, ha=‘left')
plt.show()

Python数据可视化之Seaborn的安装及使用

到此这篇关于Python数据可视化之Seaborn的使用详解的文章就介绍到这了!

Python 相关文章推荐
python结合API实现即时天气信息
Jan 19 Python
Python实现简单的多任务mysql转xml的方法
Feb 08 Python
Python爬虫之模拟知乎登录的方法教程
May 25 Python
python如何把嵌套列表转变成普通列表
Mar 20 Python
Python基础教程之利用期物处理并发
Mar 29 Python
python接口自动化测试之接口数据依赖的实现方法
Apr 26 Python
用python打印菱形的实操方法和代码
Jun 25 Python
MNIST数据集转化为二维图片的实现示例
Jan 10 Python
python+selenium 脚本实现每天自动登记的思路详解
Mar 11 Python
python 字符串的驻留机制及优缺点
Jun 19 Python
python+requests实现接口测试的完整步骤
Oct 27 Python
python热力图实现的完整实例
Jun 25 Python
python 闭包函数详细介绍
Apr 19 #Python
Python  lambda匿名函数和三元运算符
Apr 19 #Python
Python使用mitmproxy工具监控手机 下载手机小视频
使用Python通过企业微信应用给企业成员发消息
Python用any()函数检查字符串中的字母以及如何使用all()函数
Apr 14 #Python
python在package下继续嵌套一个package
Apr 14 #Python
Github 使用python对copilot做些简单使用测试
You might like
?算你??的 PHP 程式大小
2006/12/06 PHP
PHP批量生成缩略图的代码
2008/07/19 PHP
ThinkPHP模板判断输出Present标签用法详解
2014/06/30 PHP
PHP针对redis常用操作实例详解
2019/08/17 PHP
JavaScript中“过于”犀利地for/in循环使用示例
2013/10/22 Javascript
使用纯javascript实现放大镜效果
2015/03/18 Javascript
js实时获取并显示当前时间的方法
2015/07/31 Javascript
关于JS中的方法是否加括号的问题
2016/07/27 Javascript
JS定时器实现数值从0到10来回变化
2016/12/09 Javascript
JS实现向iframe中表单传值的方法
2017/03/24 Javascript
Vue.js递归组件构建树形菜单
2017/12/24 Javascript
在vue中使用G2图表的示例代码
2019/03/19 Javascript
Node 搭建一个静态资源服务器的实现
2019/05/20 Javascript
[52:12]FNATIC vs Infamous 2019国际邀请赛小组赛 BO2 第一场 8.16
2019/08/19 DOTA
[01:32]TI珍贵瞬间系列(一)
2020/08/26 DOTA
python3生成随机数实例
2014/10/20 Python
Python编程中的反模式实例分析
2014/12/08 Python
使用Python编写一个最基础的代码解释器的要点解析
2016/07/12 Python
python操作 hbase 数据的方法
2016/12/18 Python
Python实现句子翻译功能
2017/11/14 Python
浅谈Python使用Bottle来提供一个简单的web服务
2017/12/27 Python
python 用lambda函数替换for循环的方法
2018/06/09 Python
解决python 3 urllib 没有 urlencode 属性的问题
2019/08/22 Python
python中os.remove()用法及注意事项
2021/01/31 Python
New Balance英国官方网站:始于1906年,百年慢跑品牌
2016/12/07 全球购物
安全宣传标语口号
2014/06/06 职场文书
2014学校领导四风对照检查材料思想汇报
2014/09/23 职场文书
2014年保卫科工作总结
2014/12/05 职场文书
2014小学一年级班主任工作总结
2014/12/05 职场文书
公务员学习中国梦心得体会
2016/01/05 职场文书
三严三实学习心得体会(精选N篇)
2016/01/05 职场文书
教师学习心得体会范文
2016/01/21 职场文书
python 如何将两个实数矩阵合并为一个复数矩阵
2021/05/19 Python
MySql分区类型及创建分区的方法
2022/04/13 MySQL
Oracle用户管理及赋权
2022/04/24 Oracle
Go Grpc Gateway兼容HTTP协议文档自动生成网关
2022/06/16 Golang