Python数据可视化库seaborn的使用总结


Posted in Python onJanuary 15, 2019

seaborn是python中的一个非常强大的数据可视化库,它集成了matplotlib,下图为seaborn的官网,如果遇到疑惑的地方可以到官网查看。http://seaborn.pydata.org/

Python数据可视化库seaborn的使用总结

从官网的主页我们就可以看出,seaborn在数据可视化上真的非常强大。

1.首先我们还是需要先引入库,不过这次要用到的python库比较多。

import numpy as np
import pandas as pd
import matplotlib as mpl
import matplotlib.pyplot as plt
import seaborn as sns

2.sns.set_style():不传入参数用的就是seaborn默认的主题风格,里面的参数共有五种

  • darkgrid
  • whitegrid
  • dark
  • white
  • ticks

我比较习惯用whitegrid。

Python数据可视化库seaborn的使用总结

3.下面说一下seaborn里面的调色板,我们可以用sns.color_palette()获取到这些颜色,然后用sns.palplot()将这些色块打印出来。color_palette()函数还可以传入一些参数

sns.palplot(sns.color_palette("hls",n))#显示出n个不同颜色的色块
sns.palplot(sns.color_palette("Paired",2n))#显示出2n个不同颜色的色块,且这些颜色两两之间是相近的
sns.palplot(sns.color_palette("color"))#由浅入深显示出同一颜色的色块
sns.palplot(sns.color_palette("color_r"))##由深入浅显示出同一颜色的色块
sns.palplot(sns.color_palette("cubehelix",n))#显示出n个颜色呈线性变化的色块
sns.palplot(sns.cubehelix_palette(k,start=m,rot=n))#显示出k个start(0,3)为m,rot(-1,1)为n的呈线性变化的色块
sns.palplot(sns.light_palette("color"))#将一种颜色由浅到深显示
sns.palplot(sns.dark_palette("color"))#将一种颜色由深到浅显示
sns.palplot(sns.dark_palette("color",reverse=bool))#reverse的值为False,则将一种颜色由深到浅显示;若为True,则将一种颜色由浅到深显示

Python数据可视化库seaborn的使用总结

Python数据可视化库seaborn的使用总结

Python数据可视化库seaborn的使用总结

4.sns.kdeplot(x,y,cmap=pal):绘制核密度分布图。

Python数据可视化库seaborn的使用总结

5.sns.distplot(x,kde=bool,bins=n):kde代表是否进行核密度估计,也就是是否绘制包络线,bins指定绘制的条形数目。

Python数据可视化库seaborn的使用总结

6.根据均值和协方差绘图:

首先我们要根据均值和协方差获取数据

mean,cov = [m,n],[(a,b),(c,d)]#指定均值和协方差
data = np.random.multivariate_normal(mean,cov,e)#根据均值和协方差获取e个随机数据
df = pd.DataFrame(data,columns=["x","y"])#将数据指定为DataFrame格式
df

Python数据可视化库seaborn的使用总结

然后绘制图像

sns.jointplot(x="x",y="y",data=df) #绘制散点图

Python数据可视化库seaborn的使用总结

sns.jointplot(x="x",y="y",data=df)可以绘制出x和y单变量的条形图以及x与y多变量的散点图。

7.在jointplot()函数中传入kind=“hex”,能够在数据量比较大时让我们更清晰地看到数据的分布比重。

x,y = np.random.multivariate_normal(mean,cov,2000).T
with sns.axes_style("white"):
  sns.jointplot(x=x,y=y,kind="hex",color="c")

绘制出的图像如下

Python数据可视化库seaborn的使用总结

8.sns.pairplot(df):绘制出各变量之间的散点图与条形图,且对角线均为条形图。

Python数据可视化库seaborn的使用总结

在这里我们可以先使用df = sns.load_dataset("")将seaborn中原本带有的数据读入或用pandas读取。

9.绘制回归分析图:这里可以用两个函数regplot()lmplot(),用regplot()更好一些。

Python数据可视化库seaborn的使用总结

如果两个变量不适合做回归分析,我们可以传入x_jitter()y_jitter()让x轴或y轴的数据轻微抖动一些,得出较为准确的结果。

Python数据可视化库seaborn的使用总结

10.sns.stripplot(x="",y="",data=df,jitter=bool):绘制一个特征变量中的多个变量与另一变量关系的散点图,jitter控制数据是否抖动。

Python数据可视化库seaborn的使用总结

11.sns.swarmplot(x="",y="",hue="",data=df):绘制页状散点图,hue指定对数据的分类,由于在大量数据下,上面的散点图会影响到我们对数据的观察,这种图能够更清晰地观察到数据分布。

Python数据可视化库seaborn的使用总结

Python数据可视化库seaborn的使用总结

12.sns.boxplot(x="",y="",hue="",data=df,orient="h"):绘制盒形图,hue同样指定对数据的分类。在统计学中有四分位数的概念,第一个四分位记做Q1,第二个四分位数记做Q2,第三个四分位数记做Q3,Q3-Q1得到的结果Q叫做四分位距,如果一个数n,n的范围是n<Q1-1.5Q或n>Q3+1.5Q,则称n为离群点,也就是不符合数据规范的点,利用盒形图可以很清晰地观察到离群点。如果传入orient则画出的盒形图是横向的。

Python数据可视化库seaborn的使用总结

13.sns.violinplot(x="",y="",data=df,hue="",split=bool):绘制小提琴图,split表示是否将两类数据分开绘制,如果为True,则不分开绘制,默认为False。

Python数据可视化库seaborn的使用总结

Python数据可视化库seaborn的使用总结

14.还可以将页状散点图和小提琴图在一起绘制,只需将两个绘图命令

Python数据可视化库seaborn的使用总结

inner="None"表示去除小提琴图内部的形状。

15.sns.barplot(x="",y="",hue="",data=df):按hue的数据分类绘制条形图。

Python数据可视化库seaborn的使用总结

16.sns.pointplot(x="",y="",hue="",data=df):绘制点图,点图可以更好的描述数据的变化差异。

Python数据可视化库seaborn的使用总结

17.我们还可以传入其他参数:

sns.pointplot(x="class",y="survived",hue="sex",data=titanic,
       palette={"male":"#02ff96","female":"#0980e6"},#指定曲线的颜色
       markers=["s","d"],linestyles=["-","-."])#指定曲线的点型和线型

绘制出的图像如下

Python数据可视化库seaborn的使用总结

18.sns.factorplot(x="", y="", hue="", data=df):绘制多层面板分类图。

sns.factorplot(x="day",y="total_bill",hue="smoker",data=tips)

绘制的图像如下

Python数据可视化库seaborn的使用总结

19.sns.factorplot(x="",y="",hue="",data=df,kind=""):kind中指定要画图的类型。

sns.factorplot(x="day",y="total_bill",hue="smoker",data=tips,kind="bar")

Python数据可视化库seaborn的使用总结

sns.factorplot(x="day",y="total_bill",hue="smoker",col="time",data=tips,kind="swarm")

Python数据可视化库seaborn的使用总结

sns.factorplot(x="time",y="total_bill",hue="smoker",col="day",data=tips,kind="box",size=5,aspect=0.8) #aspect指定横纵比

Python数据可视化库seaborn的使用总结

20.sns.factorplot()的参数:

  • x,y,hue 数据集变量 变量名。
  • date 数据集 数据集名。
  • row,col 更多分类变量进行平铺显示 变量名。
  • col_wrap 每行的最高平铺数 整数。
  • estimator 在每个分类中进行矢量到标量的映射 矢量。
  • ci 置信区间 浮点数或None。
  • n_boot 计算置信区间时使用的引导迭代次数 整数。
  • units 采样单元的标识符,用于执行多级引导和重复测量设计 数据变量或向量数据。
  • order, hue_order 对应排序列表 字符串列表。
  • row_order, col_order 对应排序列表 字符串列表。
  • kind : 可选:point 默认, bar 柱形图, count 频次, box 箱体, violin 提琴, strip 散点,swarm 分散点 size 每个面的高度(英寸) 标量 aspect 纵横比 标量 orient 方向 "v"/"h" color 颜色 matplotlib颜色 palette 调色板 seaborn颜色色板或字典 legend hue的信息面板 True/False legend_out 是否扩展图形,并将信息框绘制在中心右边 True/False share{x,y} 共享轴线 True/False。

21.sns.FacetGrid():这是一个很重要的绘图函数。

g = sns.FacetGrid(tips,col="time")
g.map(plt.hist,"tip")

Python数据可视化库seaborn的使用总结

g = sns.FacetGrid(tips,col="sex",hue="smoker",size=5,aspect=1)
g.map(plt.scatter,"total_bill","tip",alpha=0.3,s=100)#alpha指定点的透明度,s指定点的大小
g.add_legend()#添加图例

Python数据可视化库seaborn的使用总结

g = sns.FacetGrid(tips,col="day",size=4,aspect=0.8)
g.map(sns.barplot,"sex","total_bill")

Python数据可视化库seaborn的使用总结

22.sns.PairGrid():将各变量间的关系成对绘制。

iris = sns.load_dataset("iris")
g = sns.PairGrid(iris)
g.map(plt.scatter)

Python数据可视化库seaborn的使用总结

23.g.map_diag()g.map_offdiag():绘制对角线和非对角线的图形

g = sns.PairGrid(iris)
g.map_diag(plt.hist)  #指定对角线绘图类型
g.map_offdiag(plt.scatter)  #指定非对角线绘图类型

Python数据可视化库seaborn的使用总结

g = sns.PairGrid(iris, hue="species")
g.map_diag(plt.hist)
g.map_offdiag(plt.scatter)
g.add_legend()

Python数据可视化库seaborn的使用总结

g = sns.PairGrid(iris, vars=["sepal_length", "sepal_width"], hue="species",size=3)
g.map(plt.scatter)

Python数据可视化库seaborn的使用总结

g = sns.PairGrid(tips, hue="size", palette="GnBu_d")
g.map(plt.scatter, s=50, edgecolor="white")
g.add_legend()

Python数据可视化库seaborn的使用总结

24.sns.heatmap():绘制热度图,热度图可以很清楚看到数据的变化情况以及变化过程中的最大值和最小值。

uniform_data = np.random.rand(3, 3)
print (uniform_data)
heatmap = sns.heatmap(uniform_data)

Python数据可视化库seaborn的使用总结

25.向heatmap()中传入参数vmin=vmax=

ax = sns.heatmap(uniform_data,vmin=0.2,vmax=0.5) 
#超过最大值都是最大值的颜色,小于最小值都是最小值的颜色

Python数据可视化库seaborn的使用总结

26.

normal_data = np.random.randn(3, 3)
print (normal_data)
ax = sns.heatmap(normal_data, center=0)  #center指定右侧图例的中心值

Python数据可视化库seaborn的使用总结

27.

flights = sns.load_dataset("flights")
flights = flights.pivot("month", "year", "passengers")
ax = sns.heatmap(flights, annot=True,fmt="d",linewidth=0.5)  
#annot指定是否显示数据,fmt指定数据的显示格式,linewidth指定数据格子间的距离

Python数据可视化库seaborn的使用总结

28.

ax = sns.heatmap(flights, cmap="YlGnBu",cbar=True) 
#cmap指定图形颜色,cbar表示是否绘制右侧图例。

Python数据可视化库seaborn的使用总结

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的hypot()方法使用简介
May 18 Python
Python中创建字典的几种方法总结(推荐)
Apr 27 Python
怎么使用pipenv管理你的python项目
Mar 12 Python
通过Py2exe将自己的python程序打包成.exe/.app的方法
May 26 Python
浅谈Python traceback的优雅处理
Aug 31 Python
在python2.7中用numpy.reshape 对图像进行切割的方法
Dec 05 Python
Python随机函数库random的使用方法详解
Aug 21 Python
NumPy中的维度Axis详解
Nov 26 Python
selenium+python配置chrome浏览器的选项的实现
Mar 18 Python
django inspectdb 操作已有数据库数据的使用步骤
Feb 07 Python
深入解析NumPy中的Broadcasting广播机制
May 30 Python
Python 的演示平台支持 WSGI 接口的应用
Apr 20 Python
使用Django连接Mysql数据库步骤
Jan 15 #Python
Django框架模板介绍
Jan 15 #Python
python使用PIL实现多张图片垂直合并
Jan 15 #Python
python实现多张图片拼接成大图
Jan 15 #Python
解决新版Pycharm中Matplotlib图像不在弹出独立的显示窗口问题
Jan 15 #Python
python实现创建新列表和新字典,并使元素及键值对全部变成小写
Jan 15 #Python
Python数据可视化之画图
Jan 15 #Python
You might like
德劲1104的电路分析与改良
2021/03/01 无线电
PHP中HTML标签过滤技巧
2014/01/07 PHP
php使用curl检测网页是否被百度收录的示例分享
2014/01/31 PHP
php的ajax简单实例
2014/02/27 PHP
CodeIgniter错误mysql_connect(): No such file or directory解决方法
2014/09/06 PHP
ThinkPHP实现动态包含文件的方法
2014/11/29 PHP
php的socket编程详解
2016/11/20 PHP
PHP实现的登录,注册及密码修改功能分析
2016/11/25 PHP
js禁止document element对象选中文本实现代码
2013/03/21 Javascript
通过隐藏iframe实现文件下载的js方法介绍
2014/02/26 Javascript
5个JavaScript经典面试题
2014/10/13 Javascript
基于jQuery实现的仿百度首页滑动选项卡效果代码
2015/11/16 Javascript
JavaScript使用DeviceOne开发实战(三)仿微信应用
2015/12/02 Javascript
thinkphp实现无限分类(使用递归)
2015/12/19 Javascript
Web前端开发工具——bower依赖包管理工具
2016/03/29 Javascript
浅谈js中的in-for循环
2016/06/28 Javascript
详解Jquery 遍历数组之$().each方法与$.each()方法介绍
2017/01/09 Javascript
详解jQuery中ajax.load()方法
2017/01/25 Javascript
ES6中Proxy代理用法实例浅析
2017/04/06 Javascript
Webpack如何引入bootstrap的方法
2017/06/17 Javascript
jQuery实现的隔行变色功能【案例】
2019/02/18 jQuery
Vue发布项目实例讲解
2019/07/17 Javascript
javascript 设计模式之组合模式原理与应用详解
2020/04/08 Javascript
[01:19:23]2018DOTA2亚洲邀请赛 4.5 淘汰赛 Mineski vs VG 第二场
2018/04/06 DOTA
[01:06:42]VP vs NewBee Supermajor 胜者组 BO3 第二场 6.5
2018/06/06 DOTA
Python实现扫描局域网活动ip(扫描在线电脑)
2015/04/28 Python
Python的dict字典结构操作方法学习笔记
2016/05/07 Python
windows下安装Python和pip终极图文教程
2017/03/05 Python
TensorFlow实现卷积神经网络CNN
2018/03/09 Python
纯CSS3实现绘制各种图形实现代码详细整理
2012/12/26 HTML / CSS
阿迪达斯德国官方网站:adidas德国
2017/07/12 全球购物
意大利时尚精品店:Nugnes 1920
2020/02/10 全球购物
2013年员工自我评价范文
2013/12/27 职场文书
我的大学生活演讲稿
2014/04/25 职场文书
安全例会汇报材料
2014/08/23 职场文书
《怀念母亲》教学反思
2016/02/19 职场文书