利用Python进行数据可视化常见的9种方法!超实用!


Posted in Python onJuly 11, 2018

前言

如同艺术家们用绘画让人们更贴切的感知世界,数据可视化也能让人们更直观的传递数据所要表达的信息。

我们今天就分享一下如何用 Python 简单便捷的完成数据可视化。

其实利用 Python 可视化数据并不是很麻烦,因为 Python 中有两个专用于可视化的库 matplotlib 和 seaborn 能让我们很容易的完成任务。

  • Matplotlib:基于Python的绘图库,提供完全的 2D 支持和部分 3D 图像支持。在跨平台和互动式环境中生成高质量数据时,matplotlib 会很有帮助。也可以用作制作动画。
  • Seaborn:该 Python 库能够创建富含信息量和美观的统计图形。Seaborn 基于 matplotlib,具有多种特性,比如内置主题、调色板、可以可视化单变量数据、双变量数据,线性回归数据和数据矩阵以及统计型时序数据等,能让我们创建复杂的可视化图形。

我们用 Python 可以做出哪些可视化图形?

那么这里可能有人就要问了,我们为什么要做数据可视化?比如有下面这个图表:

利用Python进行数据可视化常见的9种方法!超实用!

当然如果你把这张图表丢给别人,他们倒是也能看懂,但无法很直观的理解其中的信息,而且这种形式的图表看上去也比较 low,这个时候我们如果换成直观又美观的可视化图形,不仅能突显逼格,也能让人更容易的看懂数据。

下面我们就用上面这个简单的数据集作为例子,展示用 Python 做出9种可视化效果,并附有相关代码。

导入数据集

import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_excel("E:/First.xlsx", "Sheet1")

可视化为直方图

fig=plt.figure() #Plots in matplotlib reside within a figure object, use plt.figure to create new figure
#Create one or more subplots using add_subplot, because you can't create blank figure
ax = fig.add_subplot(1,1,1)
#Variable
ax.hist(df['Age'],bins = 7) # Here you can play with number of bins
Labels and Tit
plt.title('Age distribution')
plt.xlabel('Age')
plt.ylabel('#Employee')
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为箱线图

import matplotlib.pyplot as plt
import pandas as pd
fig=plt.figure()
ax = fig.add_subplot(1,1,1)
#Variable
ax.boxplot(df['Age'])
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为小提琴图

import seaborn as sns 
sns.violinplot(df['Age'], df['Gender']) #Variable Plot
sns.despine()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为条形图

var = df.groupby('Gender').Sales.sum() #grouped sum of sales at Gender level
fig = plt.figure()
ax1 = fig.add_subplot(1,1,1)
ax1.set_xlabel('Gender')
ax1.set_ylabel('Sum of Sales')
ax1.set_title("Gender wise Sum of Sales")
var.plot(kind='bar')

利用Python进行数据可视化常见的9种方法!超实用!

可视化为折线图

var = df.groupby('BMI').Sales.sum()
fig = plt.figure()
ax1 = fig.add_subplot(1,1,1)
ax1.set_xlabel('BMI')
ax1.set_ylabel('Sum of Sales')
ax1.set_title("BMI wise Sum of Sales")
var.plot(kind='line')

利用Python进行数据可视化常见的9种方法!超实用!

可视化为堆叠柱状图

var = df.groupby(['BMI','Gender']).Sales.sum()
var.unstack().plot(kind='bar',stacked=True, color=['red','blue'], grid=False)

利用Python进行数据可视化常见的9种方法!超实用!

可视化为散点图

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(df['Age'],df['Sales']) #You can also add more variables here to represent color and size.
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为泡泡图

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(df['Age'],df['Sales'], s=df['Income']) # Added third variable income as size of the bubble
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为饼状图

var=df.groupby(['Gender']).sum().stack()
temp=var.unstack()
type(temp)
x_list = temp['Sales']
label_list = temp.index
pyplot.axis("equal") #The pie chart is oval by default. To make it a circle use pyplot.axis("equal")
#To show the percentage of each pie slice, pass an output format to the autopctparameter 
plt.pie(x_list,labels=label_list,autopct="%1.1f%%") 
plt.title("Pastafarianism expenses")
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为热度图

import numpy as np
#Generate a random number, you can refer your data values also
data = np.random.rand(4,2)
rows = list('1234') #rows categories
columns = list('MF') #column categories
fig,ax=plt.subplots()
#Advance color controls
ax.pcolor(data,cmap=plt.cm.Reds,edgecolors='k')
ax.set_xticks(np.arange(0,2)+0.5)
ax.set_yticks(np.arange(0,4)+0.5)
# Here we position the tick labels for x and y axis
ax.xaxis.tick_bottom()
ax.yaxis.tick_left()
#Values against each labels
ax.set_xticklabels(columns,minor=False,fontsize=20)
ax.set_yticklabels(rows,minor=False,fontsize=20)
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

你也可以自己试着根据两个变量比如性别(X 轴)和 BMI(Y 轴)绘出热度图。

结语

本文我们分享了如何利用 Python 及 matplotlib 和 seaborn 库制作出多种多样的可视化图形。通过上面的例子,我们应该可以感受到利用可视化能多么美丽的展示数据。而且和其它语言相比,使用 Python 进行可视化更容易简便一些。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

参考资料:

https://www.analyticsvidhya.com/blog/2015/05/data-visualization-python/

Python 相关文章推荐
python 解析html之BeautifulSoup
Jul 07 Python
跟老齐学Python之深入变量和引用对象
Sep 24 Python
在Python中进行自动化单元测试的教程
Apr 15 Python
在Python下尝试多线程编程
Apr 28 Python
python字典操作实例详解
Nov 16 Python
pandas数据框,统计某列数据对应的个数方法
Apr 11 Python
Python scipy的二维图像卷积运算与图像模糊处理操作示例
Sep 06 Python
python调用Matplotlib绘制分布点图
Oct 18 Python
Python:type、object、class与内置类型实例
Dec 25 Python
django ORM之values和annotate使用详解
May 19 Python
django queryset 去重 .distinct()说明
May 19 Python
教你怎么用Python生成九宫格照片
May 20 Python
基于数据归一化以及Python实现方式
Jul 11 #Python
numpy.std() 计算矩阵标准差的方法
Jul 11 #Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 #Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 #Python
Python实现识别图片内容的方法分析
Jul 11 #Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
You might like
php 传值赋值与引用赋值的区别
2010/12/29 PHP
php array的学习笔记
2012/05/16 PHP
PHP生成和获取XML格式数据的方法
2016/03/04 PHP
Zend Framework动作控制器用法示例
2016/12/09 PHP
基于jquery实现拆分姓名的方法(纯JS版)
2013/05/08 Javascript
解决checkbox的attr(checked)一直为undefined问题
2014/06/16 Javascript
javascript简单实现滑动菜单效果的方法
2015/07/27 Javascript
Javascript 函数的四种调用模式
2016/11/05 Javascript
JS实现AES加密并与PHP互通的方法分析
2017/04/19 Javascript
React-router v4 路由配置方法小结
2017/08/08 Javascript
详解jQuery同步Ajax带来的UI线程阻塞问题及解决办法
2017/08/09 jQuery
vue不通过路由直接获取url中参数的方法示例
2017/08/24 Javascript
vue中实现上传文件给后台实例详解
2019/08/22 Javascript
vue-router路由模式详解(小结)
2019/08/26 Javascript
详解webpack打包vue项目之后生成的dist文件该怎么启动运行
2019/09/06 Javascript
JS随机密码生成算法
2019/09/23 Javascript
[03:22]DAC最前线(第二期)—DOTA2亚洲邀请赛主赛场周边及线路探访
2015/01/24 DOTA
Python中转换角度为弧度的radians()方法
2015/05/18 Python
Python字符串、元组、列表、字典互相转换的方法
2016/01/23 Python
详谈Python中列表list,元祖tuple和numpy中的array区别
2018/04/18 Python
在cmd命令行里进入和退出Python程序的方法
2018/05/12 Python
python3.5基于TCP实现文件传输
2020/03/20 Python
用Cython加速Python到“起飞”(推荐)
2019/08/01 Python
简单了解Pandas缺失值处理方法
2019/11/16 Python
Python类和实例的属性机制原理详解
2020/03/21 Python
python求前n个阶乘的和实例
2020/04/02 Python
用python按照图像灰度值统计并筛选图片的操作(PIL,shutil,os)
2020/06/04 Python
HTML5 Plus 实现手机APP拍照或相册选择图片上传功能
2016/07/13 HTML / CSS
美国大码时尚女装购物网站:ELOQUII
2017/12/28 全球购物
如何用Lucene索引数据库
2016/02/23 面试题
函授毕业生自我鉴定范文
2014/03/25 职场文书
摄影展策划方案
2014/06/02 职场文书
会议室标语
2014/06/21 职场文书
德能勤绩廉个人总结
2015/02/14 职场文书
违规违纪检讨书范文
2015/05/06 职场文书
muduo TcpServer模块源码分析
2022/04/26 Redis