利用Python进行数据可视化常见的9种方法!超实用!


Posted in Python onJuly 11, 2018

前言

如同艺术家们用绘画让人们更贴切的感知世界,数据可视化也能让人们更直观的传递数据所要表达的信息。

我们今天就分享一下如何用 Python 简单便捷的完成数据可视化。

其实利用 Python 可视化数据并不是很麻烦,因为 Python 中有两个专用于可视化的库 matplotlib 和 seaborn 能让我们很容易的完成任务。

  • Matplotlib:基于Python的绘图库,提供完全的 2D 支持和部分 3D 图像支持。在跨平台和互动式环境中生成高质量数据时,matplotlib 会很有帮助。也可以用作制作动画。
  • Seaborn:该 Python 库能够创建富含信息量和美观的统计图形。Seaborn 基于 matplotlib,具有多种特性,比如内置主题、调色板、可以可视化单变量数据、双变量数据,线性回归数据和数据矩阵以及统计型时序数据等,能让我们创建复杂的可视化图形。

我们用 Python 可以做出哪些可视化图形?

那么这里可能有人就要问了,我们为什么要做数据可视化?比如有下面这个图表:

利用Python进行数据可视化常见的9种方法!超实用!

当然如果你把这张图表丢给别人,他们倒是也能看懂,但无法很直观的理解其中的信息,而且这种形式的图表看上去也比较 low,这个时候我们如果换成直观又美观的可视化图形,不仅能突显逼格,也能让人更容易的看懂数据。

下面我们就用上面这个简单的数据集作为例子,展示用 Python 做出9种可视化效果,并附有相关代码。

导入数据集

import matplotlib.pyplot as plt
import pandas as pd
df=pd.read_excel("E:/First.xlsx", "Sheet1")

可视化为直方图

fig=plt.figure() #Plots in matplotlib reside within a figure object, use plt.figure to create new figure
#Create one or more subplots using add_subplot, because you can't create blank figure
ax = fig.add_subplot(1,1,1)
#Variable
ax.hist(df['Age'],bins = 7) # Here you can play with number of bins
Labels and Tit
plt.title('Age distribution')
plt.xlabel('Age')
plt.ylabel('#Employee')
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为箱线图

import matplotlib.pyplot as plt
import pandas as pd
fig=plt.figure()
ax = fig.add_subplot(1,1,1)
#Variable
ax.boxplot(df['Age'])
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为小提琴图

import seaborn as sns 
sns.violinplot(df['Age'], df['Gender']) #Variable Plot
sns.despine()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为条形图

var = df.groupby('Gender').Sales.sum() #grouped sum of sales at Gender level
fig = plt.figure()
ax1 = fig.add_subplot(1,1,1)
ax1.set_xlabel('Gender')
ax1.set_ylabel('Sum of Sales')
ax1.set_title("Gender wise Sum of Sales")
var.plot(kind='bar')

利用Python进行数据可视化常见的9种方法!超实用!

可视化为折线图

var = df.groupby('BMI').Sales.sum()
fig = plt.figure()
ax1 = fig.add_subplot(1,1,1)
ax1.set_xlabel('BMI')
ax1.set_ylabel('Sum of Sales')
ax1.set_title("BMI wise Sum of Sales")
var.plot(kind='line')

利用Python进行数据可视化常见的9种方法!超实用!

可视化为堆叠柱状图

var = df.groupby(['BMI','Gender']).Sales.sum()
var.unstack().plot(kind='bar',stacked=True, color=['red','blue'], grid=False)

利用Python进行数据可视化常见的9种方法!超实用!

可视化为散点图

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(df['Age'],df['Sales']) #You can also add more variables here to represent color and size.
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为泡泡图

fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(df['Age'],df['Sales'], s=df['Income']) # Added third variable income as size of the bubble
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为饼状图

var=df.groupby(['Gender']).sum().stack()
temp=var.unstack()
type(temp)
x_list = temp['Sales']
label_list = temp.index
pyplot.axis("equal") #The pie chart is oval by default. To make it a circle use pyplot.axis("equal")
#To show the percentage of each pie slice, pass an output format to the autopctparameter 
plt.pie(x_list,labels=label_list,autopct="%1.1f%%") 
plt.title("Pastafarianism expenses")
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

可视化为热度图

import numpy as np
#Generate a random number, you can refer your data values also
data = np.random.rand(4,2)
rows = list('1234') #rows categories
columns = list('MF') #column categories
fig,ax=plt.subplots()
#Advance color controls
ax.pcolor(data,cmap=plt.cm.Reds,edgecolors='k')
ax.set_xticks(np.arange(0,2)+0.5)
ax.set_yticks(np.arange(0,4)+0.5)
# Here we position the tick labels for x and y axis
ax.xaxis.tick_bottom()
ax.yaxis.tick_left()
#Values against each labels
ax.set_xticklabels(columns,minor=False,fontsize=20)
ax.set_yticklabels(rows,minor=False,fontsize=20)
plt.show()

利用Python进行数据可视化常见的9种方法!超实用!

你也可以自己试着根据两个变量比如性别(X 轴)和 BMI(Y 轴)绘出热度图。

结语

本文我们分享了如何利用 Python 及 matplotlib 和 seaborn 库制作出多种多样的可视化图形。通过上面的例子,我们应该可以感受到利用可视化能多么美丽的展示数据。而且和其它语言相比,使用 Python 进行可视化更容易简便一些。

好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,如果有疑问大家可以留言交流,谢谢大家对三水点靠木的支持。

参考资料:

https://www.analyticsvidhya.com/blog/2015/05/data-visualization-python/

Python 相关文章推荐
python实现无证书加密解密实例
Oct 27 Python
Python中运行并行任务技巧
Feb 26 Python
Fabric 应用案例
Aug 28 Python
老生常谈python的私有公有属性(必看篇)
Jun 09 Python
Python+Turtle动态绘制一棵树实例分享
Jan 16 Python
Python实现端口检测的方法
Jul 24 Python
Python 实现子类获取父类的类成员方法
Jan 11 Python
python利用跳板机ssh远程连接redis的方法
Feb 19 Python
详解Python连接MySQL数据库的多种方式
Apr 16 Python
在win64上使用bypy进行百度网盘文件上传功能
Jan 02 Python
Django models filter筛选条件详解
Mar 16 Python
Pytorch中expand()的使用(扩展某个维度)
Jul 15 Python
基于数据归一化以及Python实现方式
Jul 11 #Python
numpy.std() 计算矩阵标准差的方法
Jul 11 #Python
使用sklearn进行对数据标准化、归一化以及将数据还原的方法
Jul 11 #Python
使用sklearn之LabelEncoder将Label标准化的方法
Jul 11 #Python
Python实现识别图片内容的方法分析
Jul 11 #Python
对python 数据处理中的LabelEncoder 和 OneHotEncoder详解
Jul 11 #Python
python对离散变量的one-hot编码方法
Jul 11 #Python
You might like
无限级别菜单的实现
2006/10/09 PHP
第五节--克隆
2006/11/16 PHP
php自动加载的两种实现方法
2010/06/21 PHP
php连接数据库代码应用分析
2011/05/29 PHP
PHP错误和异长常处理总结
2014/03/06 PHP
PHP实现的网站目录扫描索引工具
2016/09/08 PHP
PHP入门教程之面向对象的特性分析(继承,多态,接口,抽象类,抽象方法等)
2016/09/11 PHP
php源码之将图片转化为data/base64数据流实例详解
2016/11/27 PHP
PHP错误处理函数register_shutdown_function使用示例
2017/07/03 PHP
Django 标签筛选的实现代码(一对多、多对多)
2018/09/05 PHP
js判断日期时间有效性的方法
2015/10/24 Javascript
javascript新闻跑马灯实例代码
2020/07/29 Javascript
jQuery实现将div中滚动条滚动到指定位置的方法
2016/08/10 Javascript
Angular2学习教程之TemplateRef和ViewContainerRef详解
2017/05/25 Javascript
微信小程序实现收货地址左滑删除
2020/11/18 Javascript
mui js控制开关状态、修改switch开关的值方法
2019/09/03 Javascript
解决VueCil代理本地proxytable无效报错404的问题
2020/11/07 Javascript
详解Python 函数如何重载?
2019/04/23 Python
python用match()函数爬数据方法详解
2019/07/23 Python
python字符串下标与切片及使用方法
2020/02/13 Python
基于CSS3的CSS 多栏(Multi-column)实现瀑布流源码分享
2014/06/11 HTML / CSS
前端H5 Video常见使用场景简介
2020/08/21 HTML / CSS
日本土著品牌,综合型购物网站:Cecile
2016/08/23 全球购物
Ibatis的核心配置文件都有什么
2014/09/08 面试题
会计电算化个人自我评价
2013/11/17 职场文书
中医临床专业自我鉴定范文
2014/01/15 职场文书
《母鸡》教学反思
2014/02/25 职场文书
幼儿园保育员岗位职责
2014/04/13 职场文书
公司承诺书怎么写
2014/05/24 职场文书
小学开学标语
2014/07/01 职场文书
党员对照检查材料思想汇报(党的群众路线)
2014/09/24 职场文书
内勤岗位职责
2015/02/10 职场文书
被告答辩状范文
2015/05/22 职场文书
公司员工培训管理制度
2015/08/04 职场文书
退休劳动合同怎么写?
2019/10/25 职场文书
浅谈克隆 JavaScript
2021/11/02 Javascript