Python 绘图库 Matplotlib 入门教程


Posted in Python onApril 19, 2018

运行环境

由于这是一个Python语言的软件包,因此需要你的机器上首先安装好Python语言的环境。关于这一点,请自行在网络上搜索获取方法。

关于如何安装Matplotlib请参见这里:Matplotlib Installing。

笔者推荐大家通过pip的方式进行安装,具体方法如下:

sudo pip3 install matplotlib

本文中的源码和测试数据可以在这里获取:matplotlib_tutorial

本文的代码示例会用到另外一个Python库:NumPy。建议读者先对NumPy有一定的熟悉,我之前也写过一个NumPy的基础教程,参见这里:Python 机器学习库 NumPy 教程。

本文的代码在如下环境中测试:

  • Apple OS X 10.13
  • Python 3.6.3 matplotlib 2.1.1
  • numpy 1.13.3

介绍

Matplotlib适用于各种环境,包括:

  • Python脚本
  • IPython shell Jupyter notebook
  • Web应用服务器
  • 用户图形界面工具包

使用Matplotlib,能够的轻易生成各种类型的图像,例如:直方图,波谱图,条形图,散点图等。并且,可以非常轻松的实现定制。

入门代码示例

下面我们先看一个最简单的代码示例,让我们感受一下Matplotlib是什么样的:

# test.py
import matplotlib.pyplot as plt
import numpy as np
data = np.arange(100, 201)
plt.plot(data)
plt.show()

这段代码的主体逻辑只有三行,但是它却绘制出了一个非常直观的线性图,如下所示:

Python 绘图库 Matplotlib 入门教程

对照着这个线形图,我们来讲解一下三行代码的逻辑:

  • 通过np.arange(100, 201)生成一个[100, 200]之间的整数数组,它的值是:[100, 101, 102, … , 200]
  • 通过matplotlib.pyplot将其绘制出来。很显然,绘制出来的值对应了图中的纵坐标(y轴)。而matplotlib本身为我们设置了图形的横坐标(x轴):[0, 100],因为我们刚好有100个数值
  • 通过plt.show()将这个图形显示出来

这段代码非常的简单,运行起来也是一样。如果你已经有了本文的运行环境,将上面的代码保存到一个文本文件中(或者通过Github获取本文的源码),然后通过下面的命令就可以在你自己的电脑上看到上面的图形了:

python3 test.py

注1:后面的教程中,我们会逐步讲解如何定制图中的每一个细节。例如:坐标轴,图形,着色,线条样式,等等。

注2:如果没有必要,下文的截图会去掉图形外侧的边框,只保留图形主体。

一次绘制多个图形

有些时候,我们可能希望一次绘制多个图形,例如:两组数据的对比,或者一组数据的不同展示方式等。

可以通过下面的方法创建多个图形:

多个figure

可以简单的理解为一个figure就是一个图形窗口。matplotlib.pyplot会有一个默认的figure,我们也可以通过plt.figure()创建更多个。如下面的代码所示:

# figure.py
import matplotlib.pyplot as plt
import numpy as np
data = np.arange(100, 201)
plt.plot(data)
data2 = np.arange(200, 301)
plt.figure()
plt.plot(data2)
plt.show()

这段代码绘制了两个窗口的图形,它们各自是一个不同区间的线形图,如下所示:

Python 绘图库 Matplotlib 入门教程

注:初始状态这两个窗口是完全重合的。

多个subplot

有些情况下,我们是希望在同一个窗口显示多个图形。此时就这可以用多个subplot。下面是一段代码示例:

# subplot.py
import matplotlib.pyplot as plt
import numpy as np
data = np.arange(100, 201)
plt.subplot(2, 1, 1)
plt.plot(data)
data2 = np.arange(200, 301)
plt.subplot(2, 1, 2)
plt.plot(data2)
plt.show()

这段代码中,除了subplot函数之外都是我们熟悉的内容。subplot函数的前两个参数指定了subplot数量,即:它们是以矩阵的形式来分割当前图形,两个整数分别指定了矩阵的行数和列数。而第三个参数是指矩阵中的索引。

因此,下面这行代码指的是:2行1列subplot中的第1个subplot。

plt.subplot(2, 1, 1)

下面这行代码指的是:2行1列subplot中的第2个subplot。

plt.subplot(2, 1, 2)

所以这段代码的结果是这个样子:

Python 绘图库 Matplotlib 入门教程

subplot函数的参数不仅仅支持上面这种形式,还可以将三个整数(10之内的)合并一个整数。例如:2, 1, 1可以写成2112, 1, 2可以写成212

因此,下面这段代码的结果是一样的:

import matplotlib.pyplot as plt
import numpy as np
data = np.arange(100, 201)
plt.subplot(211)
plt.plot(data)
data2 = np.arange(200, 301)
plt.subplot(212)
plt.plot(data2)
plt.show()

subplot函数的详细说明参见这里:matplotlib.pyplot.subplot

常用图形示例

Matplotlib可以生成非常多的图形式样,多到令人惊叹的地步。大家可以在这里:Matplotlib Gallery 感受一下。

本文作为第一次的入门教程,我们先来看看最常用的一些图形的绘制。

线性图

前面的例子中,线性图的横轴的点都是自动生成的,而我们很可能希望主动设置它。另外,线条我们可能也希望对其进行定制。看一下下面这个例子:

# plot.py
import matplotlib.pyplot as plt
plt.plot([1, 2, 3], [3, 6, 9], '-r')
plt.plot([1, 2, 3], [2, 4, 9], ':g')
plt.show()

这段代码可以让我们得到这样的图形:

Python 绘图库 Matplotlib 入门教程

这段代码说明如下:

plot函数的第一个数组是横轴的值,第二个数组是纵轴的值,所以它们一个是直线,一个是折线; 最后一个参数是由两个字符构成的,分别是线条的样式和颜色。前者是红色的直线,后者是绿色的点线。关于样式和颜色的说明请参见plot函数的API Doc:matplotlib.pyplot.plot

散点图

scatter函数用来绘制散点图。同样,这个函数也需要两组配对的数据指定x和y轴的坐标。下面是一段代码示例:

# scatter.py
import matplotlib.pyplot as plt
import numpy as np
N = 20
plt.scatter(np.random.rand(N) * 100,
   np.random.rand(N) * 100,
   c='r', s=100, alpha=0.5)
plt.scatter(np.random.rand(N) * 100,
   np.random.rand(N) * 100,
   c='g', s=200, alpha=0.5)
plt.scatter(np.random.rand(N) * 100,
   np.random.rand(N) * 100,
   c='b', s=300, alpha=0.5)
plt.show()

这段代码说明如下:

这幅图包含了三组数据,每组数据都包含了20个随机坐标的位置 参数c表示点的颜色,s是点的大小,alpha是透明度

这段代码绘制的图形如下所示:

Python 绘图库 Matplotlib 入门教程

scatter函数的详细说明参见这里:matplotlib.pyplot.scatter

饼状图

pie函数用来绘制饼状图。饼状图通常用来表达集合中各个部分的百分比。

# pie.py
import matplotlib.pyplot as plt
import numpy as np
labels = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']
data = np.random.rand(7) * 100
plt.pie(data, labels=labels, autopct='%1.1f%%')
plt.axis('equal')
plt.legend()
plt.show()

这段代码说明如下:

data是一组包含7个数据的随机数值 图中的标签通过labels来指定 autopct指定了数值的精度格式 plt.axis('equal')设置了坐标轴大小一致 plt.legend()指明要绘制图例(见下图的右上角)

这段代码输出的图形如下所示:

Python 绘图库 Matplotlib 入门教程

pie函数的详细说明参见这里:matplotlib.pyplot.pie

条形图

bar函数用来绘制条形图。条形图常常用来描述一组数据的对比情况,例如:一周七天,每天的城市车流量。

下面是一个代码示例:

# bar.py
import matplotlib.pyplot as plt
import numpy as np
N = 7
x = np.arange(N)
data = np.random.randint(low=0, high=100, size=N)
colors = np.random.rand(N * 3).reshape(N, -1)
labels = ['Mon', 'Tue', 'Wed', 'Thu', 'Fri', 'Sat', 'Sun']
plt.title("Weekday Data")
plt.bar(x, data, alpha=0.8, color=colors, tick_label=labels)
plt.show()

这段代码说明如下:

这幅图展示了一组包含7个随机数值的结果,每个数值是[0, 100]的随机数 它们的颜色也是通过随机数生成的。np.random.rand(N * 3).reshape(N, -1)表示先生成21(N x 3)个随机数,然后将它们组装成7行,那么每行就是三个数,这对应了颜色的三个组成部分。如果不理解这行代码,请先学习一下Python 机器学习库 NumPy 教程 title指定了图形的标题,labels指定了标签,alpha是透明度

这段代码输出的图形如下所示:

Python 绘图库 Matplotlib 入门教程

bar函数的详细说明参见这里:matplotlib.pyplot.bar

直方图

hist函数用来绘制直方图。直方图看起来是条形图有些类似。但它们的含义是不一样的,直方图描述了数据中某个范围内数据出现的频度。这么说有些抽象,我们通过一个代码示例来描述就好理解了:

# hist.py
import matplotlib.pyplot as plt
import numpy as np
data = [np.random.randint(0, n, n) for n in [3000, 4000, 5000]]
labels = ['3K', '4K', '5K']
bins = [0, 100, 500, 1000, 2000, 3000, 4000, 5000]
plt.hist(data, bins=bins, label=labels)
plt.legend()
plt.show()

上面这段代码中,[np.random.randint(0, n, n) for n in [3000, 4000, 5000]]生成了包含了三个数组的数组,这其中:

第一个数组包含了3000个随机数,这些随机数的范围是 [0, 3000) 第二个数组包含了4000个随机数,这些随机数的范围是 [0, 4000) 第三个数组包含了5000个随机数,这些随机数的范围是 [0, 5000)

bins数组用来指定我们显示的直方图的边界,即:[0, 100) 会有一个数据点,[100, 500)会有一个数据点,以此类推。所以最终结果一共会显示7个数据点。同样的,我们指定了标签和图例。

这段代码的输出如下图所示:

Python 绘图库 Matplotlib 入门教程

在这幅图中,我们看到,三组数据在3000以下都有数据,并且频度是差不多的。但蓝色条只有3000以下的数据,橙色条只有4000以下的数据。这与我们的随机数组数据刚好吻合。

hist函数的详细说明参见这里:matplotlib.pyplot.hist

结束语

通过本文,我们已经知道了Matplotlib的大致使用方法和几种最基本的图形的绘制方式。

需要说明的是,由于是入门教程,因此本文中我们只给出了这些函数和图形最基本的使用方法。但实际上,它们的功能远不止这么简单。因此本文中我们贴出了这些函数的API地址以便读者进一步的研究。

Python 相关文章推荐
Python 匹配任意字符(包括换行符)的正则表达式写法
Oct 29 Python
Python的Urllib库的基本使用教程
Apr 30 Python
详解Python中的__new__、__init__、__call__三个特殊方法
Jun 02 Python
python2.7到3.x迁移指南
Feb 01 Python
详解Django+Uwsgi+Nginx的生产环境部署
Jun 25 Python
详解python分布式进程
Oct 08 Python
解决python 未发现数据源名称并且未指定默认驱动程序的问题
Dec 07 Python
对python周期性定时器的示例详解
Feb 19 Python
Python 调用有道翻译接口实现翻译
Mar 02 Python
python 字符串的驻留机制及优缺点
Jun 19 Python
python中的垃圾回收(GC)机制
Sep 21 Python
Python实现区域填充的示例代码
Feb 03 Python
python 列表删除所有指定元素的方法
Apr 19 #Python
Python 机器学习库 NumPy入门教程
Apr 19 #Python
python 显示数组全部元素的方法
Apr 19 #Python
PyQt5每天必学之进度条效果
Apr 19 #Python
python中实现将多个print输出合成一个数组
Apr 19 #Python
Python 数据处理库 pandas 入门教程基本操作
Apr 19 #Python
PyQt5实现下载进度条效果
Apr 19 #Python
You might like
PHP魔术引号所带来的安全问题分析
2014/07/15 PHP
php检查是否是ajax请求的方法
2015/04/16 PHP
PHP实现链式操作的原理详解
2016/09/16 PHP
基于PHPexecl类生成复杂的报表表头示例
2016/10/14 PHP
PHP7 foreach() 函数修改
2021/03/09 PHP
jQuery 打造动态下滑菜单实现说明
2010/04/15 Javascript
原生JS可拖动弹窗效果实例代码
2013/11/09 Javascript
js查找某元素中的所有图片地址的方法
2014/01/16 Javascript
jquery制作弹窗提示窗口代码分享
2014/03/02 Javascript
淘宝网提供的国内NPM镜像简介和使用方法
2014/04/17 Javascript
学习JavaScript编程语言的8张思维导图分享
2015/03/27 Javascript
正则表达式优化JSON字符串的技巧
2015/12/24 Javascript
理解javascript定时器中的单线程
2016/02/23 Javascript
JavaScript 消息框效果【实现代码】
2016/04/27 Javascript
angular过滤器实现排序功能
2017/06/27 Javascript
Vue实现数字输入框中分割手机号码的示例
2017/10/10 Javascript
在vue-cli中引入lodash.js并使用详解
2019/11/13 Javascript
JS面向对象之单选框实现
2020/01/17 Javascript
vue中实现点击变成全屏的多种方法
2020/09/27 Javascript
vue实现简易的双向数据绑定
2020/12/29 Vue.js
three.js如何实现3D动态文字效果
2021/03/03 Javascript
[01:28]2014DOTA2国际邀请赛中国区预选赛四大豪门直升机抵达会场
2014/05/24 DOTA
Python解析树及树的遍历
2016/02/03 Python
Python3安装Scrapy的方法步骤
2017/11/23 Python
Python之列表的插入&替换修改方法
2018/06/28 Python
Python3.6.2调用ffmpeg的方法
2019/01/10 Python
PyQt Qt Designer工具的布局管理详解
2019/08/07 Python
Python基于当前时间批量创建文件
2020/05/07 Python
使用keras实现BiLSTM+CNN+CRF文字标记NER
2020/06/29 Python
python BeautifulSoup库的安装与使用
2020/12/17 Python
canvas 基础之图像处理的使用
2020/04/10 HTML / CSS
公司财务流程之主管工作流程
2014/03/03 职场文书
对外汉语专业大学生职业生涯规划范文
2014/09/13 职场文书
委托证明书
2014/09/17 职场文书
党员干部廉政承诺书
2015/04/28 职场文书
文明医院的标语集锦!
2019/07/24 职场文书