Python数据分析:手把手教你用Pandas生成可视化图表的教程


Posted in Python onDecember 15, 2018

大家都知道,Matplotlib 是众多 Python 可视化包的鼻祖,也是Python最常用的标准可视化库,其功能非常强大,同时也非常复杂,想要搞明白并非易事。但自从Python进入3.0时代以后,pandas的使用变得更加普及,它的身影经常见于市场分析、爬虫、金融分析以及科学计算中。

作为数据分析工具的集大成者,pandas作者曾说,pandas中的可视化功能比plt更加简便和功能强大。实际上,如果是对图表细节有极高要求,那么建议大家使用matplotlib通过底层图表模块进行编码。当然,我们大部分人在工作中是不会有这样变态的要求的,所以一句import pandas as pd就足够应付全部的可视化工作了。

下面,我们总结一下PD库的一些使用方法和入门技巧。

一、线型图

对于pandas的内置数据类型,Series 和 DataFrame 都有一个用于生成各类 图表 的 plot 方法。 默认情况下, 它们所生成的是线型图。其实Series和DataFrame上的这个功能只是使用matplotlib库的plot()方法的简单包装实现。参考以下示例代码 -

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(10,4),index=pd.date_range('2018/12/18',
 periods=10), columns=list('ABCD'))
 
df.plot()

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

如果索引由日期组成,则调用gct().autofmt_xdate()来格式化x轴,如上图所示。

我们可以使用x和y关键字绘制一列与另一列。

s = Series( np. random. randn( 10). cumsum(), index= np. arange( 0, 100, 10))
s. plot()

Python数据分析:手把手教你用Pandas生成可视化图表的教程

pandas 的大部分绘图方法都有 一个 可选的ax参数, 它可以是一个 matplotlib 的 subplot 对象。 这使你能够在网格 布局 中 更为灵活地处理 subplot 的位置。 DataFrame的plot 方法会在 一个 subplot 中为各列绘制 一条 线, 并自动创建图例( 如图所示):

df = DataFrame( np. random. randn( 10, 4). cumsum( 0), ...: columns=[' A', 'B', 'C', 'D'], index= np. arange( 0, 100, 10)) 
 
df. plot()

Python数据分析:手把手教你用Pandas生成可视化图表的教程

二、柱状图

在生成线型图的代码中加上 kind=' bar'( 垂直柱状图) 或 kind=' barh'( 水平柱状图) 即可生成柱状图。 这时,Series 和 DataFrame 的索引将会被用 作 X( bar) 或 (barh)刻度:

In [59]: fig, axes = plt. subplots( 2, 1) 
 
In [60]: data = Series( np. random. rand( 16), index= list(' abcdefghijklmnop')) 
 
In [61]: data. plot( kind=' bar', ax= axes[ 0], color=' k', alpha= 0. 7) 
 
Out[ 61]: < matplotlib. axes. AxesSubplot at 0x4ee7750> 
 
In [62]: data. plot( kind=' barh', ax= axes[ 1], color=' k', alpha= 0.

对于 DataFrame, 柱状 图 会 将 每一 行的 值 分为 一组, 如图 8- 16 所示:

In [63]: df = DataFrame( np. random. rand( 6, 4), ...: index=[' one', 'two', 'three', 'four', 'five', 'six'], ...: columns= pd. Index([' A', 'B', 'C', 'D'], name=' Genus')) 
 
In [64]: df 
 
Out[ 64]: 
 
Genus 
 
   A   B   C   D 
one 0. 301686 0. 156333 0. 371943 0. 270731 
two 0. 750589 0. 525587 0. 689429 0. 358974 
three 0. 381504 0. 667707 0. 473772 0. 632528 
four 0. 942408 0. 180186 0. 708284 0. 641783 
five 0. 840278 0. 909589 0. 010041 0. 653207 
six 0. 062854 0. 589813 0. 811318 0. 060217 
 
In [65]: df. plot( kind=' bar')

Python数据分析:手把手教你用Pandas生成可视化图表的教程

三、条形图

现在通过创建一个条形图来看看条形图是什么。条形图可以通过以下方式来创建 -

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar()

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

要生成一个堆积条形图,通过指定:pass stacked=True -

import pandas as pd
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
df.plot.bar(stacked=True)

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

要获得水平条形图,使用barh()方法 -

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.rand(10,4),columns=['a','b','c','d'])
 
df.plot.barh(stacked=True)

四、直方图

可以使用plot.hist()方法绘制直方图。我们可以指定bins的数量值。

import pandas as pd
import numpy as np
 
df = pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 
df.plot.hist(bins=20)

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

要为每列绘制不同的直方图,请使用以下代码 -

import pandas as pd
import numpy as np
 
df=pd.DataFrame({'a':np.random.randn(1000)+1,'b':np.random.randn(1000),'c':
np.random.randn(1000) - 1}, columns=['a', 'b', 'c'])
 
df.hist(bins=20)

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

五、箱型图

Boxplot可以绘制调用Series.box.plot()和DataFrame.box.plot()或DataFrame.boxplot()来可视化每列中值的分布。

例如,这里是一个箱形图,表示对[0,1)上的统一随机变量的10次观察的五次试验。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(10, 5), columns=['A', 'B', 'C', 'D', 'E'])
df.plot.box()

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

六、块型图

可以使用Series.plot.area()或DataFrame.plot.area()方法创建区域图形。

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.rand(10, 4), columns=['a', 'b', 'c', 'd'])
df.plot.area()

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

七、散点图

可以使用DataFrame.plot.scatter()方法创建散点图。

import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.rand(50, 4), columns=['a', 'b', 'c', 'd'])
df.plot.scatter(x='a', y='b')

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

八、饼状图

饼状图可以使用DataFrame.plot.pie()方法创建。

import pandas as pd
import numpy as np
 
df = pd.DataFrame(3 * np.random.rand(4), index=['a', 'b', 'c', 'd'], columns=['x'])
df.plot.pie(subplots=True)

执行上面示例代码,得到以下结果 -

Python数据分析:手把手教你用Pandas生成可视化图表的教程

以上这篇Python数据分析:手把手教你用Pandas生成可视化图表的教程就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3.3使用tkinter开发猜数字游戏示例
Mar 14 Python
python通过smpt发送邮件的方法
Apr 30 Python
python中urllib.unquote乱码的原因与解决方法
Apr 24 Python
python中import reload __import__的区别详解
Oct 16 Python
Python使用functools实现注解同步方法
Feb 06 Python
Python Xml文件添加字节属性的方法
Mar 31 Python
Python统计python文件中代码,注释及空白对应的行数示例【测试可用】
Jul 25 Python
Python爬虫爬取新浪微博内容示例【基于代理IP】
Aug 03 Python
python面向对象实现名片管理系统文件版
Apr 26 Python
python获取点击的坐标画图形的方法
Jul 09 Python
Keras使用tensorboard显示训练过程的实例
Feb 15 Python
Python 实现自动登录+点击+滑动验证功能
Jun 10 Python
浅谈python 导入模块和解决文件句柄找不到问题
Dec 15 #Python
对python当中不在本路径的py文件的引用详解
Dec 15 #Python
对python3 中方法各种参数和返回值详解
Dec 15 #Python
对python中的argv和argc使用详解
Dec 15 #Python
Python输出\u编码将其转换成中文的实例
Dec 15 #Python
对python:print打印时加u的含义详解
Dec 15 #Python
Python 最大概率法进行汉语切分的方法
Dec 14 #Python
You might like
WINDOWS 2000下使用ISAPI方式安装PHP
2006/09/05 PHP
分页详解 从此分页无忧(PHP+mysql)
2007/11/23 PHP
PHP 服务器配置(使用Apache及IIS两种方法)
2009/06/01 PHP
Windows IIS PHP 5.2 安装与配置方法
2009/06/08 PHP
基于PHP的加载类操作以及其他两种魔术方法的应用实例
2017/08/28 PHP
Thinkphp5框架简单实现钩子(Hook)行为的方法示例
2019/09/03 PHP
一个cssQuery对象 javascript脚本实现代码
2009/07/21 Javascript
JS和jquery获取各种屏幕的宽度和高度的代码
2013/08/02 Javascript
浏览器窗口加载和大小改变事件示例
2014/02/27 Javascript
node.js中RPC(远程过程调用)的实现原理介绍
2014/12/05 Javascript
常用的Javascript数据验证插件
2015/08/04 Javascript
用js实现博客打赏功能
2016/10/24 Javascript
详解React-Todos入门例子
2016/11/08 Javascript
jQuery Checkbox 全选 反选的简单实例
2016/11/29 Javascript
ReactNative之键盘Keyboard的弹出与消失示例
2017/07/11 Javascript
简单了解微信小程序 e.target与e.currentTarget的不同
2019/09/27 Javascript
解决Angularjs异步操作后台请求用$q.all排列先后顺序问题
2019/11/29 Javascript
js实现div色块拖动录制
2020/01/16 Javascript
JS跨浏览器解析XML应用过程详解
2020/10/16 Javascript
vue3.0 项目搭建和使用流程
2021/03/04 Vue.js
python+matplotlib绘制旋转椭圆实例代码
2018/01/12 Python
python pyheatmap包绘制热力图
2018/11/09 Python
pygame实现成语填空游戏
2019/10/29 Python
python中数字是否为可变类型
2020/07/08 Python
Python接口自动化测试框架运行原理及流程
2020/11/30 Python
利用CSS3实现进度条的两种姿势详解
2017/03/21 HTML / CSS
DeinDesign德国:设计自己的手机壳
2019/12/14 全球购物
西班牙Polo衫品牌:Polo Club
2020/08/09 全球购物
2014年五一劳动节社区活动总结
2014/04/14 职场文书
小学生春游活动方案
2014/08/20 职场文书
2014国庆节演讲稿:祖国在我心中(400字)
2014/09/25 职场文书
流动人口婚育证明
2014/10/19 职场文书
2015年医药代表工作总结
2015/04/25 职场文书
党员电教片《信仰》心得体会
2016/01/15 职场文书
医学生自荐信范文(2016精选篇)
2016/01/28 职场文书
解决Mysql多行子查询的使用及空值问题
2022/01/22 MySQL