在Python中调用ggplot的三种方法


Posted in Python onApril 08, 2015

本文提供了三种不同的方式在Python(IPython Notebook)中调用ggplot。

在大数据时代,数据可视化是一个非常热门的话题。各个BI的厂商无不在数据可视化领域里投入大量的精力。Tableau凭借其强大的数据可视化的功能成为硅谷炙手可热的上市公司。Tableau的数据可视化的产品,其理论基础其实是《The Grammar of Graphic》,该书提出了对信息可视化的图表的语法抽象体系,数据的探索和分析可以由图像的语法来驱动,而非有固定的图表类型来驱动,使得数据的探索过程变得友好而有趣。

然而对于The Grammar of Graphic的理论的实践,并非Tableau独占,ggplot作为R语言上得一个图形库,其理论基础也是这本书。(注,笔者曾就职的某BI巨头,主要职责也是数据可视化,我们曾经和加拿大团队研发过类似的产品,基于HTML5和D3,可惜由于种种原因未能推向市场)

现在越来越多的人开始使用python来做数据分析,IPython Notebook尤其令人喜爱,它的实时交互把脚本语言的优势发挥到极致。那么怎样才能在IPython Notebook中使用ggplot呢?我这里跟大家分享三种不同的方式供大家选择。
RPy2

第一种方式是使用rpy2, rpy2是对rpy的改写和重新设计,旨在提供Python用户在python中使用R的API。

rpy2提供了对R语言的对象和方法的基本封装,当然也包括可视化的图库这一块。

下面就是一段运行ggplot的R程序使用rpy2在python中运行的例子:
 

from rpy2 import robjects
from rpy2.robjects import Formula, Environment
from rpy2.robjects.vectors import IntVector, FloatVector
from rpy2.robjects.lib import grid
from rpy2.robjects.packages import importr, data
import rpy2.robjects.lib.ggplot2 as ggplot2
 
# The R 'print' function
rprint = robjects.globalenv.get("print")
stats = importr('stats')
grdevices = importr('grDevices')
base = importr('base')
datasets = importr('datasets')
 
mtcars = data(datasets).fetch('mtcars')['mtcars']
 
pp = ggplot2.ggplot(mtcars) + \
   ggplot2.aes_string(x='wt', y='mpg', col='factor(cyl)') + \
   ggplot2.geom_point() + \
   ggplot2.geom_smooth(ggplot2.aes_string(group = 'cyl'),
             method = 'lm')
pp.plot()

以上程序在IPython Notebook中运行会有缺陷,会弹出一个新的窗口显示图,而且该python进程会阻塞在那里。我们希望图表能内嵌在IPython Notebook的页面中,为了解决该问题,我们引入如下代码:
 

%matplotlib inline
 
import uuid
from rpy2.robjects.packages import importr 
from IPython.core.display import Image
 
grdevices = importr('grDevices')
def ggplot_notebook(gg, width = 800, height = 600):
  fn = '{uuid}.png'.format(uuid = uuid.uuid4())
  grdevices.png(fn, width = width, height = height)
  gg.plot()
  grdevices.dev_off()
  return Image(filename=fn)

运行上述代码后,我们把ggplot的调用pp.plot()改为调用ggplot_notebook(pp, height=300)就能成功嵌入显示ggplot的结果。

在Python中调用ggplot的三种方法

RMagic

另一种方式是使用rmagic,rmagicy实际上依赖于rpy2。它的使用方式更像是直接在使用R
 

%load_ext rmagic
library(ggplot2)
dat <- data.frame(x = rnorm(10), y = rnorm(10), 
         lab = sample(c('A', 'B'), 10, replace = TRUE))
x <- ggplot(dat, aes(x = x, y = y, color = lab)) + geom_point()
print(x)

运行结果如下

在Python中调用ggplot的三种方法

ggplot for python

ggplot是一个python的库,基本上是对R语言ggplot的功能移植到Python上。

运行安装脚本

pip install ggplot

安装成功后,可以试一下这个例子
 

%matplotlib inline
import pandas as pd
from ggplot import *
meat_lng = pd.melt(meat[['date', 'beef', 'pork', 'broilers']], id_vars='date')
ggplot(aes(x='date', y='value', colour='variable'), data=meat_lng) + \
  geom_point() + \
  stat_smooth(color='red')

结果如下:

在Python中调用ggplot的三种方法

总结

本文提供了三种不同的方式在Python(IPython Notebook)中调用ggplot。

rpy2和Rmagic都是一种对R的桥接,所以都需要安装R。不同之处在于rpy2提供Python接口而Rmagic更接近R。

ggplot Python库是ggplot的Python移植,所以无需安装R,部署起来更为简单,但功能上也许和R的ggplot还有差距。

大家可以根据自己的需要做出选择。

Python 相关文章推荐
Python 基础教程之包和类的用法
Feb 23 Python
Python基于Socket实现的简单聊天程序示例
Aug 05 Python
Python基于回溯法子集树模板解决马踏棋盘问题示例
Sep 11 Python
深入理解Python分布式爬虫原理
Nov 23 Python
分享Pycharm中一些不为人知的技巧
Apr 03 Python
python 文件转成16进制数组的实例
Jul 09 Python
Python使用matplotlib绘制三维图形示例
Aug 25 Python
pyqt5 获取显示器的分辨率的方法
Jun 18 Python
Django使用Jinja2模板引擎的示例代码
Aug 09 Python
Python 实现黑客帝国中的字符雨的示例代码
Feb 20 Python
浅析pip安装第三方库及pycharm中导入第三方库的问题
Mar 10 Python
python3中sorted函数里cmp参数改变详解
Mar 12 Python
Python字符串和文件操作常用函数分析
Apr 08 #Python
Python遍历zip文件输出名称时出现乱码问题的解决方法
Apr 08 #Python
python smtplib模块发送SSL/TLS安全邮件实例
Apr 08 #Python
python复制与引用用法分析
Apr 08 #Python
Python导入txt数据到mysql的方法
Apr 08 #Python
python集合类型用法分析
Apr 08 #Python
在Python中使用Mako模版库的简单教程
Apr 08 #Python
You might like
PHP实现使用优酷土豆视频地址获取swf播放器分享地址
2014/06/05 PHP
thinkphp5引入公共部分header、footer的方法详解
2018/09/14 PHP
PHP 图片合成、仿微信群头像的方法示例
2019/10/25 PHP
利用javascript/jquery对上传文件格式过滤的方法
2009/07/25 Javascript
JavaScript 组件之旅(二)编码实现和算法
2009/10/28 Javascript
Javascript select下拉框操作常用方法
2009/11/09 Javascript
Javascript中的变量使用说明
2010/05/18 Javascript
javascript 学习笔记(八)javascript对象
2011/04/12 Javascript
七夕情人节丘比特射箭小游戏
2015/08/20 Javascript
jquery判断input值不为空的方法
2016/06/05 Javascript
简单实现js选项卡切换效果
2017/02/09 Javascript
解决JS内存泄露之js对象和dom对象互相引用问题
2017/06/25 Javascript
基于nodejs+express4.X实现文件下载的实例代码
2017/07/13 NodeJs
Vue自定义指令使用方法详解
2017/08/21 Javascript
vue 系列——vue2-webpack2框架搭建踩坑之路
2017/12/22 Javascript
详解webpack 热更新优化
2018/09/13 Javascript
jQuery动态操作表单示例【基于table表格】
2018/12/06 jQuery
基于Vue插入视频的2种方法小结
2019/04/02 Javascript
vue:el-input输入时限制输入的类型操作
2020/08/05 Javascript
[03:36]2015国际邀请赛第二日现场精彩集锦
2015/08/06 DOTA
Python深入学习之对象的属性
2014/08/31 Python
python从入门到精通(DAY 1)
2015/12/20 Python
django项目运行因中文而乱码报错的几种情况解决
2017/11/07 Python
opencv python 图像去噪的实现方法
2018/08/31 Python
Python minidom模块用法示例【DOM写入和解析XML】
2019/03/25 Python
python opencv实现图像边缘检测
2019/04/29 Python
新手如何发布Python项目开源包过程详解
2019/07/11 Python
Django-celery-beat动态添加周期性任务实现过程解析
2020/11/26 Python
python使用numpy中的size()函数实例用法详解
2021/01/29 Python
澳大利亚在线家具、灯饰和家居装饰店:LivingStyles
2018/11/20 全球购物
给校长的建议书100字
2014/05/16 职场文书
体育教师求职信
2014/06/30 职场文书
就业协议书
2014/09/12 职场文书
爱心募捐感谢信
2015/01/22 职场文书
保送生自荐信范文
2015/03/26 职场文书
2015年乡镇纪检工作总结
2015/04/22 职场文书