利用Python绘制MySQL数据图实现数据可视化


Posted in Python onMarch 30, 2015

本教程的所有Python代码可以在网上的IPython notebook中获取。

考虑在公司里使用Plotly?可以看一下Plotly的on-premises企业版。(注:On-premises是指软件运行在工作场所或公司内部,详见维基百科)

注意操作系统:尽管Windows或Mac用户也可以跟随本文操作,但本文假定你使用的是Ubuntu系统(Ubuntu桌面版或Ubuntu服务器版)。如果你没有Ubuntu Server,你可以通过Amazon的Web服务建立一个云平台(阅读这份教程的前半部分)。如果你用的是Mac,我们推荐你购买并下载VMware Fusion,在上面安装Ubuntu桌面版。你也可以通过Zareason购买一台便宜的预装Ubuntu桌面版/服务器版的笔记本或服务器。

使用Python读取MySQL的数据并绘图很简单,所有你需要的工具都可以免费下载。本文会展示怎么做。如果你遇到问题或者卡住了,可以给feedback@plot.ly发送邮件,也可以在本文下面评论,或者在tweeter上@plotlygraphs。
第1步:确保MySQL已安装且在运行

首先,你需要有一台安装了MySQL的计算机或服务器。你可以通过以下方法检查MySQL是否安装:打开控制台,输入“mysql”,如果你收到MySQL无法连接的错误,这意味着MySQL安装了,但是没有运行。在命令行或“Terminal”中,尝试输入sudo /etc/init.d/mysql start并按回车来启动MySQL。

如果MySQL没有安装,不要失望。在Ubuntu中下载并安装只需一行命令:

shell> sudo apt-get install mysql-server --fix-missing

安装过程中会让你输入一个密码。安装结束后,你可以在终端中键入以下命令进入MySQL控制台:
 

shell> sudo mysql -uroot -p

输入“exit”就可以退出MySQL控制台,。

本教程使用MySQL经典的“world”样例数据库。如果你想跟随我们的步骤,可以在MySQL文档中心下载world数据库。你也可以在命令行中使用wget下载:
 

shell> wget http://downloads.mysql.com/docs/world.sql.zip

然后解压文件:
 

shell> unzip world.sql.zip

(如果unzip没有安装,输入sudo apt-get install unzip安装)

现在需要把world数据库导入到MySQL,启动MySQL控制台:
 

shell> sudo mysql -uroot -p

进入控制台后,通过以下MySQL命令使用world.sql文件创建world数据库:
 

mysql> CREATE DATABASE world;
mysql> USE world;
mysql> SOURCE /home/ubuntu/world.sql;

(在上面的SOURCE命令中,确保将路径改为你自己world.sql所在目录)。
上述操作说明摘自MySQL文档中心。
第2步:使用Python连接MySQL

使用Python连接MySQL很简单。关键得安装python的MySQLdb包。首先需要安装两项依赖:
 

shell> sudo apt-get install python-dev
shell> sudo apt-get install libmysqlclient-dev

然后安装Python的MySQLdb包:
 

shell> sudo pip install MySQL-python

现在,启动Python并导入MySQLdb。你可以在命令行或者IPython notebook中执行:
 

shell> python
>>> import MySQLdb

创建MySQL中world数据库的连接:
 

>>> conn = MySQLdb.connect(host="localhost", user="root", passwd="XXXX", db="world")

cursor是用来创建MySQL请求的对象。
 

>>> cursor = conn.cursor()

我们将在Country表中执行查询。
第3步:Python中执行MySQL查询

cursor对象使用MySQL查询字符串执行查询,返回一个包含多个元组的元组——每行对应一个元组。如果你刚接触MySQL语法和命令,在线的MySQL参考手册是一个很不错的学习资源。
 

>>> cursor.execute('select Name, Continent, Population, LifeExpectancy, GNP from Country');
>>> rows = cursor.fetchall()

rows,也就是查询的结果,是一个包含多个元组的元组,像下面这样:

利用Python绘制MySQL数据图实现数据可视化

使用Pandas的DataFrame来处理每一行要比使用一个包含元组的元组方便。下面的Python代码片段将所有行转化为DataFrame实例:
 

>>> import pandas as pd
>>> df = pd.DataFrame( [[ij for ij in i] for i in rows] )
>>> df.rename(columns={0: 'Name', 1: 'Continent', 2: 'Population', 3: 'LifeExpectancy', 4:'GNP'}, inplace=True);
>>> df = df.sort(['LifeExpectancy'], ascending=[1]);

完整的代码可以参见IPython notebook
第4步:使用Plotly绘制MySQL数据

现在,MySQL的数据存放在Pandas的DataFrame中,可以轻松地绘图。下面的代码用来绘制国家GNP(国民生产总值)VS平均寿命的图,鼠标悬停的点会显示国家名称。确保你已经下载了Plotly的Python库。如果没有,你可以参考一下它的入门指南。
 

import plotly.plotly as py
from plotly.graph_objs import *
 
trace1 = Scatter(
   x=df['LifeExpectancy'],
   y=df['GNP'],
   text=country_names,
   mode='markers'
)
layout = Layout(
   xaxis=XAxis( title='Life Expectancy' ),
   yaxis=YAxis( type='log', title='GNP' )
)
data = Data([trace1])
fig = Figure(data=data, layout=layout)
py.iplot(fig, filename='world GNP vs life expectancy')

完整的代码在这份IPython notebook中。下面是作为一个iframe嵌入的结果图:

利用Python绘制MySQL数据图实现数据可视化

利用Plotly的Python用户指南中的气泡图教程,我们可以用相同的MySQL数据绘制一幅气泡图,气泡大小表示人口的多少,气泡的颜色代表不同的大洲,鼠标悬停会显示国家名称。下面显示的是作为一个iframe嵌入的气泡图。

利用Python绘制MySQL数据图实现数据可视化

创建这个图表以及这个博客中的所有python代码都可以从这个IPython notebook中拷贝。

Python 相关文章推荐
Python中的Matplotlib模块入门教程
Apr 15 Python
在pandas中一次性删除dataframe的多个列方法
Apr 10 Python
python3+PyQt5实现文档打印功能
Apr 24 Python
使用Python机器学习降低静态日志噪声
Sep 29 Python
Python编程图形库之Pillow使用方法讲解
Dec 28 Python
pycharm修改file type方式
Nov 19 Python
手把手教你进行Python虚拟环境配置教程
Feb 03 Python
jupyter notebook参数化运行python方式
Apr 10 Python
Python爬虫实例——scrapy框架爬取拉勾网招聘信息
Jul 14 Python
matplotlib绘制鼠标的十字光标的实现(内置方式)
Jan 06 Python
python压包的概念及实例详解
Feb 17 Python
Python自动化实战之接口请求的实现
May 30 Python
Python面向对象编程中的类和对象学习教程
Mar 30 #Python
详细介绍Python函数中的默认参数
Mar 30 #Python
在Python中利用Into包整洁地进行数据迁移的教程
Mar 30 #Python
在Linux上安装Python的Flask框架和创建第一个app实例的教程
Mar 30 #Python
使用Python中PDB模块中的命令来调试Python代码的教程
Mar 30 #Python
深入讨论Python函数的参数的默认值所引发的问题的原因
Mar 30 #Python
使用Python标准库中的wave模块绘制乐谱的简单教程
Mar 30 #Python
You might like
phpMyAdmin链接MySql错误 个人解决方案
2009/12/28 PHP
php下连接mssql2005的代码
2011/01/17 PHP
PHP的可变变量名的使用方法分享
2012/02/05 PHP
smarty模板引擎从配置文件中获取数据的方法
2015/01/22 PHP
php简单操作mysql数据库的类
2015/04/16 PHP
PHP 进度条函数的简单实例
2017/09/19 PHP
PHP实现基于状态的责任链审批模式详解
2019/05/31 PHP
php判断目录存在的简单方法
2019/09/26 PHP
载入进度条 效果
2006/07/08 Javascript
fix-ie5.js扩展在IE5下不能使用的几个方法
2007/08/20 Javascript
用JavaScript页面不刷新时全选择,全删除(GridView)
2009/04/14 Javascript
jquery animate图片模向滑动示例代码
2011/01/26 Javascript
简单漂亮的js弹窗可自由拖拽且兼容大部分浏览器
2013/10/22 Javascript
用js控制组织结构图可以任意拖拽到指定位置
2014/01/17 Javascript
Node.js 制作实时多人游戏框架
2015/01/08 Javascript
jquery使用正则表达式验证email地址的方法
2015/01/22 Javascript
JS表单验证的代码(常用)
2016/04/08 Javascript
jQuery Mobile和HTML5开发App推广注册页
2016/11/07 Javascript
Node.js 中exports 和 module.exports 的区别
2017/03/14 Javascript
在vue中使用vuex,修改state的值示例
2019/11/08 Javascript
使用 UniApp 实现小程序的微信登录功能
2020/06/09 Javascript
python 随机数使用方法,推导以及字符串,双色球小程序实例
2017/09/12 Python
解决pandas使用read_csv()读取文件遇到的问题
2018/06/15 Python
PyTorch中的拷贝与就地操作详解
2020/12/09 Python
amaze ui 的使用详细教程
2020/08/19 HTML / CSS
amazeui页面分析之登录页面的示例代码
2020/08/25 HTML / CSS
美国著名的婴儿学步鞋老品牌:Robeez
2016/08/20 全球购物
德国领先的大尺码和超大尺码男装在线零售商:Bigtex
2019/06/22 全球购物
酒吧副总经理岗位职责
2013/12/10 职场文书
大学校庆邀请函
2014/01/11 职场文书
我的理想演讲稿
2014/04/30 职场文书
2014年社区综治工作总结
2014/11/17 职场文书
北京青年观后感
2015/06/15 职场文书
葬礼主持词
2015/07/02 职场文书
新入职员工工作总结
2015/10/15 职场文书
Pandas数据类型之category的用法
2021/06/28 Python