浅谈哪个Python库才最适合做数据可视化


Posted in Python onJune 28, 2021

数据可视化是任何探索性数据分析或报告的关键步骤,它可以让我们一眼就能洞察数据集。目前有许多非常好的商业智能工具,比如Tableau、googledatastudio和PowerBI,它们可以让我们轻松地创建图形。

然而,数据分析师或数据科学家还是习惯使用 Python 在 Jupyter notebook 上创建可视化效果。目前最流行的用于数据可视化的 Python 库:Matplotlib、Seaborn、plotlyexpress和Altair。每个可视化库都有自己的特点,没有完美的可视化库,我们应该知道每种数据可视化的优缺点,找到适合自己的才是关键。

准备

首先,让我们导入所有重要的库。很可能你的计算机上已经安装了 Matplotlib 和 Seaborn 。但是,你可能没有Plotly Express 和 Altair。现在可以使用 pip install plotly==4.14.3和pip install altair 数据集轻松安装它们。

import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import altair as alt
import plotly.express as px

现在我们将导入数据集。出于演示的目的,我们只创建一个数据框架,其中包含美国人口最多的15个城市。我还将修正城市名称的大写。当我们创建可视化效果时,它将促进编辑过程。

df = pd.read_csv('worldcitiespop.csv')
us = df[df['Country'] == 'us']
us['City'] = us['City'].str.title()
cities = us[['City', 'Population']].nlargest(15, ['Population'], keep='first')

现在我们应该准备好分析每个库。你准备好了吗?

设置难度和初始结果

获胜者:Plotly Express
失败者:Matplotlib、Altair和Seaborn

在这一类中,所有的库都表现良好。它们都很容易设置,基本编辑的结果对大多数分析都足够好,但我们需要有赢家和输家,对吗?

Matplotlib 很容易设置和记住代码。然而,这个图表看起来并不好。它可能会完成数据分析的工作,但在商务会议上的结果并不理想。

浅谈哪个Python库才最适合做数据可视化

Seaborn 创造了一个更好的图表。它会自动添加 x 轴和 y 轴标签。x 记号看起来更好,但对于基本图表来说,这比 Matplotlib 要好得多。

浅谈哪个Python库才最适合做数据可视化

Plotly Expres,表现得非常出色。可以用很少的代码创建一个好看的、专业的条形图。不需要设置图形或字体大小。它甚至可以旋转 x 轴标签。所有这些都只需要一行代码。非常令人印象深刻!

浅谈哪个Python库才最适合做数据可视化

Altair 图表表现良好。它提供了一个好看的图形,但它需要更多的代码,它按字母顺序,这并不可怕,而且在很多情况下都会有帮助,但我觉得这应该是用户应该决定的。

浅谈哪个Python库才最适合做数据可视化

编辑和自定义

优胜者:Plotly Express、Seaborn、Matplotlib
失败者:Altair

我相信这四个库都有可能成为赢家。自定义图表在每一个上的表现却是不同的,但我认为,如果你学习足够,你会学会如何创造美丽的可视化。然而,我正在考虑如何容易地编辑和自定义,把自己想象成一个新用户。

Matplotlib 和 Seaborn 非常容易定制,而且它们的文档非常棒。即使你没有在他们的文档中找到要查找的信息,你也很容易在 Stack Overflow 中找到它。他们还有合作的优势。Seaborn 基于 Matplotlib。因此,如果你知道如何编辑一个,你就会知道如何编辑另一个,这是非常方便的。如果你使用

sns.set_style('darkgrid')

设置 Seaborn 主题,它将影响 Matplotlib,这可能就是为什么 Matplotlib 和 Seaborn 是两个更流行的数据可视化库。

浅谈哪个Python库才最适合做数据可视化

浅谈哪个Python库才最适合做数据可视化

plotly express 从一开始就提供了漂亮的图表,例如,与Matplotlib相比,只需要较少的编辑就可以获得非常不错的可视化效果。它的文档很容易理解,他们通过Shift+Tab提供文档,这非常方便。在我尝试的所有库中,它还提供了最多的定制选项。你可以编辑任何东西,包括字体,标签颜色等,最好的部分是它的毫不费力。它的文档中充满了例子。

浅谈哪个Python库才最适合做数据可视化

我发现 Altair 的文件非常混乱。与其他库不同,Altair没有Shift+Tab快捷键。对于初学者来说,这是非常有问题和困惑的。我能够做一些编辑,但找到有关它的信息是有压力的。在编辑方面与我花在 Matplotlib 和 plotly express 上的时间相比,对于初学者来说,Altair 并不是一个很好的选择。

附加功能

获奖者:Plotly Express 和 Altair
失败者:Matplolib 和 Seaborn

对于这一类,我将考虑除了那些我们可以通过代码实现的功能之外的其他功能。Matplotlib 和 Seaborn 在这一类中是非常基本的。除了代码之外,它们不提供任何额外的编辑或交互选项。然而,Plotly Express 在这一类中大放异彩。首先,图表是互动的。您只需将鼠标悬停在图形上,就可以看到有关它的信息。

浅谈哪个Python库才最适合做数据可视化

Altair 提供了一些选项来保存文件或通过Vega编辑器打开JSON文件。

浅谈哪个Python库才最适合做数据可视化

文档和网站

获奖者:Plotly Express、Altair、Seaborn、Matplotlib

所有这些库的文档都很好。Plotly Express 有一个漂亮的网站,带有代码和可视化演示。很容易阅读和找到有关它的信息。我喜欢他们的网站是多么的精致和精心设计,你甚至可以与图表互动。

浅谈哪个Python库才最适合做数据可视化

Altair 的网站上做得很好。他们的定制文档不是最好的,但是网站看起来不错,很容易找到代码示例。我不会说这是惊人的,但它确实起到了作用。

浅谈哪个Python库才最适合做数据可视化

Seaborn 的网站还可以。有人说他们有最好的文件,包含代码示例。如果你正在寻找定制选项,它可能会变得很棘手,但除此之外,它是一个干净的网站,其文档也相当完整。

浅谈哪个Python库才最适合做数据可视化

Matplotlib有一个完整的网站。在我看来,它有太多的文字,找到一些信息可能有点棘手。然而,信息就在那里。他们还提供PDF格式的文档。

浅谈哪个Python库才最适合做数据可视化

总结

我在本文中分析的四个目前都非常棒的库。所有的可视化库都有优缺点,找好合适自己的才是关键。我最喜欢的是 Plotly Express ,因为它在所有类别中都表现出色。不过,Matplotlib 和 Seaborn 更受欢迎,大多数人都会在电脑上安装它们。Altair 是我最不喜欢之间。你最喜欢的数据可视化库是什么呢?

到此这篇关于浅谈哪个Python库才最适合做数据可视化的文章就介绍到这了,更多相关Python 数据可视化内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现的Kmeans++算法实例
Apr 26 Python
Python使用Supervisor来管理进程的方法
May 28 Python
详解Python中的from..import绝对导入语句
Jun 21 Python
WINDOWS 同时安装 python2 python3 后 pip 错误的解决方法
Mar 16 Python
Python语言描述机器学习之Logistic回归算法
Dec 21 Python
python爬取拉勾网职位数据的方法
Jan 24 Python
在Python中调用Ping命令,批量IP的方法
Jan 26 Python
Python3 串口接收与发送16进制数据包的实例
Jun 12 Python
opencv导入头文件时报错#include的解决方法
Jul 31 Python
python实现音乐播放和下载小程序功能
Apr 26 Python
哈工大自然语言处理工具箱之ltp在windows10下的安装使用教程
May 07 Python
Python采集股票数据并制作可视化柱状图
Apr 04 Python
总结Python变量的相关知识
详解非极大值抑制算法之Python实现
Python实现生活常识解答机器人
Python办公自动化之教你如何用Python将任意文件转为PDF格式
Python移位密码、仿射变换解密实例代码
Pytest中conftest.py的用法
Python实现8种常用抽样方法
You might like
PHP 抓取网页图片并且另存为的实现代码
2010/03/24 PHP
利用phpExcel实现Excel数据的导入导出(全步骤详细解析)
2013/11/26 PHP
使用PHP+MySql+Ajax+jQuery实现省市区三级联动功能示例
2017/09/15 PHP
JS日历 推荐
2006/12/03 Javascript
Javascript基础教程之argument 详解
2015/01/18 Javascript
JS设置网页图片vspace和hspace属性的方法
2015/04/01 Javascript
JS自定义选项卡函数及用法实例分析
2015/09/02 Javascript
全面解析Bootstrap弹窗的实现方法
2015/12/01 Javascript
百度坐标(BD09)、国测局坐标(火星坐标,GCJ02)、和WGS84坐标系之间的转换
2016/02/19 Javascript
jQuery通用的全局遍历方法$.each()用法实例
2016/07/04 Javascript
jQuery实现页面点击后退弹出提示框的方法
2016/08/24 Javascript
利用jQuery的动画函数animate实现豌豆发射效果
2016/08/28 Javascript
React Native实现简单的登录功能(推荐)
2016/09/19 Javascript
JS简单实现查看文档创建日期、修改日期和文档大小的方法示例
2018/04/08 Javascript
JS实现的雪花飘落特效示例
2019/12/03 Javascript
vue下canvas裁剪图片实例讲解
2020/04/16 Javascript
js实现电灯开关效果
2021/01/19 Javascript
ES6的循环与可迭代对象示例详解
2021/01/31 Javascript
python函数返回多个值的示例方法
2013/12/04 Python
python+selenium+autoit实现文件上传功能
2017/08/23 Python
Python栈算法的实现与简单应用示例
2017/11/01 Python
pygame游戏之旅 如何制作游戏障碍
2018/11/20 Python
Django自定义模板过滤器和标签的实现方法
2019/08/21 Python
python 浅谈serial与stm32通信的编码问题
2019/12/18 Python
Ootori在线按摩椅店:一家专业的按摩椅制造商
2019/04/10 全球购物
土耳其新趋势女装购物网站:Addax
2020/01/07 全球购物
餐饮收银员岗位职责
2014/02/07 职场文书
公司联欢会策划方案
2014/05/19 职场文书
王力宏牛津大学演讲稿
2014/05/22 职场文书
宣传标语大全
2014/07/01 职场文书
教师节学生演讲稿
2014/09/03 职场文书
喝酒驾驶检讨书
2014/10/01 职场文书
2014幼儿园保育员工作总结
2014/11/10 职场文书
各类场合主持词开场白范文集锦
2019/08/16 职场文书
分析SQL窗口函数之聚合窗口函数
2022/04/21 Oracle
Redis实现订单过期删除的方法步骤
2022/06/05 Redis