编程 Python

python pandas库的安装和创建

Posted in Python onJanuary 10, 2019

pandas 对于数据分析的人员来说都是必须熟悉的第三方库，pandas 在科学计算上有很大的优势，特别是对于数据分析人员来说，相当的重要。python中有了Numpy ，但是Numpy 还是比较数学化，还需要有一种库能够更加具体的代表数据模型，我们都非常的清楚在数据处理中EXCEL 扮演着非常重要的作用，表格的模式是数据模型最好的一种展现形式。

pandas 是对表格数据模型在python上的模拟，它有简单的像SQL 对数据的处理，能够方便的在python上实现。

pandas 的安装

pandas 在python上的安装同样的使用pip进行：

pip install pandas

pandas 创建对象

pandas 有两种数据结构：Series 和 DataFrame 。

Series

Series 像python中的数据list 一样，每个数据都有自己的索引。从list创建 Series。

>>> import pandas as pd
>>> s1 = pd.Series([100,23,'bugingcode'])
>>> s1
0   100
1   23
2 bugingcode
dtype: object
>>>

在Series 中添加相应的索引：

>>> import numpy as np
>>> ts = pd.Series(np.random.randn(365), index=np.arange(1,366))
>>> ts

在index中设置索引值是一个从1到366的值。

Series 的数据结构最像的是python中的字典，从字典中创建Series：

sd = {'xiaoming':14,'tom':15,'john':13}
s4 = pd.Series(sd)

这时候可以看到Series 已经是自带索引index。

pandas 本身跟 python的另外一个第三方库Matplotlib 有很多的连接，Matplotlib 一个最经常用到的是用来展示数据的，如果还对Matplotlib 不了解的话，后面的章节会进行介绍，现在先拿过来直接用下，如果还没有安装的话，一样的用pip命令安装 pip install Matplotlib ，展示如下数据：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

ts = pd.Series(np.random.randn(365), index=np.arange(1,366))
ts.plot()
plt.show()

python pandas库的安装和创建

一个不规则的图形，在数据分析中，时间是一个重要的特性，因为很多数据都是跟时间是有关系的，销售额跟时间有关系，天气跟时间有关系。。。，在pandas 中也提供了关于时间的一些函数，使用date_range 生成一系列时间。

>>> pd.date_range('01/01/2017',periods=365)
DatetimeIndex(['2017-01-01', '2017-01-02', '2017-01-03', '2017-01-04',
    '2017-01-05', '2017-01-06', '2017-01-07', '2017-01-08',
    '2017-01-09', '2017-01-10',
    ...
    '2017-12-22', '2017-12-23', '2017-12-24', '2017-12-25',
    '2017-12-26', '2017-12-27', '2017-12-28', '2017-12-29',
    '2017-12-30', '2017-12-31'],
    dtype='datetime64[ns]', length=365, freq='D')
>>>

之前我们的图形不规则，有一个原因是数据不是连续的，使用cumsum让数据连续：

如下：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

ts = pd.Series(np.random.randn(365), index=pd.date_range('01/01/2017',periods=365))
ts = ts.cumsum()
ts.plot()
plt.show()

python pandas库的安装和创建

DataFrame

DataFrame 相当于Series 一维的一个扩展，是一种二维的数据模型，相当于EXcel表格中的数据，有横竖两种坐标，横轴很Series 一样使用index，竖轴用columns 来确定，在建立DataFrame 对象的时候，需要确定三个元素：数据，横轴，竖轴。

df = pd.DataFrame(np.random.randn(8,6), index=pd.date_range('01/01/2018',periods=8),columns=list('ABCDEF'))
print df

数据如下：

A   B   C   D   E   F
2018-01-01 0.712636 0.546680 -0.847866 -0.629005 2.152686 0.563907
2018-01-02 -1.292799 1.122098 0.743293 0.656412 0.989738 2.468200
2018-01-03 1.762894 0.783614 -0.301468 0.289608 -0.780844 0.873074
2018-01-04 -0.818066 1.629542 -0.595451 0.910141 0.160980 0.306660
2018-01-05 2.008658 0.456592 -0.839597 1.615013 0.718422 -0.564584
2018-01-06 0.480893 0.724015 -1.076434 -0.253731 0.337147 -0.028212
2018-01-07 -0.672501 0.739550 -1.316094 1.118234 -1.456680 -0.601890
2018-01-08 -1.028436 -1.036542 -0.459044 1.321962 -0.198338 -1.034822

在数据分析的过程中，很常见的一种情况是数据直接从excel 或者cvs 过来，可以excel中读取数据到DataFrame ，数据在 DataFrame 中进行处理：

df = pd.read_excel('data.xlsx',sheet_name= 'Sheet1')
print df

同样的有保存数据到excel 中 to_excel。

处理cvs数据的函数是：read_cvs 和 to_cvs ，处理HDF5的函数为 read_hdf 和 to_hdf 。

访问DataFrame 可以跟二位数组一样的访问方式：

print df['A']

带出横轴标签：

2018-01-01 0.712636
2018-01-02 -1.292799
2018-01-03 1.762894
2018-01-04 -0.818066
2018-01-05 2.008658
2018-01-06 0.480893
2018-01-07 -0.672501
2018-01-08 -1.028436

同样的可以指定某一个元素：

print df['A']['2018-01-01']

对数组进行切片出来，认清横轴和纵轴：

>>> import pandas as pd
>>> df = pd.read_excel('data.xlsx',sheet_name= 'Sheet1')
>>> df[:][0:3]
     A   B   C   D   E   F
2018-01-01 0.712636 0.546680 -0.847866 -0.629005 2.152686 0.563907
2018-01-02 -1.292799 1.122098 0.743293 0.656412 0.989738 2.468200
2018-01-03 1.762894 0.783614 -0.301468 0.289608 -0.780844 0.873074
>>>

DataFrame 涉及的较多的函数，接下来会有更多的介绍。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持三水点靠木。

python pandas库的安装和创建

- Author -

bugingcode

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现将pvr格式转换成pvr.ccz的方法

Apr 28 Python

python爬虫正则表达式之处理换行符

Jun 08 Python

详解python中sort排序使用

Mar 23 Python

Python 批量刷博客园访问量脚本过程解析

Aug 30 Python

python和pywin32实现窗口查找、遍历和点击的示例代码

Apr 01 Python

Python实现电视里的5毛特效实例代码详解

May 15 Python

基于python 取余问题(%)详解

Jun 03 Python

利用Vscode进行Python开发环境配置的步骤

Jun 22 Python

使用Python项目生成所有依赖包的清单方式

Jul 13 Python

Python通过zookeeper实现分布式服务代码解析

Jul 22 Python

只用Python就可以制作的简单词云

Jun 07 Python

python机器学习实现oneR算法(以鸢尾data为例)

Mar 03 Python

Python绘制并保存指定大小图像的方法

Jan 10 #Python

解决Python plt.savefig 保存图片时一片空白的问题

Jan 10 #Python

Python使用pydub库对mp3与wav格式进行互转的方法

Jan 10 #Python

python利用ffmpeg进行录制屏幕的方法

Jan 10 #Python

Python3.6.2调用ffmpeg的方法

Jan 10 #Python

Django组件之cookie与session的使用方法

Jan 10 #Python

通过python的matplotlib包将Tensorflow数据进行可视化的方法

Jan 09 #Python

You might like

smarty高级特性之对象的使用方法

2015/12/25 PHP

Symfony2 session用法实例分析

2016/02/04 PHP

[原创]smarty简单模板变量输出方法

2016/07/09 PHP

php框架CodeIgniter主从数据库配置方法分析

2018/05/25 PHP

JQuery 获取和设置Select选项的代码

2010/02/07 Javascript

动态加载图片路径保持JavaScript控件的相对独立性

2010/09/06 Javascript

JavaScript高级程序设计客户端存储学习笔记

2011/09/10 Javascript

jQuery遍历DOM元素与节点方法详解

2016/04/14 Javascript

jQuery实现弹出窗口弹出div层的实例代码

2017/01/09 Javascript

javascript实现table单元格点击展开隐藏效果(实例代码)

2017/04/10 Javascript

详解nodejs微信公众号开发——4.自动回复各种消息

2017/04/11 NodeJs

微信小程序图片横向左右滑动案例

2017/05/19 Javascript

JQuery和html+css实现带小圆点和左右按钮的轮播图实例

2017/07/22 jQuery

vue项目中使用axios上传图片等文件操作

2017/11/02 Javascript

详解ECMAScript typeof用法

2018/07/25 Javascript

微信小程序使用scroll-view标签实现自动滑动到底部功能的实例代码

2018/11/09 Javascript

JS+php后台实现文件上传功能详解

2019/03/02 Javascript

Vue 数组和对象更新,但是页面没有刷新的解决方式

2019/11/09 Javascript

VUE子组件向父组件传值详解（含传多值及添加额外参数场景）

2020/09/01 Javascript

简述Python中的面向对象编程的概念

2015/04/27 Python

Python网络爬虫出现乱码问题的解决方法

2017/01/05 Python

python3爬取各类天气信息

2018/02/24 Python

Python for循环与range函数的使用详解

2019/03/23 Python

python 将有序数组转换为二叉树的方法

2019/03/26 Python

Python程序包的构建和发布过程示例详解

2019/06/09 Python

python getopt模块使用实例解析

2019/12/18 Python

Pytorch 的损失函数Loss function使用详解

2020/01/02 Python

Django 5种类型Session使用方法解析

2020/04/29 Python

基于python 将列表作为参数传入函数时的测试与理解

2020/06/05 Python

物流管理专业毕业生求职信

2014/03/23 职场文书

教师节活动主持词

2014/04/02 职场文书

安全环保标语

2014/06/09 职场文书

护理学专业求职信

2014/06/29 职场文书

党课培训心得体会

2014/09/02 职场文书

开网店计划分析

2019/07/30 职场文书

Python实现简单的猜单词

2021/06/15 Python