编程 Python

Python数据分析pandas模块用法实例详解

Posted in Python onNovember 20, 2019

本文实例讲述了Python数据分析pandas模块用法。分享给大家供大家参考，具体如下：

pandas

pandas10分钟入门，可以查看官网：10 minutes to pandas

也可以查看更复杂的cookbook

pandas是非常强大的数据分析包，pandas 是基于 Numpy 构建的含有更高级数据结构和工具的数据分析包。就好比 Numpy的核心是 ndarray，pandas 围绕着 Series 和 DataFrame 两个核心数据结构展开。Series和DataFrame 分别对应于一维的序列和二维表结构。

创建对象

常规导入方式：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

Series

Series 可以看做一个定长的有序字典，它是能够保存任何数据类型（整数，字符串，浮点数，Python对象等）的一维标记数组。
Series对象包含两个主要的属性：index 和 values。
数据可以是Python字典、 ndarray、scalar value标量值（如5）等
创建时有没有index都会设置默认下标，但是索引用的是数组时会默认使用创建时的索引
创建时还可以指定name名字属性，之后可以修改 rename

ser1 = pd.Series(range(10,15),index=list('ABCDE'))
print(ser1)
# 下标和索引等同
print(ser1['A'])
print(ser1[0])

输出：

A    10
B    11
C    12
D    13
E    14
dtype: int64
10
10

取连续多个数据时，下标取值不包含结束位置，索引切片包括结束位置

print(ser1['A':'D'])
print(ser1[0:3])

输出：

A    10
B    11
C    12
D    13
dtype: int64
A    10
B    11
C    12
dtype: int64

取多个数据、条件筛选（布尔索引）

# 注意里面是一个列表
print(ser1[[0,1,3]])
# 布尔索引
print(ser1[(ser1>12)&(ser1<15)])

DataFrame

DataFrame是二维标记数据结构。您可以将其视为电子表格或SQL表，或Series对象。它通常是最常用的pandans对象。像Series一样，DataFrame接受许多不同种类的输入：

Dict of 1D ndarrays, lists, dicts, or Series
2-D numpy.ndarray
Structured or record ndarray
A Series
Another DataFrame

df1 = pd.DataFrame(np.random.randint(10,50,(3,4)), - index=list('ABC'),columns=list('abcd'))

index是行索引，colums是列索引
用字典创建时，键名就是列索引，而且键值可以为列表，会自动补齐

取单行或单列数据，取单个数据

# 列取值，取出的是一个series对象
print(df1['a'])
print(df1['a'].values)
# 取出一行数据的某一行数据，也就是单个数据
print(df1['a']['B']) # 这两个一样
print(df1['a'][1])

取不连续多列，取连续多列（默认不支持连续，需要高级索引）

# 取不连续多列
print(df1[['a','c']])

行索引，可以直接切片,但是默认不能不连续多行取值，下标同理

print('行索引取值##############')
print(df1['A':'A'])
# 取连续多行就是df1['A':'C']

高级索引(花式索引)

一般情况用于DataFrame，这里直接略过Series

loc标签索引

df1 = pd.DataFrame(np.random.randint(10,50,(5,4)), index=list('ABCDE'),columns=list('abcd'))
# 取单行，类型是series
print(df1.loc['A'])
print(type(df1.loc['A']))
# 取连续多行，类型是DataFrame
print(df1.loc['A':'C'])
# 如果没有index索引就用下标，可以取连续多行连续多列
print(df1.loc['A':'D','a':'c'])
# 取不连续多行不连续多列
print(df1.loc[['A','C'],['a','c']])

iloc 位置索引

iloc是下标和lo用法一样，但是下标索引左闭右开，loc是包括最后一位

# DataFrame
print(df1.iloc[0:2, 0]) # 注意和df1.loc['A':'C', 'a']的区别
print(df1.loc['A':'C', 'a'])

ix 标签与位置混合索引

博主使用的pandas 0.24.2版本已经弃用.ix了(warning但还能使用)，所以也就不写了

ix是以上二者的综合，既可以使用索引编号，又可以使用自定义索引，要视情况不同来使用，
如果索引既有数字又有英文，那么这种方式是不建议使用的，容易导致定位的混乱。

增加数据

1	2
增加一行数据	1.df1.loc[‘D'] = [1,2,3,4,5] 2.df1.loc[‘D'] = [np.random.randint(10,20)]
增加一列数据	df1.

希望本文所述对大家Python程序设计有所帮助。

Python数据分析pandas模块用法实例详解

- Author -

闲鱼!!!

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python继承和抽象类的实现方法

Jan 14 Python

在Python中使用matplotlib模块绘制数据图的示例

May 04 Python

详解Python中的type()方法的使用

May 21 Python

Python 两个列表的差集、并集和交集实现代码

Sep 21 Python

Python中的__slots__示例详解

Jul 06 Python

python+pyqt实现12306图片验证效果

Oct 25 Python

python3解析库BeautifulSoup4的安装配置与基本用法

Jun 26 Python

用Python实现数据的透视表的方法

Nov 16 Python

PyGame贪吃蛇的实现代码示例

Nov 21 Python

python 实现目录复制的三种小结

Dec 04 Python

Pycharm 使用 Pipenv 新建的虚拟环境(图文详解)

Apr 16 Python

Python的控制结构之For、While、If循环问题

Jun 30 Python

Python学习笔记之函数的参数和返回值的使用

Nov 20 #Python

Python求解正态分布置信区间教程

Nov 20 #Python

Python pandas RFM模型应用实例详解

Nov 20 #Python

使用Python实现正态分布、正态分布采样

Nov 20 #Python

Python pandas自定义函数的使用方法示例

Nov 20 #Python

Python求正态分布曲线下面积实例

Nov 20 #Python

复化梯形求积分实例——用Python进行数值计算

Nov 20 #Python

You might like

2020显卡排行榜天梯图显卡天梯图2020年3月最新版

2020/04/02 数码科技

PHP Ajax中文乱码问题解决方法

2009/02/27 PHP

PHP移动文件指针ftell()、fseek()、rewind()函数总结

2014/11/18 PHP

php实现的简易扫雷游戏实例

2015/07/09 PHP

浅谈php数组array_change_key_case() 函数和array_chunk()函数

2016/10/22 PHP

PHP的PDO事务与自动提交

2019/01/24 PHP

ThinkPHP3.2.3框架邮件发送功能图文实例详解

2019/04/23 PHP

MooTools 页面滚动浮动层智能定位实现代码

2011/08/23 Javascript

extjs3 combobox取value和text案例详解

2013/02/06 Javascript

javascript 循环调用示例介绍

2013/11/20 Javascript

多选列表框动态添加,移动,删除,全选等操作的简单实例

2014/01/13 Javascript

JavaScript使用DeviceOne开发实战（四）仿优酷视频应用

2015/12/02 Javascript

JS获取随机数和时间转换的简单实例

2016/07/10 Javascript

EditPlus 正则表达式实战(3)

2016/12/15 Javascript

Vue.js 60分钟快速入门教程

2017/03/28 Javascript

完美实现js拖拽效果 return false用法详解

2017/07/28 Javascript

JS求Number类型数组中最大元素方法

2018/04/08 Javascript

jquery+php后台实现省市区联动功能示例

2019/05/23 jQuery

Vue CL3 配置路径别名详解

2019/05/30 Javascript

基于layui轮播图满屏是高度自适应的解决方法

2019/09/16 Javascript

微信小程序实现上拉加载功能

2019/11/20 Javascript

微信小程序获取公众号文章列表及显示文章的示例代码

2020/03/10 Javascript

Python 文件和输入输出小结

2013/10/09 Python

Python 转义字符详细介绍

2017/03/21 Python

利用Python将时间或时间间隔转为ISO 8601格式方法示例

2017/09/05 Python

python opencv实现任意角度的透视变换实例代码

2018/01/12 Python

Python实现判断一行代码是否为注释的方法

2018/05/23 Python

Python中的集合介绍

2019/01/28 Python

python利用wx实现界面按钮和按钮监听和字体改变的方法

2019/07/17 Python

Python字符串及文本模式方法详解

2020/09/10 Python

在HTML5中如何使用CSS建立不可选的文字

2014/10/17 HTML / CSS

博士生入学考试推荐信

2013/11/17 职场文书

行政主管岗位职责

2013/11/18 职场文书

政治学专业毕业生求职信

2014/08/11 职场文书

HTML中table表格拆分合并(colspan、rowspan)

2021/04/07 HTML / CSS

Nginx配置文件详解以及优化建议指南

2021/09/15 Servers