编程 Python

Pandas实现DataFrame的简单运算、统计与排序

Posted in Python onMarch 31, 2022

操作	方法	操作	方法
求和	sum	最大值	max
求均值	mean	最小值	min
求方差	var	标准差	std
中位数	median	众数	mode
分位数	quantile

一.运算

接上文的例子，我们已经有了N个学生的数学、语文、英语的成绩表，现在，我们要算出每个学生的总成绩，那么我们就可以用以下的方法：

'''
行的求和以下演示两种方法：
方法1：先把待求和的列数据删选出来（剔除掉name列）,然后使用sum函数求和
方法2：把待求和的列一个一个选出来然后使用运算符求和
两种方法最后的结果为像原有的DataFrame中新增一列，数据为每行数据的求和
'''
df['sum'] = df[['chinese', 'math', 'english']].sum(1)	#方法1

df['sum'] = df['chinese'] + df['math'] + df['english']	#方法2

Output：
        name  chinese  english  math  sum
0   XiaoMing       99      100    80  279
1      LiHua      102       79    92  273
2  HanMeiNei      111      130   104  345

在sum方法中我们传入了参数1，代表的是我们使用的轴（axis）为行（对行数据进行求和），如果想要计算出每列的求和我们只用传入0即可（sum函数默认参数为0，所以也可不传）：

df[['chinese', 'math', 'english']].sum(0)

Output：
chinese    312
math       276
english    309
dtype: int64

现在有了总成绩，那么数学老师或者语文老师就会关心本班学生的数据平均分是多少，同样的，我们可以非常快速的计算出来：

df['math'].mean()		#方法一：直接使用Pandas提供的mean求均值方法

df['math'].sum() / df.shape[0]	#方法二：使用求和方法算出总和后除以总人数（行数）

Output：
92.0

本?中使用了DataFrame的shape方法，这个方法是用来显示DataFrame的行数和列数的，行数为0，列数1。需要注意的是输出的列数值是不含索引列的。

上述?只计算了数学的平均分，感兴趣的小伙伴可以自行基础出英语和语文的平均分哦~

二.统计

这个时候数学老师又有新的需求了，他想查看本班学生数学成绩的最高分、最低分、中位数等统计数据，那么根本不慌，Pandas统统可以帮我们搞定：

df['math'].min()  # math列的最小值
Output：80

df['math'].max()  # math列的最大值
Output：104

df['math'].quantile([0.3, 0.4, 0.5])  # math列的30%、40%、50%分位数
Output：
0.3    87.2
0.4    89.6
0.5    92.0
Name: math, dtype: float64

df['math'].std() # math列的标准差
Output：12

df['math'].var() # math列的方差
Output：144

df['math'].mean() # math列的平均数
Output：92

df['math'].median() # math列的中位数
Output：92

df['math'].mode() # math列的众数，返回一个Series对象（有可能出现并列的情况，例子中众数为1，所以都返回）
Output:
0     80
1     92
2    104
dtype: int64

我们也可以使用DataFrame的describe方法对DataFrame查看基本的统计情况：

df.describe()

Outprint:
          chinese     english   math         sum
count    3.000000    3.000000    3.0    3.000000
mean   104.000000  103.000000   92.0  299.000000
std      6.244998   25.632011   12.0   39.949969
min     99.000000   79.000000   80.0  273.000000
25%    100.500000   89.500000   86.0  276.000000
50%    102.000000  100.000000   92.0  279.000000
75%    106.500000  115.000000   98.0  312.000000
max    111.000000  130.000000  104.0  345.000000

三.排序

一般来讲我们的成绩表都是按照总分从高到低进行排序：

df = df.sort_values(by='sum', ascending=False)


Output:
        name  chinese  english  math  sum
2  HanMeiNei      111      130   104  345
0   XiaoMing       99      100    80  279
1      LiHua      102       79    92  273

可以看到我们使用了sort_values方法对DataFrame进行排序，同时by参数传入‘sum’指定按照‘sum’字段进行排序，ascending用来设置是降序（False）还是升序（True，默认值）排序。使用sort_values排序后默认会返回一个新的DataFrame对象，也就是说并不会影响原有的DataFrame对象，所以例子中我们才会把排序后的对象赋值给原有的DataFrame对象，如果不想排序后创建新的对象也是可以的，只需要传入inplace=True即可（在原有的DataFrame基础上修改）：

df.sort_values(by='sum', ascending=False, inplace=True)
print(df)

Output:
        name  chinese  english  math  sum
2  HanMeiNei      111      130   104  345
0   XiaoMing       99      100    80  279
1      LiHua      102       79    92  273

细心的小伙伴可能会发现当我们进行排序后，如果DataFrame中的行数据有调整的话，其行的索引值是不会更改的，上述例子中因为我们用了默认的递增数列索引，所以排序后看起来并不是很友好，不过不用担心，我们还是可以重置索引值的：

df = df.sort_values(by='sum', ascending=False).reset_index()

Output:
   index       name  chinese  english  math  sum
0      2  HanMeiNei      111      130   104  345
1      0   XiaoMing       99      100    80  279
2      1      LiHua      102       79    92  273

使用reset_index重设索引后我们的DataFrame对象的索引列确实被重置成了递增的序列，同时也多了列名为index的一列数据。当然我们可以传入drop=True将原有的索引列不插入到新的DataFrame中：

df = df.sort_values(by='sum', ascending=False).reset_index(drop=True)

        name  chinese  english  math  sum
0  HanMeiNei      111      130   104  345
1   XiaoMing       99      100    80  279
2      LiHua      102       79    92  273

为了更直观的展示排名情况，我们可以索引值+1这样就展示出了学生的排名情况：

df.index += 1

        name  chinese  english  math  sum
1  HanMeiNei      111      130   104  345
2   XiaoMing       99      100    80  279
3      LiHua      102       79    92  273

到此这篇关于Pandas实现DataFrame的简单运算、统计与排序的文章就介绍到这了,更多相关Pandas DataFrame运算统计与排序内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

Pandas实现DataFrame的简单运算、统计与排序

- Author -

Jackson_Wang

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python多线程学习资料

Dec 19 Python

在Python上基于Markov链生成伪随机文本的教程

Apr 17 Python

python使用post提交数据到远程url的方法

Apr 29 Python

Python3读取zip文件信息的方法

May 22 Python

12步入门Python中的decorator装饰器使用方法

Jun 20 Python

PyCharm设置每行最大长度限制的方法

Jan 16 Python

Python GUI编程文本弹窗的实例

Jun 11 Python

python实现一行输入多个值和一行输出多个值的例子

Jul 16 Python

python能做什么 python的含义

Oct 12 Python

python3实现单目标粒子群算法

Nov 14 Python

python中matplotlib实现随鼠标滑动自动标注代码

Apr 23 Python

PyCharm配置anaconda环境的步骤详解

Jul 31 Python

Pandas数据结构之Series的使用

Mar 31 #Python

python获取字符串中的email

Mar 31 #Python

Python利用FlashText算法实现替换字符串

详解Python flask的前后端交互

Mar 31 #Python

ubuntu安装jupyter并设置远程访问的实现

Python中time与datetime模块使用方法详解

Mar 31 #Python

Python用tkinter实现自定义记事本的方法详解

Mar 31 #Python

You might like

实现树状结构的两种方法

2006/10/09 PHP

php实现上传图片生成缩略图示例

2014/04/13 PHP

文件上传之SWFUpload插件（代码）

2015/07/30 PHP

php判断邮箱地址是否存在的方法

2016/02/13 PHP

PHP程序中的文件锁、互斥锁、读写锁使用技巧解析

2016/03/21 PHP

PHP创建/删除/复制文件夹、文件

2016/05/03 PHP

Zend Framework入门教程之Zend_Config组件用法详解

2016/12/09 PHP

Yii 2中的load()和save()示例详解

2017/08/03 PHP

在php的yii2框架中整合hbase库的方法

2018/09/20 PHP

javascript编程起步（第四课）

2007/02/27 Javascript

JS 的应用开发初探(mootools)

2009/12/19 Javascript

JavaScript高级程序设计（第3版）学习笔记2 js基础语法

2012/10/11 Javascript

chrome下img加载对height()的影响示例探讨

2014/05/26 Javascript

使用jquery+CSS实现控制打印样式

2014/12/31 Javascript

使用DNode实现php和nodejs之间通信的简单实例

2015/07/06 NodeJs

完美实现bootstrap分页查询

2015/12/09 Javascript

jQuery鼠标悬浮链接弹出跟随图片实例代码

2016/01/08 Javascript

js获取当前年月日-YYYYmmDD格式的实现代码

2016/06/01 Javascript

JS for循环中i++ 和 ++i的区别介绍

2016/07/20 Javascript

Vue关于数据绑定出错解决办法

2017/05/15 Javascript

Vue中的无限加载vue-infinite-loading的方法

2018/04/08 Javascript

JS实现匀速与减速缓慢运动的动画效果封装示例

2018/08/27 Javascript

详解如何使用nvm管理Node.js多版本

2019/05/06 Javascript

JavaScript数组及常见操作方法小结

2019/11/13 Javascript

全面了解Python的getattr(),setattr(),delattr(),hasattr()

2016/06/14 Python

利用python解决mysql视图导入导出依赖的问题

2017/12/17 Python

详解python中的Turtle函数库

2018/11/19 Python

python中数组和矩阵乘法及使用总结（推荐）

2019/05/18 Python

python替换字符串中的子串图文步骤

2019/06/19 Python

Python面向对象原理与基础语法详解

2020/01/02 Python

TensorFlow实现打印每一层的输出

2020/01/21 Python

OpenCV+python实现实时目标检测功能

2020/06/24 Python

YSL Beauty加拿大官方商城：圣罗兰美妆加拿大

2017/05/15 全球购物

计算机专业毕业生自荐信

2013/12/31 职场文书

《孙权劝学》教学反思

2014/04/23 职场文书

Python first-order-model实现让照片动起来

2022/06/25 Python

Pandas实现DataFrame的简单运算、统计与排序

目录

一.运算

二.统计

三.排序