编程 Python

5个pandas调用函数的方法让数据处理更加灵活自如

Posted in Python onApril 24, 2022

0. 数据预览

这里的数据是虚构的语数外成绩，大家在演示的时候拷贝一下就好啦。

import pandas as pd
df = pd.read_clipboard()
df

姓名	语文	数学	英语	性别	总分
0	才哥	91	95	92	1
1	小明	82	93	91	1
2	小华	82	87	94	1
3	小草	96	55	88	0
4	小红	51	41	70	0
5	小花	58	59	40	0
6	小龙	70	55	59	1
7	杰克	53	44	42	1
8	韩梅梅	45	51	67	0

1. apply

apply可以对DataFrame类型数据按照列或行进行函数处理，默认情况下是按照列（单独对Series亦可）。

在案例数据中，比如我们想将性别列中的1替换为男，0替换为女，那么可以这样搞定。

先自定义一个函数，这个函数有一个参数 s（Series类型数据）。

def getSex(s):
    if s==1:
        return '男'
    elif s==0:
        return '女'

上述函数还有更简洁写法，这里方便理解采用最直观的写法哈。

然后，我们直接使用apply去调用这个函数即可。

df['性别'].apply(getSex)

可以看到输出结果如下：

0 男
1 男
2 男
3 女
4 女
5 女
6 男
7 男
8 女
Name: 性别, dtype: object

当然，我们也可以直接用调用匿名函数lambda的形式：

df['性别'].apply( lambda s: '男' if s==1 else '女' )

可以看到结果是一样的：

0 男
1 男
2 男
3 女
4 女
5 女
6 男
7 男
8 女
Name: 性别, dtype: object

以上是单纯根据一列的值条件进行的数据处理，我们也可以根据多列组合条件（可以了解为按行）进行处理，需要注意这种情况下需要指定参数axis=1，具体看下面案例。

案例中，我们认为总分高于200且数学分数高于90为高分

# 多列条件组合
df['level'] = df.apply(lambda df: '高分' if df['总分']>=200 and df['数学']>=90 else '其他', axis=1)
df

5个pandas调用函数的方法让数据处理更加灵活自如

同样，上述用apply调用的函数都是自定义的，实际上我们也可以调用内置或者pandas/numpy等自带的函数。

比如，求语数外和总分最高分：

# python内置的函数
df[['语文','数学','英语','总分']].apply(max)

语文 96
数学 95
英语 94
总分 278
dtype: int64

求语数外和总分平均分：

# numpy自带的函数
import numpy as np
df[['语文','数学','英语','总分']].apply(np.mean)

语文 69.777778
数学 64.444444
英语 71.444444
总分 205.666667
dtype: float64

2. applymap

applymap则是对每个元素的函数处理，变量是每个元素值。

比如对语数外三科超过90分认为是科目高分

df[['语文','数学','英语']].applymap(lambda x:'高分' if x>=90 else '其他')

语文	数学	英语
0	高分	高分
1	其他	高分
2	其他	其他
3	高分	其他
4	其他	其他
5	其他	其他
6	其他	其他
7	其他	其他
8	其他	其他

3. map

map则是根据输入对应关系映射值返回最终数据，作用于某一列。传入的值可以是字典，键值为原始值，值为需要替换的值。也可以传入一个函数或者字符格式化表达式等等。

以上面性别列中的1替换为男，0替换为女为例，还可以通过map来实现

df['性别'].map({1:'男', 0:'女'})

输出结果也是一致的：

0 男
1 男
2 男
3 女
4 女
5 女
6 男
7 男
8 女
Name: 性别, dtype: object

比如总分列想变成格式化字符：

df['总分'].map('总分：{}分'.format)

0 总分：278分
1 总分：266分
2 总分：263分
3 总分：239分
4 总分：162分
5 总分：157分
6 总分：184分
7 总分：139分
8 总分：163分
Name: 总分, dtype: object

4. agg

agg一般用于聚合，在分组或透视操作中常见到，用法是和apply比较接近。

比如，求语数外和总分的最高分、最低分和平均分

df[['语文','数学','英语','总分']].agg(['max','min','mean'])

5个pandas调用函数的方法让数据处理更加灵活自如

我们还可以对不同的列进行不同的运算（用字典形式指定）

# 语文最高分、数学最低分和英文最高最低分
df.agg({'语文':['max'],'数学':'min','英语':['max','min']})

5个pandas调用函数的方法让数据处理更加灵活自如

当然也支持自定义函数的调用

5. pipe

以上四个调用函数的方法，我们发现被调用的函数的参数就是 DataFrame或Serise数据，如果我们被调用的函数还需要别的参数，那么该如何做呢？

所以，pipe就出现了。

pipe又称管道方法，可以将我们的处理分析过程标准化、流程化。它在调用函数的时候可以带被调用函数的其他参数，这样就方便自定义函数的功能扩展了。

比如，我们需要获取总分大于n，性别为sex的同学的数据，其中n和sex是可变参数，那么用apply等就不太好处理。这个时候，就可以用到pipe方法来搞事了！

我们先定义一个函数：

# 定义一个函数，总分大于等于n，性别为sex的同学数据（sex为2表示不分性别）
def total(df, n, sex):
dfT = df.copy()
if sex == 2:
return dfT[(dfT['总分']>=n)]
else:
return dfT[(dfT['总分']>=n) & (dfT['性别']==sex)]

如果我们要找到总分大于200，不分性别的学生成绩，可以这样：

df.pipe(total,200,2)

5个pandas调用函数的方法让数据处理更加灵活自如

再找总分大于150，性别为男生（1）的学生成绩，可以这样：

df.pipe(total,150,1)

5个pandas调用函数的方法让数据处理更加灵活自如

再找总分大于200，性别为女生（0）的学生成绩，可以这样：

df.pipe(total,200,0)

5个pandas调用函数的方法让数据处理更加灵活自如

以上就是本次我们介绍的5种调用函数的方法，这些操作技巧可以让我们在处理数据时更加灵活自如

到此这篇关于分享5个数据处理更加灵活的pandas调用函数方法的文章就介绍到这了！

5个pandas调用函数的方法让数据处理更加灵活自如

- Author -

Python学习与数据挖掘

- Original Sources -

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Tags in this post...

Python 相关文章推荐

python中List的sort方法指南

Sep 01 Python

讲解Python中if语句的嵌套用法

May 14 Python

Python环境下安装使用异步任务队列包Celery的基础教程

May 07 Python

Python基于hashlib模块的文件MD5一致性加密验证示例

Feb 10 Python

Python 3.7新功能之dataclass装饰器详解

Apr 21 Python

用python实现将数组元素按从小到大的顺序排列方法

Jul 02 Python

Django models.py应用实现过程详解

Jul 29 Python

keras中的卷积层&池化层的用法

May 22 Python

了解一下python内建模块collections

Sep 07 Python

Scrapy爬虫文件批量运行的实现

Sep 30 Python

Python通过fnmatch模块实现文件名匹配

Sep 30 Python

Python加密与解密模块hashlib与hmac

Jun 05 Python

Python 使用 Frame tkraise() 方法在 Tkinter 应用程序中的Frame之间切换

Apr 24 #Python

在 Python 中利用 Pool 进行多线程

Apr 24 #Python

Python何绘制带有背景色块的折线图

python中Pyqt5使用Qlabel标签播放视频

Apr 22 #Python

Python使用MapReduce进行简单的销售统计

python使用pycharm安装pyqt5以及相关配置

Python使用DFA算法过滤内容敏感词

ATS-909X(1) 飞利浦(2) D1875(1) PHILIPS(3) S400(1) SANGEAN(1) L4X25T(1) D1835(1) 山进(2) Grundig(1)

You might like

粗略计算在线时间,bug:ip相同

2006/12/09 PHP

php mssql 分页SQL语句优化持续影响

2009/04/26 PHP

PHP程序员面试切忌急功近利(更需要注重以后的发展)

2010/09/01 PHP

PHP写杨辉三角实例代码

2011/07/17 PHP

php生成图片缩略图的方法

2015/04/07 PHP

php+ajax无刷新上传图片实例代码

2015/11/17 PHP

Laravel实现自定义错误输出内容的方法

2016/10/10 PHP

php的socket编程详解

2016/11/20 PHP

php ajax数据传输和响应方法

2018/08/21 PHP

JS URL传中文参数引发的乱码问题

2009/09/02 Javascript

js数据验证集合、js email验证、js url验证、js长度验证、js数字验证等简单封装

2010/05/15 Javascript

简单时间提示DEMO从0开始一直进行计时

2013/11/19 Javascript

Javascript中的arguments与重载介绍

2015/03/15 Javascript

轻松实现Bootstrap图片轮播

2020/04/20 Javascript

js数组常用操作方法小结(增加,删除,合并,分割等)

2016/08/02 Javascript

如何重置vue打印变量的显示方式

2017/12/06 Javascript

JavaScript伪数组用法实例分析

2017/12/22 Javascript

详解微信小程序审核不通过的解决方法

2018/01/17 Javascript

mpvue中使用flyjs全局拦截的实现代码

2018/09/13 Javascript

vue解决一个方法同时发送多个请求的问题

2018/09/25 Javascript

js Array.slice的8种不同用法示例

2019/07/10 Javascript

JavaScript面向对象程序设计中对象的定义和继承详解

2019/07/29 Javascript

vue实现多级菜单效果

2019/10/19 Javascript

在Gnumeric下使用Python脚本操作表格的教程

2015/04/14 Python

python利用正则表达式搜索单词示例代码

2017/09/24 Python

使用python和pygame绘制繁花曲线的方法

2018/02/24 Python

Python双向循环链表实现方法分析

2018/07/30 Python

Python脚本操作Excel实现批量替换功能

2019/11/20 Python

HTML5 canvas绘制的玫瑰花效果

2014/05/29 HTML / CSS

土耳其时尚购物网站：Morhipo

2017/09/04 全球购物

销售总监岗位职责

2014/01/04 职场文书

高校优秀辅导员事迹材料

2014/05/07 职场文书

机电一体化专业毕业生自荐信

2014/06/19 职场文书

会计稽核岗位职责

2015/04/13 职场文书

基层党支部承诺书

2015/04/30 职场文书

小学数学国培研修日志

2015/11/13 职场文书

5个pandas调用函数的方法让数据处理更加灵活自如

目录

0. 数据预览

1. apply

2. applymap

3. map

4. agg

5. pipe