Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)


Posted in Python onJune 14, 2020

1.单列运算

在Pandas中,DataFrame的一列就是一个Series, 可以通过map来对一列进行操作:

df['col2'] = df['col1'].map(lambda x: x**2)

其中lambda函数中的x代表当前元素。可以使用另外的函数来代替lambda函数,例如:

define square(x): 
  return (x ** 2) 
 
df['col2'] = df['col1'].map(square)

2.多列运算

 apply()会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试将各片段组合到一起。

要对DataFrame的多个列同时进行运算,可以使用apply,例如col3 = col1 + 2 * col2:

df['col3'] = df.apply(lambda x: x['col1'] + 2 * x['col2'], axis=1)

其中x带表当前行,可以通过下标进行索引。

示例2

In [44]: f = lambda x : x.max()-x.min()

In [45]: df.apply(f)
Out[45]:
data1  5.042275
data2  1.967290
dtype: float64

In [46]: df.apply(f,axis=1)
Out[46]:
0  2.810074
1  1.009774
2  0.537183
3  0.813714
4  1.750022
dtype: float64

applymap()

用DataFrame的applymap方法,可以将函数应用到元素级的数据上。

In [47]: f = lambda x : x+1

In [48]: df.applymap(f)
Out[48]:
   data1   data2
0 -1.332263 1.477812
1 0.284755 1.294528
2 0.066644 0.603827
3 1.757402 2.571117
4 3.710012 1.959990

Series也有一个元素级函数应用的方法map

In [49]: df['data1']
Out[49]:
0  -2.332263
1  -0.715245
2  -0.933356
3  0.757402
4  2.710012
Name: data1, dtype: float64

In [50]: df['data1'].map(f)
Out[50]:
0  -1.332263
1  0.284755
2  0.066644
3  1.757402
4  3.710012
Name: data1, dtype: float64

3.分组运算

可以结合groupby与transform来方便地实现类似SQL中的聚合运算的操作:

df['col3'] = df.groupby('col1')['col2'].transform(lambda x: (x.sum() - x) / x.count())

在transform函数中x.sum()与x.count()与SQL类似,计算的是当前group中的和与数量,还可以将transform的结果作为一个一个映射来使用, 例如:

sumcount = df.groupby('col1')['col2'].transform(lambda x: x.sum() + x.count()) 
df['col1'].map(sumcount)

对col1进行一个map,得到对应的col2的运算值。

4.聚合函数

结合groupby与agg实现SQL中的分组聚合运算操作,需要使用相应的聚合函数:

df['col2'] = df.groupby('col1').agg({'col1':{'col1_mean': mean, 'col1_sum‘': sum}, 'col2': {'col2_count': count}})

上述代码生成了col1_mean, col1_sum与col2_count列。

示例2

In [52]: df.agg(['mean','sum'])
Out[52]:
     data1   data2
mean -0.102690 0.581455
sum -0.513449 2.907274

函数 说明
count 分组中非Nan值的数量
sum 非Nan值的和
mean 非Nan值的平均值
median 非Nan值的算术中间数
std,var 标准差、方差
min,max 非Nan值的最小值和最大值
prob 非Nan值的积
first,last 第一个和最后一个非Nan值

到此这篇关于Pandas对DataFrame单列/多列进行运算(map, apply, transform, agg)的文章就介绍到这了,更多相关Pandas map apply transform agg内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
一些Python中的二维数组的操作方法
May 02 Python
Python实现文件按照日期命名的方法
Jul 09 Python
浅谈Python 字符串格式化输出(format/printf)
Jul 21 Python
python 把数据 json格式输出的实例代码
Oct 31 Python
python matplotlib绘图,修改坐标轴刻度为文字的实例
May 25 Python
python在html中插入简单的代码并加上时间戳的方法
Oct 16 Python
python中时间转换datetime和pd.to_datetime详析
Aug 11 Python
Python代理IP爬虫的新手使用教程
Sep 05 Python
python GUI库图形界面开发之PyQt5控件QTableWidget详细使用方法与属性
Feb 25 Python
浅析NumPy 切片和索引
Sep 02 Python
利用Python批量识别电子账单数据的方法
Feb 08 Python
tensorflow中的数据类型dtype用法说明
May 26 Python
Python脚本破解压缩文件口令实例教程(zipfile)
Jun 14 #Python
pandas创建DataFrame的7种方法小结
Jun 14 #Python
Python中zipfile压缩文件模块的基本使用教程
Jun 14 #Python
pandas DataFrame运算的实现
Jun 14 #Python
Numpy中ndim、shape、dtype、astype的用法详解
Jun 14 #Python
DataFrame 数据合并实现(merge,join,concat)
Jun 14 #Python
python中pandas库中DataFrame对行和列的操作使用方法示例
Jun 14 #Python
You might like
我的论坛源代码(一)
2006/10/09 PHP
php下关于Cannot use a scalar value as an array的解决办法
2010/08/08 PHP
PHP判断文件是否被引入的方法get_included_files用法示例
2016/11/29 PHP
PHP中类型转换 ,常量,系统常量,魔术常量的详解
2017/10/26 PHP
CI框架(CodeIgniter)操作redis的方法详解
2018/01/25 PHP
深入理解Javascript作用域与变量提升
2013/12/09 Javascript
javascript面向对象特性代码实例
2014/06/12 Javascript
jQuery提交多个表单的小技巧
2014/07/27 Javascript
初识Javascript小结
2015/07/16 Javascript
学习使用jquery iScroll.js移动端滚动条插件
2020/03/24 Javascript
easyui window refresh 刷新两次的解决方法(推荐)
2016/05/18 Javascript
knockoutjs动态加载外部的file作为component中的template数据源的实现方法
2016/09/01 Javascript
解析javascript图片懒加载与预加载的分析总结
2016/10/27 Javascript
JS及JQuery对Html内容编码,Html转义
2017/02/17 Javascript
vue元素实现动画过渡效果
2017/07/01 Javascript
使用vue-cli+webpack搭建vue开发环境的方法
2017/12/22 Javascript
vue实现菜单切换功能
2019/05/08 Javascript
[07:26]2015国际邀请赛第二日TOP10集锦
2015/08/06 DOTA
python 图片验证码代码分享
2012/07/04 Python
python正则分组的应用
2013/11/10 Python
使用Python的Bottle框架写一个简单的服务接口的示例
2015/08/25 Python
pandas中去除指定字符的实例
2018/05/18 Python
python中将zip压缩包转为gz.tar的方法
2018/10/18 Python
python如何查看安装了的模块
2020/06/23 Python
Pycharm调试程序技巧小结
2020/08/08 Python
css3 2D图片转动样式可以扩充到Js当中
2014/04/29 HTML / CSS
异常和异常类的概念
2014/09/12 面试题
大学校庆邀请函
2014/01/11 职场文书
石油大学毕业生自荐信
2014/01/28 职场文书
40岁生日感言
2014/02/15 职场文书
小学数学课题方案
2014/06/15 职场文书
2014年医院党建工作总结
2014/12/20 职场文书
环卫处个人工作总结
2015/03/04 职场文书
实习报告范文
2019/07/30 职场文书
解决Navicat for MySQL 连接 MySQL 报2005错误的问题
2021/05/29 MySQL
Win11使用CAD卡顿或者致命错误怎么办?Win11无法正常使用CAD的解决方法
2022/07/23 数码科技