Python自定义聚合函数merge与transform区别详解


Posted in Python onMay 26, 2020

1.自定义聚合函数,结合agg使用

2. 同时使用多个聚合函数

3. 指定某一列使用某些聚合函数

4.merge与transform使用

import pandas as pd
  import numpy as np
  np.random.seed(1)
  dict_data = {
    'k1': ['a', 'b', 'c', 'd', 'a', 'b', 'c', 'd'],
    'k2': ['A', 'B', 'C', 'D', 'A', 'B', 'C', 'D'],
    'data1': np.random.randint(1,10,8),
    'data2': np.random.randint(1,10,8)
  }
  df = pd.DataFrame(dict_data)
  print('df=\n',df)
  df2 = df.groupby('k1').sum()
  # df2 = df.sum()
  print("df.groupby('k1').sum()\n",df2)

  # 使用聚合函数
  def cus(df):
    return df.max()-df.min()
  # 默认列索引为列名。元组第0个元素‘Max',‘mu_cus'为自定义列名称,第一个元素为聚合函数名称
  print("使用聚合函数1\n",df.groupby('k1').agg(['sum',('Max','max'),('mu_cus',cus)]))
  # 制定某一列使用某个聚合函数, 元组不能用来重命名列名了,元组里面的函数,表示这一列将会执行的聚合函数
  print("使用聚合函数2\n",df.groupby('k1').agg({'data1':('min', 'max'),'data2':'min'}))

  df3 = df.groupby('k1').sum().add_prefix('sum_')
  print('df3=\n',df3)
  # 如果不使用add_prefix('sum_'),那么在merge时候data1余data2列名相同,会被自动重命名
  print('merge=\n',pd.merge(df,df3,on='k1')) 

  transform_df = df.groupby('k1').transform(np.sum).add_prefix('sum_')
  print(transform_df)
  df[transform_df.columns]=transform_df # transform_df.columns Index(['sum_k2', 'sum_data1', 'sum_data2'], dtype='object')
  # df[transform_df.columns.values]=transform_df #等价,# transform_df.columns.values ['sum_k2', 'sum_data1', 'sum_data2']
 print(df) 
 exit()

结果

df=
  k1 k2 data1 data2
0 a A   6   3
1 b B   9   5
2 c C   6   6
3 d D   1   3
4 a A   1   5
5 b B   2   3
6 c C   8   5
7 d D   7   8
df.groupby('k1').sum()
   data1 data2
k1       
a    7   8
b   11   8
c   14   11
d    8   11
使用聚合函数1
  data1      data2      
   sum Max mu_cus  sum Max mu_cus
k1                 
a   7  6   5   8  5   2
b   11  9   7   8  5   2
c   14  8   2  11  6   1
d   8  7   6  11  8   5
使用聚合函数2
  data1   data2
   min max  min
k1        
a   1  6   3
b   2  9   3
c   6  8   5
d   1  7   3
df3=
   sum_data1 sum_data2
k1           
a      7     8
b     11     8
c     14     11
d      8     11
merge=
  k1 k2 data1 data2 sum_data1 sum_data2
0 a A   6   3     7     8
1 a A   1   5     7     8
2 b B   9   5     11     8
3 b B   2   3     11     8
4 c C   6   6     14     11
5 c C   8   5     14     11
6 d D   1   3     8     11
7 d D   7   8     8     11
 sum_k2 sum_data1 sum_data2
0   AA     7     8
1   BB    11     8
2   CC    14    11
3   DD     8    11
4   AA     7     8
5   BB    11     8
6   CC    14    11
7   DD     8    11
 k1 k2 data1 data2 sum_k2 sum_data1 sum_data2
0 a A   6   3   AA     7     8
1 b B   9   5   BB    11     8
2 c C   6   6   CC    14    11
3 d D   1   3   DD     8    11
4 a A   1   5   AA     7     8
5 b B   2   3   BB    11     8
6 c C   8   5   CC    14    11
7 d D   7   8   DD     8    11

Process finished with exit code 0

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python利用IPython提高开发效率
Aug 10 Python
修复CentOS7升级Python到3.6版本后yum不能正确使用的解决方法
Jan 26 Python
python3+PyQt5实现自定义分数滑块部件
Apr 24 Python
Python开启线程,在函数中开线程的实例
Feb 22 Python
python 反编译exe文件为py文件的实例代码
Jun 27 Python
Python绘制堆叠柱状图的实例
Jul 09 Python
python 多维高斯分布数据生成方式
Dec 09 Python
使用Python matplotlib作图时,设置横纵坐标轴数值以百分比(%)显示
May 16 Python
学习python需要有编程基础吗
Jun 02 Python
python 实现两个npy档案合并
Jul 01 Python
Python logging模块原理解析及应用
Aug 13 Python
python处理写入数据代码讲解
Oct 22 Python
Python Tornado实现WEB服务器Socket服务器共存并实现交互的方法
May 26 #Python
tensorflow实现从.ckpt文件中读取任意变量
May 26 #Python
打印tensorflow恢复模型中所有变量与操作节点方式
May 26 #Python
tensorflow模型的save与restore,及checkpoint中读取变量方式
May 26 #Python
tensorflow从ckpt和从.pb文件读取变量的值方式
May 26 #Python
Pytorch转keras的有效方法,以FlowNet为例讲解
May 26 #Python
Django+Celery实现动态配置定时任务的方法示例
May 26 #Python
You might like
FleaPHP的安全设置方法
2008/09/15 PHP
PHP统一页面编码避免乱码问题
2015/04/09 PHP
php源码分析之DZX1.5字符串截断函数cutstr用法
2015/06/17 PHP
php实现数字补零的方法总结
2018/09/12 PHP
Laravel 修改验证异常的响应格式实例代码详解
2020/05/25 PHP
JavaScript静态的动态
2006/09/18 Javascript
JS效率个人经验谈(8-15更新),加入range技巧
2007/01/09 Javascript
Javascript 获取LI里的内容
2008/12/17 Javascript
JavaScript 一道字符串分解的题目
2011/08/03 Javascript
限制textbox或textarea输入字符长度的JS代码
2013/10/16 Javascript
Jquery获取和修改img的src值的方法
2014/02/17 Javascript
jQuery toggleClass应用实例(附效果图)
2014/04/06 Javascript
js调试系列 初识控制台
2014/06/18 Javascript
对之前写的jquery分页做下升级
2014/06/19 Javascript
JavaScript italics方法入门实例(把字符串显示为斜体)
2014/10/17 Javascript
jquery的总体架构分析及实现示例详解
2014/11/08 Javascript
jQuery中contents()方法用法实例
2015/01/08 Javascript
无缝滚动的简单实现代码(推荐)
2016/06/07 Javascript
D3.js封装文本实现自动换行和旋转平移等功能
2016/10/14 Javascript
JavaScript插件Tab选项卡效果
2017/11/14 Javascript
vue项目实现设置根据路由高亮对应的菜单项操作
2020/08/06 Javascript
[15:46]教你分分钟做大人——沙王
2015/03/11 DOTA
Django实现快速分页的方法实例
2017/10/22 Python
python合并同类型excel表格的方法
2018/04/01 Python
python3写的简单本地文件上传服务器实例
2018/06/04 Python
Python对CSV、Excel、txt、dat文件的处理
2018/09/18 Python
使用python从三个角度解决josephus问题的方法
2020/03/27 Python
Django模板获取field的verbose_name实例
2020/05/19 Python
keras model.fit 解决validation_spilt=num 的问题
2020/06/19 Python
美国高端医师级美容产品电商:BeautifiedYou.com
2017/04/17 全球购物
新奥尔良珠宝:Mignon Faget
2020/11/23 全球购物
机械专业毕业生自荐信
2013/11/02 职场文书
鼓励运动员的广播稿
2014/02/08 职场文书
幼儿园元旦亲子活动方案
2014/02/17 职场文书
坚定理想信念心得体会
2014/03/11 职场文书
2014年组织委员工作总结
2014/12/01 职场文书