python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python探索之创建二叉树
Oct 25 Python
python3获取两个日期之间所有日期,以及比较大小的实例
Apr 08 Python
我喜欢你 抖音表白程序python版
Apr 07 Python
对python中的os.getpid()和os.fork()函数详解
Aug 08 Python
Python简易版图书管理系统
Aug 12 Python
使用python实现离散时间傅里叶变换的方法
Sep 02 Python
Python计算IV值的示例讲解
Feb 28 Python
在django项目中导出数据到excel文件并实现下载的功能
Mar 13 Python
python 检测图片是否有马赛克
Dec 01 Python
python 如何把docker-compose.yaml导入到数据库相关条目里
Jan 15 Python
解决jupyter notebook图片显示模糊和保存清晰图片的操作
Apr 24 Python
python实现简单的名片管理系统
Apr 26 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
使用PHP uniqid函数生成唯一ID
2015/11/18 PHP
php中文字符串截取多种方法汇总
2016/10/06 PHP
PHP区块查询实现方法分析
2018/05/12 PHP
setTimeout和setInterval的浏览器兼容性分析
2007/02/27 Javascript
event.keyCode键码值表 附只能输入特定的字符串代码
2009/05/15 Javascript
JavaScript弹簧振子超简洁版 完全符合能量守恒,胡克定理
2009/10/25 Javascript
高效率JavaScript编写技巧整理
2013/08/23 Javascript
JS两种定义方式的区别、内部原理
2013/11/21 Javascript
javascript 对象数组根据对象object key的值排序
2015/03/09 Javascript
javascript中DOM复选框选择用法实例
2015/05/14 Javascript
简单实现js浮动框
2016/12/13 Javascript
基于Nodejs利用socket.io实现多人聊天室
2017/02/22 NodeJs
php register_shutdown_function函数详解
2017/07/23 Javascript
关于Vue Webpack2单元测试示例详解
2017/08/14 Javascript
JavaScript设计模式之构造函数模式实例教程
2018/07/02 Javascript
小程序开发踩坑:页面窗口定位(相对于浏览器定位)(推荐)
2019/04/25 Javascript
python实现rsa加密实例详解
2017/07/19 Python
matplotlib设置legend图例代码示例
2017/12/19 Python
python数据封装json格式数据
2018/03/04 Python
Python matplotlib绘图可视化知识点整理(小结)
2018/03/16 Python
Python实现的序列化和反序列化二叉树算法示例
2019/03/02 Python
Django 中间键和上下文处理器的使用
2019/03/17 Python
numpy库与pandas库axis=0,axis= 1轴的用法详解
2019/05/27 Python
python读取Excel表格文件的方法
2019/09/02 Python
python复合条件下的字典排序
2020/12/18 Python
以下为Windows NT 下的32 位C++程序,请计算sizeof 的值
2016/12/07 面试题
岗位职责定义及内容
2013/11/08 职场文书
2014年小学教师工作自我评价
2014/09/22 职场文书
北京故宫的导游词
2015/01/31 职场文书
产品质量保证书范本
2015/02/27 职场文书
2016年春节慰问信息
2015/03/25 职场文书
公司员工培训管理制度
2015/08/04 职场文书
2016年三严三实党课学习心得体会
2016/01/06 职场文书
员工升职自我评价
2019/03/26 职场文书
导游词之大雁塔景区
2019/09/17 职场文书
《烈火英雄》观后感:致敬和平时代的英雄
2019/11/11 职场文书