python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python写的一个文本编辑器
Jan 23 Python
python使用pil进行图像处理(等比例压缩、裁剪)实例代码
Dec 11 Python
快速查询Python文档方法分享
Dec 27 Python
和孩子一起学习python之变量命名规则
May 27 Python
Python实现的简单排列组合算法示例
Jul 04 Python
使用python生成杨辉三角形的示例代码
Aug 29 Python
Python中按值来获取指定的键
Mar 04 Python
python处理document文档保留原样式
Sep 23 Python
简单瞅瞅Python vars()内置函数的实现
Sep 27 Python
细数nn.BCELoss与nn.CrossEntropyLoss的区别
Feb 29 Python
Python numpy大矩阵运算内存不足如何解决
Nov 19 Python
详解Python魔法方法之描述符类
May 26 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
PHP中soap的用法实例
2014/10/24 PHP
PHP Yaf框架的简单安装使用教程(推荐)
2016/06/08 PHP
Zend Framework过滤器Zend_Filter用法详解
2016/12/09 PHP
权威JavaScript 中的内存泄露模式
2007/08/13 Javascript
非常漂亮的JS代码经典广告
2007/10/21 Javascript
jquery图片放大镜功能的实例代码
2013/03/26 Javascript
开发 Internet Explorer 右键功能表(ContextMenu)
2013/07/03 Javascript
javascript中offset、client、scroll的属性总结
2015/08/13 Javascript
JavaScript之cookie技术详解
2016/11/18 Javascript
jquery插件锦集【推荐】
2016/12/16 Javascript
jQuery快速实现商品数量加减的方法
2017/02/06 Javascript
如何实现一个webpack模块解析器
2018/10/24 Javascript
[01:14:05]《加油DOTA》第四期
2014/08/25 DOTA
[03:01]完美世界DOTA2联赛PWL S2 集锦第二期
2020/12/03 DOTA
浅析Python中将单词首字母大写的capitalize()方法
2015/05/18 Python
http请求 request失败自动重新尝试代码示例
2018/01/25 Python
在unittest中使用 logging 模块记录测试数据的方法
2018/11/30 Python
python 求一个列表中所有元素的乘积实例
2019/06/11 Python
Python字符串大小写转换拼接删除空白
2019/09/19 Python
python 多进程队列数据处理详解
2019/12/23 Python
.dcm格式文件软件读取及python处理详解
2020/01/16 Python
keras 特征图可视化实例(中间层)
2020/01/24 Python
Python抓新型冠状病毒肺炎疫情数据并绘制全国疫情分布的代码实例
2020/02/05 Python
使用sklearn的cross_val_score进行交叉验证实例
2020/02/28 Python
Python实现计算图像RGB均值方式
2020/06/04 Python
美国在线家居装饰店:Belle&June
2018/10/24 全球购物
优秀学生获奖感言
2014/02/15 职场文书
我的理想演讲稿
2014/04/30 职场文书
节能环保演讲稿
2014/08/28 职场文书
中国梦演讲稿范文
2014/08/28 职场文书
重阳节慰问信
2015/02/15 职场文书
中学生逃课检讨书
2015/02/17 职场文书
2015年妇产科工作总结
2015/05/18 职场文书
redis限流的实际应用
2021/04/24 Redis
Pytest中skip skipif跳过用例详解
2021/06/30 Python
PyTorch device与cuda.device用法
2022/04/03 Python