python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 查看文件的编码格式方法
Dec 21 Python
一份python入门应该看的学习资料
Apr 11 Python
python批量查询、汉字去重处理CSV文件
May 31 Python
Python操作MySQL数据库的方法
Jun 20 Python
python 判断参数为Nonetype类型或空的实例
Oct 30 Python
对python遍历文件夹中的所有jpg文件的实例详解
Dec 08 Python
python DataFrame 取差集实例
Jan 30 Python
Pytorch反向求导更新网络参数的方法
Aug 17 Python
pytorch 预训练层的使用方法
Aug 20 Python
Pytorch实现各种2d卷积示例
Dec 30 Python
Django中Aggregation聚合的基本使用方法
Jul 09 Python
在 Python 中使用 MQTT的方法
Aug 18 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
怎样才能成为PHP高手?学会“懒惰”的编程
2006/12/05 PHP
PHP与SQL注入攻击[二]
2007/04/17 PHP
PHP Error与Logging函数的深入理解
2013/06/03 PHP
zf框架的zend_cache缓存使用方法(zend框架)
2014/03/14 PHP
PHP关于htmlspecialchars、strip_tags、addslashes的解释
2014/07/04 PHP
php判断IP地址是否在多个IP段内
2020/08/18 PHP
js查错流程归纳
2012/05/04 Javascript
JS分页控件 可用于无刷新分页
2013/07/23 Javascript
JS点击链接后慢慢展开隐藏着图片的方法
2015/02/17 Javascript
jQuery插件Timelinr 实现时间轴特效
2015/10/04 Javascript
Jquery日历插件制作简单日历
2015/10/28 Javascript
JS插件overlib用法实例详解
2015/12/26 Javascript
node使用UEditor富文本编辑器的方法实例
2017/07/11 Javascript
关于jquery layui弹出层的使用方法
2018/04/21 jQuery
JS实现显示当前日期的实例代码
2018/07/03 Javascript
react 父子组件之间通讯props
2018/09/08 Javascript
vue与django集成打包的实现方法
2019/11/11 Javascript
JavaScript Event Loop相关原理解析
2020/06/10 Javascript
pandas中的DataFrame按指定顺序输出所有列的方法
2018/04/10 Python
Python中asyncio模块的深入讲解
2019/06/10 Python
Python用Try语句捕获异常的实例方法
2019/06/26 Python
django写用户登录判定并跳转制定页面的实例
2019/08/21 Python
应用OpenCV和Python进行SIFT算法的实现详解
2019/08/21 Python
python实现截取屏幕保存文件,删除N天前截图的例子
2019/08/27 Python
通过代码实例了解Python sys模块
2020/09/14 Python
英国著名的化妆品折扣网站:Allbeauty.com
2016/07/21 全球购物
美国领先的家居装饰和礼品商店:Kirkland’s
2017/01/30 全球购物
董事长秘书职责
2014/01/31 职场文书
综合办公室主任岗位职责
2014/04/13 职场文书
优秀纪检干部材料
2014/08/27 职场文书
无财产离婚协议书范本
2014/10/28 职场文书
2015年医务科工作总结范文
2015/05/26 职场文书
教师节校长致辞
2015/07/31 职场文书
掌握这项技巧,一年阅读300本书不是梦
2019/09/12 职场文书
nginx+lua单机上万并发的实现
2021/05/31 Servers
SQL注入的实现以及防范示例详解
2021/06/02 MySQL