python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python入门篇之字典
Oct 17 Python
python列表操作之extend和append的区别实例分析
Jul 28 Python
python append、extend与insert的区别
Oct 13 Python
python/sympy求解矩阵方程的方法
Nov 08 Python
Pycharm之快速定位到某行快捷键的方法
Jan 20 Python
Python使用os.listdir()和os.walk()获取文件路径与文件下所有目录的方法
Apr 01 Python
python爬虫解决验证码的思路及示例
Aug 01 Python
Python使用ffmpy将amr格式的音频转化为mp3格式的例子
Aug 08 Python
python中如何实现将数据分成训练集与测试集的方法
Sep 13 Python
python实现FTP文件传输的方法(服务器端和客户端)
Mar 20 Python
python torch.utils.data.DataLoader使用方法
Apr 02 Python
使用tensorflow实现VGG网络,训练mnist数据集方式
May 26 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
Zend Studio for Eclipse的java.lang.NullPointerException错误的解决方法
2008/12/06 PHP
PHP开发过程中常用函数收藏
2009/12/14 PHP
解决PHP超大文件下载,断点续传下载的方法详解
2013/06/06 PHP
解析php函数method_exists()与is_callable()的区别
2013/06/21 PHP
PHP把JPEG图片转换成Progressive JPEG的方法
2014/06/30 PHP
对PHP新手的一些建议(PHP学习经验总结)
2014/08/20 PHP
php防止sql注入之过滤分页参数实例
2014/11/03 PHP
Ubuntu下安装PHP的mongodb扩展操作命令
2015/07/04 PHP
jQuery ul标签下拉菜单演示代码
2010/12/11 Javascript
常见JS效果之图片减速度滚动实现代码
2011/12/08 Javascript
jQuery 淡出一个图像到另一个图像的实现代码
2013/06/12 Javascript
利用进制转换压缩数字函数分享
2014/01/02 Javascript
window.location不跳转的问题解决方法
2014/04/17 Javascript
jQuery实现预加载图片的方法
2015/03/17 Javascript
网页收藏夹显示ICO图标(代码少)
2015/08/04 Javascript
详解JavaScript的表达式与运算符
2015/11/30 Javascript
详解javascript事件绑定使用方法
2016/10/20 Javascript
Vue 固定头 固定列 点击表头可排序的表格组件
2016/11/25 Javascript
Vue CLI3.0中使用jQuery和Bootstrap的方法
2019/02/28 jQuery
微信小程序自定义弹出层效果
2020/05/26 Javascript
[45:17]DOTA2-DPC中国联赛定级赛 Phoenix vs DLG BO3第三场 1月9日
2021/03/11 DOTA
python计算对角线有理函数插值的方法
2015/05/07 Python
python selenium UI自动化解决验证码的4种方法
2018/01/05 Python
Python之批量创建文件的实例讲解
2018/05/10 Python
浅谈Python的list中的选取范围
2018/11/12 Python
Django实现学员管理系统
2019/02/26 Python
python+selenium实现简历自动刷新的示例代码
2019/05/20 Python
pyqt5 使用cv2 显示图片,摄像头的实例
2019/06/27 Python
Python Opencv任意形状目标检测并绘制框图
2019/07/23 Python
在PyCharm的 Terminal(终端)切换Python版本的方法
2019/08/02 Python
使用python turtle画高达
2020/01/19 Python
Python生成器实现简单&quot;生产者消费者&quot;模型代码实例
2020/03/27 Python
农药学硕士毕业生自荐信
2013/09/25 职场文书
办公室副主任职责范本
2014/03/08 职场文书
幽默口才训练经典句子(48句)
2019/08/19 职场文书
《我在为谁工作》:工作的质量往往决定生活的质量
2019/12/27 职场文书