python中pandas对多列进行分组统计的实现


Posted in Python onJune 18, 2021

使用groupby([ ]).size()统计的结果,值相同的字段值会不显示

python中pandas对多列进行分组统计的实现

如上图所示,第一个空着的行是982499 7 3388 1,因为此行与前面一行的这两个字段值是一样的,所以不显示。第二个空着的行是390192 22 4278 1,因为此行与前面一行的第一个字段值是一样的,所以不显示。这样的展示方式更直观,但对于刚用的人,可能会让其以为是缺失值。

如果还不明白可以看下面的全部数据及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

 

  user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000
res6

 

  user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389
res6['user_id'].value_counts()
390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)
user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64
res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)
user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此这篇关于python中pandas对多列进行分组统计的实现的文章就介绍到这了,更多相关pandas多列分组统计内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
ssh批量登录并执行命令的python实现代码
May 25 Python
Python应用03 使用PyQT制作视频播放器实例
Dec 07 Python
解决Tensorflow安装成功,但在导入时报错的问题
Jun 13 Python
Python Socket编程之多线程聊天室
Jul 28 Python
Python3爬虫教程之利用Python实现发送天气预报邮件
Dec 16 Python
python将处理好的图像保存到指定目录下的方法
Jan 10 Python
Appium+python自动化之连接模拟器并启动淘宝APP(超详解)
Jun 17 Python
从训练好的tensorflow模型中打印训练变量实例
Jan 20 Python
python实现发送带附件的邮件代码分享
Sep 22 Python
Python排序算法之插入排序及其优化方案详解
Jun 11 Python
Opencv中cv2.floodFill算法的使用
Jun 18 Python
python+opencv实现目标跟踪过程
Jun 21 Python
python 常用的异步框架汇总整理
Jun 18 #Python
Opencv中cv2.floodFill算法的使用
Python下opencv使用hough变换检测直线与圆
python 网络编程要点总结
Jun 18 #Python
python opencv检测直线 cv2.HoughLinesP的实现
Jun 18 #Python
教你用Python+selenium搭建自动化测试环境
Jun 18 #Python
详解Python函数print用法
Jun 18 #Python
You might like
打造计数器DIY三步曲(中)
2006/10/09 PHP
php中删除字符串中最先出现某个字符的实现代码
2013/02/03 PHP
php 字符串中的\n换行符无效、不能换行的解决方法
2014/04/02 PHP
PHP产生不重复随机数的5个方法总结
2014/11/12 PHP
PHP实现一个简单url路由功能实例
2016/11/05 PHP
PHP排序算法之快速排序(Quick Sort)及其优化算法详解
2018/04/21 PHP
PHP chunk_split()函数讲解
2019/02/12 PHP
基于JavaScript 类的使用详解
2013/05/07 Javascript
详谈JavaScript 匿名函数及闭包
2014/11/14 Javascript
JavaScript类继承及实例化的方法
2015/07/25 Javascript
js代码实现无缝滚动(文字和图片)
2015/08/20 Javascript
由浅入深讲解Javascript继承机制与simple-inheritance源码分析
2015/12/13 Javascript
在Web项目中引入Jquery插件报错的完美解决方案(图解)
2016/09/19 Javascript
form+iframe解决跨域上传文件的方法
2016/11/18 Javascript
bootstrap模态框实现拖拽效果
2016/12/14 Javascript
vue 插值 v-once,v-text, v-html详解
2018/01/19 Javascript
VSCode中如何利用d.ts文件进行js智能提示
2018/04/13 Javascript
详解vue 路由跳转四种方式 (带参数)
2019/04/28 Javascript
Vue+Node实现的商城用户管理功能示例
2019/12/23 Javascript
Node.js API详解之 Error模块用法实例分析
2020/05/14 Javascript
python读取oracle函数返回值
2016/07/18 Python
使用Python搭建虚拟环境的配置方法
2018/02/28 Python
python实现图片插入文字
2019/11/26 Python
Python+Selenium随机生成手机验证码并检查页面上是否弹出重复手机号码提示框
2020/09/21 Python
Python tempfile模块生成临时文件和临时目录
2020/09/30 Python
亚马逊墨西哥站:Amazon.com.mx
2018/08/26 全球购物
TIME时代杂志台湾总代理:台时亚洲
2018/10/22 全球购物
技能比武方案
2014/05/21 职场文书
信息与工商管理职业规划范文:为梦想而搏击
2014/09/11 职场文书
习近平在党的群众路线教育实践活动总结大会上的讲话全文
2014/10/25 职场文书
从严治党主题教育活动总结
2015/05/07 职场文书
高一作文之暖冬
2019/11/09 职场文书
python解决12306登录验证码的实现
2021/04/18 Python
python numpy中multiply与*及matul 的区别说明
2021/05/26 Python
详解运行Python的神器Jupyter Notebook
2021/06/03 Python
利用 Python 的 Pandas和 NumPy 库来清理数据
2022/04/13 Python