pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用python代码做configure文件
Jul 20 Python
利用Python的Flask框架来构建一个简单的数字商品支付解决方案
Mar 31 Python
Python selenium 三种等待方式解读
Sep 15 Python
Python 变量类型详解
Oct 10 Python
python执行精确的小数计算方法
Jan 21 Python
对python实现模板生成脚本的方法详解
Jan 30 Python
Python OpenCV之图片缩放的实现(cv2.resize)
Jun 28 Python
Django使用Channels实现WebSocket的方法
Jul 28 Python
关于PyTorch源码解读之torchvision.models
Aug 17 Python
Python实现钉钉订阅消息功能
Jan 14 Python
基于pytorch padding=SAME的解决方式
Feb 18 Python
如何使用python的ctypes调用医保中心的dll动态库下载医保中心的账单
May 24 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
php数组键值用法实例分析
2015/02/27 PHP
Laravel学习教程之从入口到输出过程详解
2017/08/27 PHP
javascript dom 基本操作小结
2010/04/11 Javascript
js 利用image对象实现图片的预加载提高访问速度
2013/03/29 Javascript
Jquery实现点击切换图片并隐藏显示内容(2种方法实现)
2013/04/11 Javascript
ExtJs设置GridPanel表格文本垂直居中示例
2013/07/15 Javascript
JS网页在线获取鼠标坐标值的方法
2015/02/28 Javascript
简单谈谈Javascript中类型的判断
2015/10/19 Javascript
Javascript获取数组中的最大值和最小值的方法汇总
2016/01/01 Javascript
简单总结JavaScript中的String字符串类型
2016/05/26 Javascript
Vue.js实现拖放效果的实例
2016/09/30 Javascript
从零开始学习Node.js系列教程之设置HTTP头的方法示例
2017/04/13 Javascript
Vue.js 2.0和Cordova开发webApp环境搭建方法
2018/02/26 Javascript
基于element-ui组件手动实现单选和上传功能
2018/12/06 Javascript
JS将时间秒转换成天小时分钟秒的字符串
2019/07/10 Javascript
javascript浅层克隆、深度克隆对比及实例解析
2020/02/09 Javascript
原生js实现密码强度验证功能
2020/03/18 Javascript
使用Python的Flask框架实现视频的流媒体传输
2015/03/31 Python
解决python flask中config配置管理的问题
2019/07/26 Python
分享一个pycharm专业版安装的永久使用方法
2019/09/24 Python
Python基于yield遍历多个可迭代对象
2020/03/12 Python
python中altair可视化库实例用法
2021/01/26 Python
医学生自我鉴定范文
2013/11/08 职场文书
国际商务系学生个人的自我评价
2013/11/26 职场文书
汉语言文学专业自荐信
2014/06/11 职场文书
个人委托书范本
2014/09/13 职场文书
幼儿园教师的自我评价范文
2014/09/17 职场文书
2015年消防工作总结
2015/04/24 职场文书
有关三国演义的读书笔记
2015/06/25 职场文书
2015年中秋晚会主持词
2015/07/01 职场文书
学校运动会加油词
2015/07/18 职场文书
高中运动会前导词
2015/07/20 职场文书
作文之亲情600字
2019/09/23 职场文书
python 实现两个变量值进行交换的n种操作
2021/06/02 Python
MySQL分区表管理命令汇总
2022/03/21 MySQL
微信小程序APP页面的之间的相互传递参数以及自定义组件
2022/04/19 Javascript