pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
各个系统下的Python解释器相关安装方法
Oct 12 Python
Python常用的内置序列结构(列表、元组、字典)学习笔记
Jul 08 Python
Django自定义manage命令实例代码
Feb 11 Python
使用Python和xlwt向Excel文件中写入中文的实例
Apr 21 Python
对python3 Serial 串口助手的接收读取数据方法详解
Jun 12 Python
python os.path.isfile 的使用误区详解
Nov 29 Python
Python Gluon参数和模块命名操作教程
Dec 18 Python
python批量处理txt文件的实例代码
Jan 13 Python
python实现数字炸弹游戏程序
Jul 17 Python
Pycharm自带Git实现版本管理的方法步骤
Sep 18 Python
基于pycharm 项目和项目文件命名规则的介绍
Jan 15 Python
5道关于python基础 while循环练习题
Nov 27 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
php header()函数使用说明
2008/07/10 PHP
用jquery设置按钮的disabled属性的实现代码
2010/11/28 Javascript
js Event对象的5种坐标
2011/09/12 Javascript
javascript浏览器兼容教程之事件处理
2014/06/09 Javascript
jQuery实现类似标签风格的导航菜单效果代码
2015/08/25 Javascript
用JS生成UUID的方法实例
2016/03/30 Javascript
无需 Flash 使用 jQuery 复制文字到剪贴板
2016/04/26 Javascript
JavaScript中的Number数字类型学习笔记
2016/05/26 Javascript
实用jquery操作表单元素的简单代码
2016/07/04 Javascript
简单谈谈Vue 模板各类数据绑定
2016/09/25 Javascript
js使用Replace结合正则替换重复出现的字符串功能示例
2016/12/27 Javascript
bootstrap的常用组件和栅格式布局详解
2017/05/02 Javascript
vuejs2.0运用原生js实现简单拖拽元素功能
2020/08/21 Javascript
jquery的$().each和$.each的区别
2019/01/18 jQuery
JS解惑之Object中的key是有序的么
2019/05/06 Javascript
详解Element-UI中上传的文件前端处理
2019/08/07 Javascript
基于Nuxt.js项目的服务端性能优化与错误检测(容错处理)
2019/10/23 Javascript
js实现翻牌小游戏
2020/07/31 Javascript
[01:15:29]DOTA2上海特级锦标赛主赛事日 - 3 胜者组第二轮#2Secret VS EG第三局
2016/03/04 DOTA
[55:54]FNATIC vs EG 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/16 DOTA
Python单例模式实例分析
2015/01/14 Python
python xml解析实例详解
2016/11/14 Python
Python中print和return的作用及区别解析
2019/05/05 Python
Pycharm使用之设置代码字体大小和颜色主题的教程
2019/07/12 Python
在Pytorch中使用Mask R-CNN进行实例分割操作
2020/06/24 Python
Jupyter notebook命令和编辑模式常用快捷键汇总
2020/11/17 Python
使用Python+Appuim 清理微信的方法
2021/01/26 Python
浅析border-radius如何兼容IE
2016/04/19 HTML / CSS
CK巴西官方网站:Calvin Klein巴西
2019/07/19 全球购物
Ruby如何定义一个类
2012/10/08 面试题
超市开店计划书
2014/04/26 职场文书
幼儿园父亲节活动总结
2015/02/12 职场文书
篮球拉拉队口号
2015/12/25 职场文书
JS实现简单控制视频播放倍速的实例代码
2021/04/18 Javascript
有趣的二维码:使用MyQR和qrcode来制作二维码
2021/05/10 Python
Python学习之包与模块详解
2022/03/19 Python