pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python学习教程之常用的内置函数大全
Jul 14 Python
Python中的id()函数指的什么
Oct 17 Python
Python入门之三角函数atan2()函数详解
Nov 08 Python
使用 Python 实现微信公众号粉丝迁移流程
Jan 03 Python
django允许外部访问的实例讲解
May 14 Python
【python】matplotlib动态显示详解
Apr 11 Python
Python发展史及网络爬虫
Jun 19 Python
python实现滑雪者小游戏
Feb 22 Python
python的sys.path模块路径添加方式
Mar 09 Python
Python实现自动打开电脑应用的示例代码
Apr 17 Python
Python识别验证码的实现示例
Sep 30 Python
python编写五子棋游戏
May 25 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
PHP实现域名whois查询的代码(数据源万网、新网)
2010/02/22 PHP
跟我学Laravel之安装Laravel
2014/10/15 PHP
浅谈COOKIE和SESSION区别
2015/07/19 PHP
PHP中函数gzuncompress无法使用的解决方法
2017/03/02 PHP
PHP命名空间namespace及use的简单用法分析
2018/08/03 PHP
c#和Javascript操作同一json对象的实现代码
2012/01/17 Javascript
js修改input的type属性问题探讨
2013/10/12 Javascript
JavaScript不刷新实现浏览器的前进后退功能
2014/11/05 Javascript
JavaScript中的Math.atan2()方法使用详解
2015/06/15 Javascript
Javascript验证Visa和MasterCard信用卡号的方法
2015/07/27 Javascript
jQuery实现文本框邮箱输入自动补全效果
2015/11/17 Javascript
jQuery 1.9.1源码分析系列(十三)之位置大小操作
2015/12/02 Javascript
jQuery ztree实现动态树形多选菜单
2016/08/12 Javascript
JS图片放大效果简单实现代码
2016/09/08 Javascript
使用JQ完成表格隔行换色的简单实例
2017/08/25 Javascript
vue在使用ECharts时的异步更新和数据加载详解
2017/11/22 Javascript
基于vue和react的spa进行按需加载的实现方法
2018/09/29 Javascript
jQuery操作选中select下拉框的值代码实例
2020/02/07 jQuery
浅谈鸿蒙 JavaScript GUI 技术栈
2020/09/17 Javascript
[00:57]林俊杰助阵DOTA2亚洲邀请赛
2015/01/28 DOTA
Python简单删除目录下文件以及文件夹的方法
2015/05/27 Python
python 文件操作api(文件操作函数)
2016/08/28 Python
教你学会使用Python正则表达式
2017/09/07 Python
python实现pdf转换成word/txt纯文本文件
2018/06/07 Python
swtich是否能作用在byte上,是否能作用在long上,是否能作用在String上?
2013/03/30 面试题
九年级物理教学反思
2014/01/29 职场文书
生物技术专业求职信
2014/06/10 职场文书
党的群众路线教育实践活动制度建设计划
2014/11/03 职场文书
迟到检讨书范文
2015/01/27 职场文书
校友回访母校寄语
2015/02/26 职场文书
2019银行员工个人工作自我鉴定
2019/06/27 职场文书
奖学金发言稿(范文)
2019/08/21 职场文书
Go Gin实现文件上传下载的示例代码
2021/04/02 Golang
修改并编译golang源码的操作步骤
2021/07/25 Golang
JavaWeb实现显示mysql数据库数据
2022/03/19 Java/Android
mysql中数据库覆盖导入的几种方式总结
2022/03/25 MySQL