pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Django框架中方法的访问和查找
Jul 15 Python
用yum安装MySQLdb模块的步骤方法
Dec 15 Python
python paramiko模块学习分享
Aug 23 Python
一道python走迷宫算法题
Jan 22 Python
python logging日志模块以及多进程日志详解
Apr 18 Python
使用python编写udp协议的ping程序方法
Apr 22 Python
pygame游戏之旅 添加游戏暂停功能
Nov 21 Python
基于Python对数据shape的常见操作详解
Dec 25 Python
Python爬虫之urllib基础用法教程
Oct 12 Python
MNIST数据集转化为二维图片的实现示例
Jan 10 Python
python 引用传递和值传递详解(实参,形参)
Jun 05 Python
python subprocess pipe 实时输出日志的操作
Dec 05 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
用PHP获取Google AJAX Search API 数据的代码
2010/03/12 PHP
PHP 循环列出目录内容的函数代码
2010/05/26 PHP
用jscript实现新建word文档
2007/06/15 Javascript
JS date对象的减法处理实现代码
2010/12/28 Javascript
javascript之典型高阶函数应用介绍
2013/01/10 Javascript
javascript生成随机大小写字母的方法
2014/02/20 Javascript
字段太多jquey快速清空表单内容方法
2014/08/21 Javascript
javascript框架设计读书笔记之种子模块
2014/12/02 Javascript
基于Jquery实现表单验证
2020/07/20 Javascript
jquery遍历json对象集合详解
2016/05/18 Javascript
json对象与数组以及转换成js对象的简单实现方法
2016/06/24 Javascript
10分钟掌握XML、JSON及其解析
2020/12/06 Javascript
node.js中debug模块的简单介绍与使用
2017/04/25 Javascript
Bootstrap下拉菜单更改为悬停(hover)触发的方法
2017/05/24 Javascript
jQuery+vue.js实现的九宫格拼图游戏完整实例【附源码下载】
2017/09/12 jQuery
js 倒计时(高效率服务器时间同步)
2017/09/12 Javascript
React中使用async validator进行表单验证的实例代码
2018/08/17 Javascript
微信小程序之swiper滑动面板用法示例
2018/12/04 Javascript
Vue项目实现换肤功能的一种方案分析
2019/08/28 Javascript
Vue 封装防刷新考试倒计时组件的实现
2020/06/05 Javascript
[47:04]LGD vs infamous Supermajor小组赛D组 BO3 第二场 6.3
2018/06/04 DOTA
Python生成验证码实例
2014/08/21 Python
python解决Fedora解压zip时中文乱码的方法
2016/09/18 Python
Tensorflow实现卷积神经网络的详细代码
2018/05/24 Python
Python数据可视化之画图
2019/01/15 Python
python使用Matplotlib改变坐标轴的默认位置
2019/10/18 Python
C语言变量的命名规则都有哪些
2013/12/27 面试题
行政求职信
2014/07/04 职场文书
物理学专业求职信
2014/07/04 职场文书
销售顾问工作计划书
2014/08/15 职场文书
大学毕业生个人总结
2015/02/28 职场文书
签证工作证明模板
2015/06/15 职场文书
新手入门Mysql--概念
2021/06/18 MySQL
Spring boot应用启动后首次访问很慢的解决方案
2021/06/23 Java/Android
Redis 常见使用场景
2021/08/30 Redis
利用 JavaScript 构建命令行应用
2021/11/17 Javascript