pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用Python进行一些简单的自然语言处理的教程
Mar 31 Python
浅谈Python单向链表的实现
Dec 24 Python
python基础教程之Filter使用方法
Jan 17 Python
读取本地json文件,解析json(实例讲解)
Dec 06 Python
python中利用zfill方法自动给数字前面补0
Apr 10 Python
Python获取指定字符前面的所有字符方法
May 02 Python
对python模块中多个类的用法详解
Jan 10 Python
Python中base64与xml取值结合问题
Dec 22 Python
Python之Class&Object用法详解
Dec 25 Python
python实现俄罗斯方块游戏(改进版)
Mar 13 Python
如何基于Python pygame实现动画跑马灯
Nov 18 Python
Python WebSocket长连接心跳与短连接的示例
Nov 24 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
PHP 5.3新特性命名空间规则解析及高级功能
2010/03/11 PHP
PHPMailer邮件发送的实现代码
2013/05/04 PHP
PHP字符串的连接的简单实例
2013/12/30 PHP
ThinkPHP多语言支持与多模板支持概述
2014/08/22 PHP
php微信支付之APP支付方法
2015/03/04 PHP
JS中简单的实现像C#中using功能(有源码下载)
2007/01/09 Javascript
JavaScript判断窗口是否最小化的代码(跨浏览器)
2010/08/01 Javascript
jqPlot 基于jquery的画图插件
2011/04/26 Javascript
从jQuery.camelCase()学习string.replace() 函数学习
2011/09/13 Javascript
jquery教程ajax请求json数据示例
2014/01/13 Javascript
使用AJAX实现Web页面进度条的实例分享
2016/05/06 Javascript
BootStrap Fileinput初始化时的一些参数
2016/12/30 Javascript
JS去除字符串中空格的方法
2017/02/14 Javascript
ReactNative之FlatList的具体使用方法
2017/11/29 Javascript
基于Vue 2.0的模块化前端 UI 组件库小结
2017/12/21 Javascript
vue-router 源码之实现一个简单的 vue-router
2018/07/02 Javascript
jQuery实现基本淡入淡出效果的方法详解
2018/09/05 jQuery
深入解析koa之中间件流程控制
2019/06/17 Javascript
vue使用nprogress实现进度条
2019/12/09 Javascript
[36:20]完美世界DOTA2联赛PWL S3 access vs Rebirth 第一场 12.17
2020/12/18 DOTA
利用soaplib搭建webservice详细步骤和实例代码
2013/11/20 Python
python获取指定网页上所有超链接的方法
2015/04/04 Python
python实现发送邮件及附件功能
2021/03/02 Python
Python中输入和输出(打印)数据实例方法
2019/10/13 Python
python  ceiling divide 除法向上取整(或小数向上取整)的实例
2019/12/27 Python
opencv 实现特定颜色线条提取与定位操作
2020/06/02 Python
日本最新流行服饰网购:Nissen
2016/07/24 全球购物
台湾全方位线上课程与职能学习平台:TibaMe
2019/12/04 全球购物
性能测试工程师的面试题
2015/02/20 面试题
质检员岗位职责
2013/12/17 职场文书
工作交流会欢迎词
2014/01/12 职场文书
小学教师评语大全
2014/04/23 职场文书
灵山大佛导游词
2015/02/04 职场文书
2015人事行政工作总结范文
2015/05/21 职场文书
美丽人生观后感
2015/06/03 职场文书
go select编译期的优化处理逻辑使用场景分析
2021/06/28 Golang