pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python开发之文件操作用法实例
Nov 13 Python
Python 字典与字符串的互转实例
Jan 13 Python
不要用强制方法杀掉python线程
Feb 26 Python
Python pymongo模块常用操作分析
Sep 01 Python
python hash每次调用结果不同的原因
Nov 21 Python
python装饰器的特性原理详解
Dec 25 Python
Python2与Python3的区别详解
Feb 09 Python
python使用信号量动态更新配置文件的操作
Apr 01 Python
Java ExcutorService优雅关闭方式解析
May 30 Python
django美化后台django-suit的安装配置操作
Jul 12 Python
python海龟绘图之画国旗实例代码
Nov 11 Python
Python基础之教你怎么在M1系统上使用pandas
May 08 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
输出控制类
2006/10/09 PHP
NOT NULL 和NULL
2007/01/15 PHP
PHP5权威编程阅读学习笔记 附电子书下载
2012/07/05 PHP
PHP获取HTTP body内容的方法
2018/12/31 PHP
php数组函数array_push()、array_pop()及array_shift()简单用法示例
2020/01/26 PHP
javascript中有趣的反柯里化深入分析
2012/12/05 Javascript
JS实现匀速运动的代码实例
2013/11/29 Javascript
jquery实现当滑动到一定位置时固定效果
2014/06/17 Javascript
Vue计算属性的学习笔记
2017/03/22 Javascript
Vue.js展示AJAX数据简单示例讲解
2017/03/29 Javascript
vue2.0实现导航菜单切换效果
2017/05/08 Javascript
jQuery条件分页 代替离线查询(附代码)
2017/08/17 jQuery
微信小程序 POST请求的实例详解
2017/09/29 Javascript
超出JavaScript安全整数限制的数字计算BigInt详解
2018/06/24 Javascript
使用vue打包时vendor文件过大或者是app.js文件很大的问题
2018/06/29 Javascript
vue 单页应用和多页应用的优劣
2020/10/22 Javascript
Python+Socket实现基于UDP协议的局域网广播功能示例
2017/08/31 Python
Python使用matplotlib和pandas实现的画图操作【经典示例】
2018/06/13 Python
python使用matplotlib画饼状图
2018/09/25 Python
python os模块简单应用示例
2019/05/23 Python
python实现按关键字筛选日志文件
2019/12/24 Python
python3读取csv文件任意行列代码实例
2020/01/13 Python
CSS3制作Dropdown下拉菜单的方法
2015/07/18 HTML / CSS
HTML5教程之html 5 本地数据库(Web Sql Database)
2014/04/03 HTML / CSS
HTML5 manifest离线缓存的示例代码
2018/08/08 HTML / CSS
荷兰皇家航空公司官方网站:KLM Royal Dutch Airlines
2017/12/07 全球购物
爱尔兰领先的在线体育用品零售商:theGAAstore
2018/04/16 全球购物
法国购买隐形眼镜和眼镜网站:Optical Center
2019/10/08 全球购物
Linux如何为某个操作添加别名
2015/02/05 面试题
法人代表任命书范本
2014/06/05 职场文书
企业文化标语大全
2014/06/10 职场文书
纪检干部先进事迹材料
2014/08/23 职场文书
作风建设年活动总结
2014/08/27 职场文书
2014年煤矿工人工作总结
2014/12/08 职场文书
电视新闻稿
2015/07/17 职场文书
pandas 操作 Excel操作总结
2021/03/31 Python