pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
跨平台python异步回调机制实现和使用方法
Nov 26 Python
用Python编写一个每天都在系统下新建一个文件夹的脚本
May 04 Python
Python自动登录126邮箱的方法
Jul 10 Python
Django框架下在视图中使用模版的方法
Jul 16 Python
基于使用paramiko执行远程linux主机命令(详解)
Oct 16 Python
python中yaml配置文件模块的使用详解
Apr 27 Python
python3第三方爬虫库BeautifulSoup4安装教程
Jun 19 Python
Python3的高阶函数map,reduce,filter的示例详解
Jul 23 Python
基于Python安装pyecharts所遇的问题及解决方法
Aug 12 Python
Python 从subprocess运行的子进程中实时获取输出的例子
Aug 14 Python
在Python中实现函数重载的示例代码
Dec 12 Python
python正则表达式re.search()的基本使用教程
May 21 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
php中经典方法实现判断多维数组是否为空
2011/10/23 PHP
Windows下的PHP安装pear教程
2014/10/24 PHP
PHP使用Memcache时模拟命名空间及缓存失效问题的解决
2016/02/27 PHP
thinkphp实现附件上传功能
2017/05/26 PHP
thinkphp中的多表关联查询的实例详解
2017/10/12 PHP
php回调函数处理数组操作示例
2020/04/13 PHP
Flexigrid在IE下不显示数据的处理的解决方法
2013/10/24 Javascript
javascript创建createXmlHttpRequest对象示例代码
2014/02/10 Javascript
jQuery获取动态生成的元素示例
2014/06/15 Javascript
jquery实现的美女拼图游戏实例
2015/05/04 Javascript
javascript引用类型之时间Date和数组Array
2015/08/27 Javascript
jQuery表格插件datatables用法汇总
2016/03/29 Javascript
jQuery hover事件简单实现同时绑定2个方法
2016/06/07 Javascript
webpack4 升级迁移的实现
2018/09/12 Javascript
JQuery animate动画应用示例
2019/05/14 jQuery
解决layui表格的表头不滚动的问题
2019/09/04 Javascript
基于JavaScript判断两个对象内容是否相等
2020/01/10 Javascript
jquery实现直播视频弹幕效果
2020/02/25 jQuery
webpack+vue.js构建前端工程化的详细教程
2020/05/10 Javascript
[27:53]2014 DOTA2华西杯精英邀请赛 5 24 NewBee VS iG
2014/05/26 DOTA
Python中给List添加元素的4种方法分享
2014/11/28 Python
Python中多线程的创建及基本调用方法
2016/07/08 Python
Numpy数组的保存与读取方法
2018/04/04 Python
python 实现A*算法的示例代码
2018/08/13 Python
详解Django中CBV(Class Base Views)模型源码分析
2019/02/25 Python
Python提取特定时间段内数据的方法实例
2019/04/01 Python
Python导入模块包原理及相关注意事项
2020/03/25 Python
CSS3实现文字描边的2种方法(小结)
2020/02/14 HTML / CSS
英国时尚运动品牌的合集:The Sports Edit
2017/12/20 全球购物
如何转换一个字符串到enum值
2014/04/12 面试题
求职信模版
2013/11/30 职场文书
村道德模范事迹材料
2014/08/28 职场文书
拾金不昧感谢信范文
2015/01/21 职场文书
清洁工岗位职责
2015/02/13 职场文书
圣贤教育改变命运观后感
2015/06/16 职场文书
MySQL复制问题的三个参数分析
2021/04/07 MySQL