pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中变量交换的例子
Aug 25 Python
python采用getopt解析命令行输入参数实例
Sep 30 Python
Python内建函数之raw_input()与input()代码解析
Oct 26 Python
使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法
Jun 22 Python
python 通过可变参数计算n个数的乘积方法
Jun 13 Python
详解python实现数据归一化处理的方式:(0,1)标准化
Jul 17 Python
Python RabbitMQ实现简单的进程间通信示例
Jul 02 Python
利用Python实现Json序列化库的方法步骤
Sep 09 Python
详解python的super()的作用和原理
Oct 29 Python
Python中logging日志的四个等级和使用
Nov 17 Python
Python天气语音播报小助手
Sep 25 Python
Python机器学习实战之k-近邻算法的实现
Nov 27 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
单台服务器的PHP进程之间实现共享内存的方法
2014/06/13 PHP
php实现的CSS更新类实例
2014/09/22 PHP
php实现根据url自动生成缩略图的方法
2014/09/23 PHP
PHP空值检测函数与方法汇总
2017/11/19 PHP
javascript打印html内容功能的方法示例
2013/11/28 Javascript
一个js过滤空格的小函数
2014/10/10 Javascript
如何在node的express中使用socket.io
2014/12/15 Javascript
JavaScript简单实现弹出拖拽窗口(二)
2016/06/17 Javascript
jQuery实现每隔几条元素增加1条线的方法
2016/06/27 Javascript
AngularJS用户选择器指令实例分析
2016/11/04 Javascript
jQuery Ajax实现跨域请求
2017/01/21 Javascript
Angular.js中$resource高大上的数据交互详解
2017/07/30 Javascript
JavaScript 保护变量不被随意修改的实现代码
2017/09/27 Javascript
vue select组件的使用与禁用实现代码
2018/04/10 Javascript
Nuxt配合Node在实际生产中的应用详解
2018/08/07 Javascript
JS中==、===你分清楚了吗
2020/03/04 Javascript
javascript实现点击产生随机图形
2021/01/25 Javascript
Python基类函数的重载与调用实例分析
2015/01/12 Python
详细解析Python中__init__()方法的高级应用
2015/05/11 Python
Zabbix实现微信报警功能
2016/10/09 Python
python+mongodb数据抓取详细介绍
2017/10/25 Python
Python实现注册、登录小程序功能
2018/09/21 Python
python获取时间及时间格式转换问题实例代码详解
2018/12/06 Python
基于Keras中Conv1D和Conv2D的区别说明
2020/06/19 Python
机电一体化专业应届本科生求职信
2013/09/27 职场文书
导游的职业规划书范文
2013/12/27 职场文书
文明礼仪事迹材料
2014/01/09 职场文书
物流仓储计划书
2014/01/10 职场文书
学生手册家长评语
2014/02/10 职场文书
物理力学求职信
2014/02/18 职场文书
大学生上课迟到检讨书
2014/10/15 职场文书
2015年元旦文艺晚会总结(学院)
2014/11/28 职场文书
2015年度个人思想工作总结
2015/04/08 职场文书
消防演习通知
2015/04/25 职场文书
mapstruct的用法之qualifiedByName示例详解
2022/04/06 Java/Android
吉利入股戴姆勒后smart“长大了”
2022/04/21 数码科技