编程 Python

pandas统计重复值次数的方法实现

Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现，分享给大家，具体如下：

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二：

1. 在调用duplicated方法后，非重复的元素会被标记为False，而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框，user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快，drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

pandas统计重复值次数的方法实现

- Author -

Mr番茄蛋

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python中变量交换的例子

Aug 25 Python

python采用getopt解析命令行输入参数实例

Sep 30 Python

Python内建函数之raw_input()与input()代码解析

Oct 26 Python

使用pandas模块读取csv文件和excel表格,并用matplotlib画图的方法

Jun 22 Python

python 通过可变参数计算n个数的乘积方法

Jun 13 Python

详解python实现数据归一化处理的方式：（0,1）标准化

Jul 17 Python

Python RabbitMQ实现简单的进程间通信示例

Jul 02 Python

利用Python实现Json序列化库的方法步骤

Sep 09 Python

详解python的super()的作用和原理

Oct 29 Python

Python中logging日志的四个等级和使用

Nov 17 Python

Python天气语音播报小助手

Sep 25 Python

Python机器学习实战之k-近邻算法的实现

Nov 27 Python

pandas 按日期范围筛选数据的实现

Feb 20 #Python

基于Python-Pycharm实现的猴子摘桃小游戏(源代码)

Feb 20 #Python

pandas按条件筛选数据的实现

Feb 20 #Python

python实现b站直播自动发送弹幕功能

Feb 20 #Python

如何用 Python 制作 GitHub 消息助手

Feb 20 #Python

详解tf.device()指定tensorflow运行的GPU或CPU设备实现

Feb 20 #Python

Python 的 f-string 可以连接字符串与数字的原因解析

Feb 20 #Python

You might like

单台服务器的PHP进程之间实现共享内存的方法

2014/06/13 PHP

php实现的CSS更新类实例

2014/09/22 PHP

php实现根据url自动生成缩略图的方法

2014/09/23 PHP

PHP空值检测函数与方法汇总

2017/11/19 PHP

javascript打印html内容功能的方法示例

2013/11/28 Javascript

一个js过滤空格的小函数

2014/10/10 Javascript

如何在node的express中使用socket.io

2014/12/15 Javascript

JavaScript简单实现弹出拖拽窗口（二）

2016/06/17 Javascript

jQuery实现每隔几条元素增加1条线的方法

2016/06/27 Javascript

AngularJS用户选择器指令实例分析

2016/11/04 Javascript

jQuery Ajax实现跨域请求

2017/01/21 Javascript

Angular.js中$resource高大上的数据交互详解

2017/07/30 Javascript

JavaScript 保护变量不被随意修改的实现代码

2017/09/27 Javascript

vue select组件的使用与禁用实现代码

2018/04/10 Javascript

Nuxt配合Node在实际生产中的应用详解

2018/08/07 Javascript

JS中==、===你分清楚了吗

2020/03/04 Javascript

javascript实现点击产生随机图形

2021/01/25 Javascript

Python基类函数的重载与调用实例分析

2015/01/12 Python

详细解析Python中__init__()方法的高级应用

2015/05/11 Python

Zabbix实现微信报警功能

2016/10/09 Python

python+mongodb数据抓取详细介绍

2017/10/25 Python

Python实现注册、登录小程序功能

2018/09/21 Python

python获取时间及时间格式转换问题实例代码详解

2018/12/06 Python

基于Keras中Conv1D和Conv2D的区别说明

2020/06/19 Python

机电一体化专业应届本科生求职信

2013/09/27 职场文书

导游的职业规划书范文

2013/12/27 职场文书

文明礼仪事迹材料

2014/01/09 职场文书

物流仓储计划书

2014/01/10 职场文书

学生手册家长评语

2014/02/10 职场文书

物理力学求职信

2014/02/18 职场文书

大学生上课迟到检讨书

2014/10/15 职场文书

2015年元旦文艺晚会总结（学院）

2014/11/28 职场文书

2015年度个人思想工作总结

2015/04/08 职场文书

消防演习通知

2015/04/25 职场文书

mapstruct的用法之qualifiedByName示例详解

2022/04/06 Java/Android

吉利入股戴姆勒后smart“长大了”

2022/04/21 数码科技