pandas统计重复值次数的方法实现


Posted in Python onFebruary 20, 2021

本文主要介绍了pandas统计重复值次数的方法实现,分享给大家,具体如下:

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印数据框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重复项
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 统计重复值
dup=df[df.duplicated()].count()
print(dup) # 最后两项重复
# data1  2
# key1   2
# key2   2

# 去除重复项
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重复元素个数的获取

方法有二:

1. 在调用duplicated方法后,非重复的元素会被标记为False,而重复的元素会被标记为True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info为一个dataframe框,user_id为其中一列

【注2】duplicated( )方法只会把重复的元素标记为True,而不会标记被重复的元素

2.这行代码的速度更快,drop_duplicates(['user_id'])方法为删除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 为获取行数

到此这篇关于pandas统计重复值次数的方法实现的文章就介绍到这了,更多相关pandas统计重复值次数内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python类型强制转换long to int的代码
Feb 10 Python
pycharm远程调试openstack代码
Nov 21 Python
遗传算法python版
Mar 19 Python
将TensorFlow的模型网络导出为单个文件的方法
Apr 23 Python
pymongo中group by的操作方法教程
Mar 22 Python
python实现雪花飘落效果实例讲解
Jun 18 Python
Python使用百度api做人脸对比的方法
Aug 28 Python
Django 404、500页面全局配置知识点详解
Mar 10 Python
TensorFlow中如何确定张量的形状实例
Jun 23 Python
Python3.7安装PyQt5 运行配置Pycharm的详细教程
Oct 15 Python
如何用 Python 子进程关闭 Excel 自动化中的弹窗
May 07 Python
Python中npy和mat文件的保存与读取
Apr 24 Python
pandas 按日期范围筛选数据的实现
Feb 20 #Python
基于Python-Pycharm实现的猴子摘桃小游戏(源代码)
Feb 20 #Python
pandas按条件筛选数据的实现
Feb 20 #Python
python实现b站直播自动发送弹幕功能
Feb 20 #Python
如何用 Python 制作 GitHub 消息助手
Feb 20 #Python
详解tf.device()指定tensorflow运行的GPU或CPU设备实现
Feb 20 #Python
Python 的 f-string 可以连接字符串与数字的原因解析
Feb 20 #Python
You might like
用php随机生成福彩双色球号码的2种方法
2013/02/04 PHP
解析php中eclipse 用空格替换 tab键
2013/06/24 PHP
php实现把url转换迅雷thunder资源下载地址的方法
2014/11/07 PHP
smarty模板的使用方法实例分析
2019/09/18 PHP
javascript:;与javascript:void(0)使用介绍
2013/06/05 Javascript
js中继承的几种用法总结(apply,call,prototype)
2013/12/26 Javascript
JavaScript onkeypress事件入门实例(按下或按住一个键盘按键)
2014/10/17 Javascript
简述JavaScript中正则表达式的使用方法
2015/06/15 Javascript
AngularJS表格详解及示例代码
2016/08/17 Javascript
jQuery中layer分页器的使用
2017/03/13 Javascript
vue.js实例对象+组件树的详细介绍
2017/10/20 Javascript
深入浅析Node环境和浏览器的区别
2018/08/14 Javascript
koa socket即时通讯的示例代码
2018/09/07 Javascript
vue中改变滚动条样式的方法
2020/03/03 Javascript
react-router-dom 嵌套路由的实现
2020/05/02 Javascript
浅谈vue中$event理解和框架中在包含默认值外传参
2020/08/07 Javascript
Python键盘输入转换为列表的实例
2018/06/23 Python
python图像处理入门(一)
2019/04/04 Python
Python3模拟curl发送post请求操作示例
2019/05/03 Python
Python 根据日志级别打印不同颜色的日志的方法示例
2019/08/08 Python
python打包成so文件过程解析
2019/09/28 Python
Django 自定义分页器的实现代码
2019/11/24 Python
Python高阶函数、常用内置函数用法实例分析
2019/12/26 Python
tensorflow多维张量计算实例
2020/02/11 Python
Python 炫技操作之合并字典的七种方法
2020/04/10 Python
Django项目uwsgi+Nginx保姆级部署教程实现
2020/04/19 Python
Python绘制动态水球图过程详解
2020/06/03 Python
HTML5实现应用程序缓存(Application Cache)
2020/06/16 HTML / CSS
婚前协议书
2014/04/15 职场文书
小学安全教育月活动总结
2014/07/07 职场文书
2014教师党员自我评议总结
2014/09/19 职场文书
会计出纳岗位职责
2015/03/31 职场文书
Python获取百度热搜的完整代码
2021/04/07 Python
原生JavaScript实现简单五子棋游戏
2021/06/28 Javascript
vue实现拖拽交换位置
2022/04/07 Vue.js
Windows Server 2012 修改远程默认端口3389的方法
2022/04/28 Servers