Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中input和raw_input的一点区别
Oct 21 Python
python selenium自动上传有赞单号的操作方法
Jul 05 Python
详解关于Django中ORM数据库迁移的配置
Oct 08 Python
在python 不同时区之间的差值与转换方法
Jan 14 Python
Python 微信之获取好友昵称并制作wordcloud的实例
Feb 21 Python
python读取并定位excel数据坐标系详解
Jun 26 Python
python求加权平均值的实例(附纯python写法)
Aug 22 Python
Python调用钉钉自定义机器人的实现
Jan 03 Python
Python调用Windows命令打印文件
Feb 07 Python
Python模拟伯努利试验和二项分布代码实例
May 27 Python
关于Python不换行输出和不换行输出end=““不显示的问题(亲测已解决)
Oct 27 Python
Python列表的深复制和浅复制示例详解
Feb 12 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
php反弹shell实现代码
2009/04/22 PHP
php 正则表达式小结
2009/08/31 PHP
PHP实现根据设备类型自动跳转相应页面的方法
2014/07/24 PHP
CI框架常用经典操作类总结(路由,伪静态,分页,session,验证码等)
2016/11/21 PHP
基于jQuery的倒计时实现代码
2012/05/30 Javascript
js 为label标签和div标签赋值的方法
2013/08/08 Javascript
JS动态加载当前时间的方法
2015/02/09 Javascript
JavaScript之数组(Array)详解
2015/04/01 Javascript
javascript实现鼠标拖动改变层大小的方法
2015/04/30 Javascript
javascript实现支持移动设备画廊
2015/08/24 Javascript
基于jQuery实现弹幕APP
2017/02/10 Javascript
使用原生js+canvas实现模拟心电图的实例
2017/09/20 Javascript
浅谈react前后端同构渲染
2017/09/20 Javascript
关于HTTP传输中gzip压缩的秘密探索分析
2018/01/12 Javascript
vue axios请求拦截实例代码
2018/03/29 Javascript
JQuery使用属性addClass、removeClass和toggleClass实现增加和删除类操作示例
2019/11/18 jQuery
JS实现简单省市二级联动
2019/11/27 Javascript
基于JavaScript实现猜数字游戏代码实例
2020/07/30 Javascript
Python中的类学习笔记
2014/09/23 Python
python基于xml parse实现解析cdatasection数据
2014/09/30 Python
利用Python实现简单的相似图片搜索的教程
2015/04/23 Python
Python进阶_关于命名空间与作用域(详解)
2017/05/29 Python
python利用有道翻译实现"语言翻译器"的功能实例
2017/11/14 Python
初探TensorFLow从文件读取图片的四种方式
2018/02/06 Python
新年快乐! python实现绚烂的烟花绽放效果
2019/01/30 Python
np.random.seed() 的使用详解
2020/01/14 Python
HTML5里autofocus自动聚焦属性使用介绍
2016/06/22 HTML / CSS
美国领先的家庭健康检测试剂盒提供商:LetsGetChecked
2019/03/18 全球购物
公立医院改革实施方案
2014/03/14 职场文书
护林防火标语
2014/06/27 职场文书
个人思想政治总结
2015/03/05 职场文书
未中标通知书
2015/04/17 职场文书
沂蒙六姐妹观后感
2015/06/08 职场文书
nginx反向代理时如何保持长连接
2021/03/31 Servers
python中24小时制转换为12小时制的方法
2021/06/18 Python
Python集合set()使用的方法详解
2022/03/18 Python