Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python编写的com组件发生R6034错误的原因与解决办法
Apr 01 Python
python 异常处理总结
Oct 18 Python
python机器学习案例教程——K最近邻算法的实现
Dec 28 Python
python数字图像处理之骨架提取与分水岭算法
Apr 27 Python
对python中for、if、while的区别与比较方法
Jun 25 Python
python异步实现定时任务和周期任务的方法
Jun 29 Python
Python socket非阻塞模块应用示例
Sep 12 Python
浅谈Python3识别判断图片主要颜色并和颜色库进行对比的方法
Oct 25 Python
python动态文本进度条的实例代码
Jan 22 Python
浅谈keras中Dropout在预测过程中是否仍要起作用
Jul 09 Python
基于tensorflow __init__、build 和call的使用小结
Feb 26 Python
Python实战实现爬取天气数据并完成可视化分析详解
Jun 16 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
使用php判断浏览器的类型和语言的函数代码
2013/02/28 PHP
php实现搜索一维数组元素并删除二维数组对应元素的方法
2015/07/06 PHP
Smarty高级应用之缓存操作技巧分析
2016/05/14 PHP
如何实现动态删除javascript函数
2007/05/27 Javascript
JavaScript 模仿vbs中的 DateAdd() 函数的代码
2007/08/13 Javascript
基于jquery的气泡提示效果
2010/05/31 Javascript
一个基于jquery的文本框记数器
2012/09/19 Javascript
js屏蔽鼠标键盘(右键/Ctrl+N/Shift+F10/F11/F5刷新/退格键)
2013/01/24 Javascript
js关闭浏览器窗口及检查浏览器关闭事件
2013/09/03 Javascript
js 自动播放的实例代码
2013/11/19 Javascript
JS实现仿百度输入框自动匹配功能的示例代码
2014/02/19 Javascript
JS实现至少包含字母、大小写数字、字符的密码等级的两种方法
2015/02/03 Javascript
轻松实现javascript数据双向绑定
2015/11/11 Javascript
深入分析Javascript事件代理
2016/01/30 Javascript
JavaScript中Math对象的方法介绍
2017/01/05 Javascript
js实现选项卡内容切换以及折叠和展开效果【推荐】
2017/01/08 Javascript
vue.js实现二级菜单效果
2019/10/19 Javascript
vuejs element table 表格添加行,修改,单独删除行,批量删除行操作
2020/07/18 Javascript
js实现弹幕墙效果
2020/12/10 Javascript
[01:22:19]EG vs TNC Supermajor小组赛B组败者组第一轮 BO3 第二场 6.2
2018/06/03 DOTA
django ajax发送post请求的两种方法
2020/01/05 Python
Python利用FFT进行简单滤波的实现
2020/02/26 Python
Anconda环境下Vscode安装Python的方法详解
2020/03/29 Python
Jupyter Notebook打开任意文件夹操作
2020/04/14 Python
PIP和conda 更换国内安装源的方法步骤
2020/09/21 Python
CSS3 倾斜的网页图片库实例教程
2009/11/14 HTML / CSS
Parfumdreams芬兰:购买香水和化妆品
2021/02/13 全球购物
cf战队收人广告词
2014/03/14 职场文书
员工工作表现评语
2014/04/26 职场文书
优秀的个人求职信范文
2014/05/09 职场文书
驾驶员安全责任书范本
2014/07/24 职场文书
离婚财产处理协议书
2014/09/30 职场文书
单位租房协议书样本
2014/10/30 职场文书
高质量“欢迎词”
2019/04/03 职场文书
Python中Matplotlib的点、线形状、颜色以及绘制散点图
2022/04/07 Python
vue css 相对路径导入问题级踩坑记录
2022/06/05 Vue.js