Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
urllib2自定义opener详解
Feb 07 Python
python中Switch/Case实现的示例代码
Nov 09 Python
快速了解Python相对导入
Jan 12 Python
Python操作MySQL模拟银行转账
Mar 12 Python
python 每天如何定时启动爬虫任务(实现方法分享)
May 21 Python
Django unittest 设置跳过某些case的方法
Dec 26 Python
Python使用百度翻译开发平台实现英文翻译为中文功能示例
Aug 08 Python
python列表插入append(), extend(), insert()用法详解
Sep 14 Python
使用 Python 写一个简易的抽奖程序
Dec 08 Python
Pandas时间序列基础详解(转换,索引,切片)
Feb 26 Python
只用20行Python代码实现屏幕录制功能
Jun 02 Python
http通过StreamingHttpResponse完成连续的数据传输长链接方式
Feb 12 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
php 数组的一个悲剧?
2011/05/11 PHP
分享ThinkPHP3.2中关联查询解决思路
2015/09/20 PHP
PHP文件操作实例总结【文件上传、下载、分页】
2018/12/08 PHP
Javascript 两个窗体之间传值实现代码
2009/09/25 Javascript
jquery each()源代码
2011/02/14 Javascript
仅Firefox中链接A无法实现模拟点击以触发其默认行为
2011/07/31 Javascript
jquery快捷动态绑定键盘事件的操作函数代码
2013/10/17 Javascript
JS长整型精度问题实例分析
2015/01/13 Javascript
JavaScript处理解析JSON数据过程详解
2015/09/11 Javascript
jQuery移动web开发中的页面初始化与加载事件
2015/12/03 Javascript
利用Angularjs中模块ui-route管理状态的方法
2016/12/27 Javascript
JavaScript无操作后屏保功能的实现方法
2017/07/04 Javascript
backbone简介_动力节点Java学院整理
2017/07/14 Javascript
JS 中LocalStorage和SessionStorage的使用
2017/08/17 Javascript
vue登录注册及token验证实现代码
2017/12/14 Javascript
深入浅析vue组件间事件传递
2017/12/29 Javascript
vue-cli 使用vue-bus来全局控制的实例讲解
2018/09/15 Javascript
JavaScript使用闭包模仿块级作用域操作示例
2019/01/21 Javascript
vue改变对象或数组时的刷新机制的方法总结
2019/04/24 Javascript
深入解读Node.js中的koa源码
2019/06/17 Javascript
JavaScript中展开运算符及应用的实例代码
2021/01/14 Javascript
[01:08:32]DOTA2-DPC中国联赛 正赛 DLG vs PHOENIX BO3 第二场 1月18日
2021/03/11 DOTA
python脚本设置系统时间的两种方法
2016/02/21 Python
Python 获取ftp服务器文件时间的方法
2019/07/02 Python
Django发送邮件和itsdangerous模块的配合使用解析
2019/08/10 Python
numpy.array 操作使用简单总结
2019/11/08 Python
mac在matplotlib中显示中文的操作方法
2020/03/06 Python
mysql_pconnect()和mysql_connect()有什么区别
2012/05/25 面试题
传媒专业推荐信范文
2013/11/23 职场文书
实习生个人的自我评价
2013/12/08 职场文书
前台文员个人求职信范文
2014/01/05 职场文书
高中美术教学反思
2014/01/19 职场文书
中专毕业生的自荐书
2014/07/01 职场文书
争当四好少年演讲稿
2014/09/13 职场文书
解决Jupyter-notebook不弹出默认浏览器的问题
2021/03/30 Python
Python torch.flatten()函数案例详解
2021/08/30 Python