Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 不同对象比较大小示例探讨
Aug 21 Python
使用PyCharm配合部署Python的Django框架的配置纪实
Nov 19 Python
通过5个知识点轻松搞定Python的作用域
Sep 09 Python
Python中struct模块对字节流/二进制流的操作教程
Jan 21 Python
python实现简单中文词频统计示例
Nov 08 Python
python二进制文件的转译详解
Jul 03 Python
python+numpy按行求一个二维数组的最大值方法
Jul 09 Python
python3中利用filter函数输出小于某个数的所有回文数实例
Nov 24 Python
Python+numpy实现矩阵的行列扩展方式
Nov 29 Python
JupyterNotebook设置Python环境的方法步骤
Dec 03 Python
Python学习之路之pycharm的第一个项目搭建过程
Jun 18 Python
十个Python自动化常用操作,即拿即用
May 10 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
php array_unique之后json_encode需要注意
2011/01/02 PHP
Codeigniter出现错误提示Error with CACHE directory的解决方案
2014/06/12 PHP
在html文件中也可以执行php语句的方法
2015/04/09 PHP
PHP下SSL加密解密、验证、签名方法(很简单)
2020/06/28 PHP
thinkPHP js文件中U方法不被解析问题的解决方法
2016/12/05 PHP
php mysql操作mysql_connect连接数据库实例详解
2016/12/26 PHP
php日志函数error_log用法实例分析
2019/09/23 PHP
jquery判断RadioButtonList和RadioButton中是否有选中项示例
2013/09/29 Javascript
JS中的form.submit()不能提交表单的错误原因
2014/10/08 Javascript
jQuery源码解读之addClass()方法分析
2015/02/20 Javascript
jQuery使用prepend()方法在元素前添加内容用法实例
2015/03/26 Javascript
AngularJS中的API(接口)简单实现
2016/07/28 Javascript
详解XMLHttpRequest(二)响应属性、二进制数据、监测上传下载进度
2016/09/14 Javascript
jQuery监听文件上传实现进度条效果的方法
2016/10/16 Javascript
javascript history对象详解
2017/02/09 Javascript
Angular中$state.go页面跳转并传递参数的方法
2017/05/09 Javascript
30分钟快速实现小程序语音识别功能
2018/11/27 Javascript
详解关于表格合并span-method方法的补充(表格数据由后台动态返回)
2019/05/21 Javascript
vue elementui el-form rules动态验证的实例代码详解
2019/05/23 Javascript
解决$store.getters调用不执行的问题
2019/11/08 Javascript
Vue管理系统前端之组件拆分封装详解
2020/08/23 Javascript
jdk1.8+vue elementui实现多级菜单功能
2020/09/24 Javascript
JavaScript实现通讯录功能
2020/12/27 Javascript
Python实现简单的多任务mysql转xml的方法
2017/02/08 Python
Tensorflow之Saver的用法详解
2018/04/23 Python
详解pandas安装若干异常及解决方案总结
2019/01/10 Python
PyTorch中permute的用法详解
2019/12/30 Python
Python利用Faiss库实现ANN近邻搜索的方法详解
2020/08/03 Python
中专生毕业个人鉴定
2014/02/26 职场文书
企业三严三实学习心得体会
2014/10/13 职场文书
财政局个人年终总结
2015/03/03 职场文书
入党培养人考察意见
2015/06/08 职场文书
财产分割协议书
2016/03/22 职场文书
ORACLE数据库对long类型字段进行模糊匹配的解决思路
2021/04/07 Oracle
Python Django搭建文件下载服务器的实现
2021/05/10 Python
MySQL中order by的使用详情
2021/11/17 MySQL