Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Pyhthon中使用compileall模块编译源文件为pyc文件
Apr 28 Python
Python的Django框架中设置日期和字段可选的方法
Jul 17 Python
python与php实现分割文件代码
Mar 06 Python
Python读取txt文件数据的方法(用于接口自动化参数化数据)
Jun 27 Python
python 对txt中每行内容进行批量替换的方法
Jul 11 Python
Python使用win32com模块实现数据库表结构自动生成word表格的方法
Jul 17 Python
python安装pil库方法及代码
Jun 25 Python
谈一谈数组拼接tf.concat()和np.concatenate()的区别
Feb 07 Python
python使用matplotlib:subplot绘制多个子图的示例
Sep 24 Python
python 实现关联规则算法Apriori的示例
Sep 30 Python
jupyter notebook保存文件默认路径更改方法汇总(亲测可以)
Jun 09 Python
Python中requests库的用法详解
Jun 05 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
php&java(三)
2006/10/09 PHP
PHP与MySQL开发中页面乱码的产生与解决
2008/03/27 PHP
说说PHP的autoLoad自动加载机制
2012/09/27 PHP
php采用session实现防止页面重复刷新
2015/12/24 PHP
php生成图片验证码的方法
2016/04/15 PHP
自己实现ajax封装示例分享
2014/04/01 Javascript
jQuery获得包含margin的outerWidth和outerHeight的方法
2015/03/25 Javascript
JavaScript中的toLocaleDateString()方法使用简介
2015/06/12 Javascript
jQuery基础的工厂函数以及定时器的经典实例分析
2016/05/20 Javascript
详解BootStrap中Affix控件的使用及保持布局的美观的方法
2016/07/08 Javascript
jQuery自定义插件详解及实例代码
2016/12/29 Javascript
详解vue2.0组件通信各种情况总结与实例分析
2017/03/22 Javascript
bootstrap常用组件之头部导航实现代码
2017/04/20 Javascript
AngularJS实现进度条功能示例
2017/07/05 Javascript
微信小程序引用公共js里的方法的实例详解
2017/08/17 Javascript
利用nvm管理多个版本的node.js与npm详解
2017/11/02 Javascript
不可错过的十本Python好书
2017/07/06 Python
Python编程实现正则删除命令功能
2017/08/30 Python
python 列表递归求和、计数、求最大元素的实例
2018/11/28 Python
Python实现的KMeans聚类算法实例分析
2018/12/29 Python
python BlockingScheduler定时任务及其他方式的实现
2019/09/19 Python
详解mac python+selenium+Chrome 简单案例
2019/11/08 Python
python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例
2019/11/28 Python
Python转换itertools.chain对象为数组的方法
2020/02/07 Python
深度学习入门之Pytorch 数据增强的实现
2020/02/26 Python
零基础小白多久能学会python
2020/06/22 Python
纯CSS3制作页面切换效果的实例代码
2019/05/30 HTML / CSS
加拿大最大的相机店:Henry’s
2017/05/17 全球购物
马来西亚航空官方网站:Malaysia Airlines
2017/07/28 全球购物
东南亚冒险旅行与活动:Adventoro
2019/10/16 全球购物
高中课程设置方案
2014/05/28 职场文书
师德师风心得体会(2016精选篇)
2016/01/12 职场文书
python实现网络五子棋
2021/04/11 Python
PHP连接MSSQL数据库案例,PHPWAMP多个PHP版本连接SQL Server数据库
2021/04/16 PHP
pytorch实现手写数字图片识别
2021/05/20 Python
Python3使用Qt5来实现简易的五子棋小游戏
2022/05/02 Python