编程 Python

Pandas统计重复的列里面的值方法

Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下：

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]

方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]

方法3

np.setxor1d(a, np.unique(a), assume_unique=True)

方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]

方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考：https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持三水点靠木。

Pandas统计重复的列里面的值方法

- Author -

耗子来啦

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python常见数据结构详解

Jul 24 Python

在Python中使用cookielib和urllib2配合PyQuery抓取网页信息

Apr 25 Python

Python实现桶排序与快速排序算法结合应用示例

Nov 22 Python

Python数据结构与算法之图的最短路径(Dijkstra算法)完整实例

Dec 12 Python

解决python3 json数据包含中文的读写问题

May 10 Python

Python中垃圾回收和del语句详解

Nov 15 Python

在python中只选取列表中某一纵列的方法

Nov 28 Python

Django模型序列化返回自然主键值示例代码

Jun 12 Python

详解python中的异常和文件读写

Jan 03 Python

Python利器openpyxl之操作excel表格

Apr 17 Python

python 模块重载的五种方法

Apr 24 Python

Python极值整数的边界探讨分析

Sep 15 Python

自学python的建议和周期预算

Jan 30 #Python

python DataFrame 取差集实例

Jan 30 #Python

对python dataframe逻辑取值的方法详解

Jan 30 #Python

对Python中DataFrame选择某列值为XX的行实例详解

Jan 29 #Python

把pandas转换int型为str型的方法

Jan 29 #Python

使用pandas把某一列的字符值转换为数字的实例

Jan 29 #Python

Python不同目录间进行模块调用的实现方法

Jan 29 #Python

You might like

海贼王动画变成“真人”后，凯多神还原，雷利太帅了！

2020/04/09 日漫

CodeIgniter实现更改view文件夹路径的方法

2014/07/04 PHP

THINKPHP项目开发中的日志记录实例分析

2014/12/01 PHP

php实现按天数、星期、月份查询的搜索框

2016/05/02 PHP

JavaScript异步调用定时方法并停止该方法实现代码

2012/03/16 Javascript

探索Emberjs制作一个简单的Todo应用

2012/11/07 Javascript

jQuery之按钮组件的深入解析

2013/06/19 Javascript

对于this和$(this)的个人理解

2013/09/08 Javascript

jquery库或JS文件在eclipse下报错问题解决方法

2014/04/17 Javascript

javascript实现获取浏览器版本、浏览器类型

2015/12/02 Javascript

多种js图片预加载实现方式分享

2016/02/19 Javascript

使用Sticky组件实现带sticky效果的tab导航和滚动导航的方法

2016/03/22 Javascript

jQuery简单注册和禁用全局事件的方法

2016/07/25 Javascript

BootStrap网页中代码显示用法详解

2016/10/21 Javascript

ES6正则的扩展实例详解

2017/04/25 Javascript

JS组件系列之MVVM组件构建自己的Vue组件

2017/04/28 Javascript

通过jquery toggleClass()属性制作文章段落更改背景颜色

2018/05/21 jQuery

一次让你了解全部JavaScript的作用域

2019/06/24 Javascript

vue.js实现简单购物车功能

2020/05/30 Javascript

python获取图片颜色信息的方法

2015/03/18 Python

剖析Python的Tornado框架中session支持的实现代码

2015/08/21 Python

Python的包管理器pip更换软件源的方法详解

2016/06/20 Python

python3.4用函数操作mysql5.7数据库

2017/06/23 Python

Pytorch入门之mnist分类实例

2018/04/14 Python

python3+PyQt5使用数据库窗口视图

2018/04/24 Python

浅谈pycharm的xmx和xms设置方法

2018/12/03 Python

python 划分数据集为训练集和测试集的方法

2018/12/11 Python

执行Django数据迁移时报 1091错误及解决方法

2019/10/14 Python

Pycharm中切换pytorch的环境和配置的教程详解

2020/03/13 Python

ONLY德国官方在线商店：购买时尚女装

2017/09/21 全球购物

Linux中如何用命令创建目录

2015/01/12 面试题

酒店行政人事部经理职务说明书

2014/02/26 职场文书

网络编辑职责

2014/03/01 职场文书

2015年个人现实表现材料

2014/12/10 职场文书

出纳岗位职责

2015/01/31 职场文书

大队委员竞选稿

2015/11/20 职场文书