Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python常见数据结构详解
Jul 24 Python
在Python中使用cookielib和urllib2配合PyQuery抓取网页信息
Apr 25 Python
Python实现桶排序与快速排序算法结合应用示例
Nov 22 Python
Python数据结构与算法之图的最短路径(Dijkstra算法)完整实例
Dec 12 Python
解决python3 json数据包含中文的读写问题
May 10 Python
Python中垃圾回收和del语句详解
Nov 15 Python
在python中只选取列表中某一纵列的方法
Nov 28 Python
Django模型序列化返回自然主键值示例代码
Jun 12 Python
详解python中的异常和文件读写
Jan 03 Python
Python利器openpyxl之操作excel表格
Apr 17 Python
python 模块重载的五种方法
Apr 24 Python
Python极值整数的边界探讨分析
Sep 15 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
海贼王动画变成“真人”后,凯多神还原,雷利太帅了!
2020/04/09 日漫
CodeIgniter实现更改view文件夹路径的方法
2014/07/04 PHP
THINKPHP项目开发中的日志记录实例分析
2014/12/01 PHP
php实现按天数、星期、月份查询的搜索框
2016/05/02 PHP
JavaScript异步调用定时方法并停止该方法实现代码
2012/03/16 Javascript
探索Emberjs制作一个简单的Todo应用
2012/11/07 Javascript
jQuery之按钮组件的深入解析
2013/06/19 Javascript
对于this和$(this)的个人理解
2013/09/08 Javascript
jquery库或JS文件在eclipse下报错问题解决方法
2014/04/17 Javascript
javascript实现获取浏览器版本、浏览器类型
2015/12/02 Javascript
多种js图片预加载实现方式分享
2016/02/19 Javascript
使用Sticky组件实现带sticky效果的tab导航和滚动导航的方法
2016/03/22 Javascript
jQuery简单注册和禁用全局事件的方法
2016/07/25 Javascript
BootStrap网页中代码显示用法详解
2016/10/21 Javascript
ES6正则的扩展实例详解
2017/04/25 Javascript
JS组件系列之MVVM组件构建自己的Vue组件
2017/04/28 Javascript
通过jquery toggleClass()属性制作文章段落更改背景颜色
2018/05/21 jQuery
一次让你了解全部JavaScript的作用域
2019/06/24 Javascript
vue.js实现简单购物车功能
2020/05/30 Javascript
python获取图片颜色信息的方法
2015/03/18 Python
剖析Python的Tornado框架中session支持的实现代码
2015/08/21 Python
Python的包管理器pip更换软件源的方法详解
2016/06/20 Python
python3.4用函数操作mysql5.7数据库
2017/06/23 Python
Pytorch入门之mnist分类实例
2018/04/14 Python
python3+PyQt5使用数据库窗口视图
2018/04/24 Python
浅谈pycharm的xmx和xms设置方法
2018/12/03 Python
python 划分数据集为训练集和测试集的方法
2018/12/11 Python
执行Django数据迁移时报 1091错误及解决方法
2019/10/14 Python
Pycharm中切换pytorch的环境和配置的教程详解
2020/03/13 Python
ONLY德国官方在线商店:购买时尚女装
2017/09/21 全球购物
Linux中如何用命令创建目录
2015/01/12 面试题
酒店行政人事部经理职务说明书
2014/02/26 职场文书
网络编辑职责
2014/03/01 职场文书
2015年个人现实表现材料
2014/12/10 职场文书
出纳岗位职责
2015/01/31 职场文书
大队委员竞选稿
2015/11/20 职场文书