Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python多线程用法实例详解
Jan 15 Python
用Python实现通过哈希算法检测图片重复的教程
Apr 02 Python
完美解决python遍历删除字典里值为空的元素报错问题
Sep 11 Python
Python实现Linux的find命令实例分享
Jun 04 Python
Python网络编程之TCP与UDP协议套接字用法示例
Feb 02 Python
Python 字符串与数字输出方法
Jul 16 Python
python调用c++传递数组的实例
Feb 13 Python
利用Tensorflow构建和训练自己的CNN来做简单的验证码识别方式
Jan 20 Python
python3 sleep 延时秒 毫秒实例
May 04 Python
Keras: model实现固定部分layer,训练部分layer操作
Jun 28 Python
手把手教你使用TensorFlow2实现RNN
Jul 15 Python
python高温预警数据获取实例
Jul 23 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
收音机鉴频器对声音的影响和频偏分析
2021/03/02 无线电
PHP5与MySQL数据库操作常用代码 收集
2010/03/21 PHP
PHP substr 截取字符串出现乱码问题解决方法[utf8与gb2312]
2011/12/16 PHP
很让人受教的 提高php代码质量36计
2012/09/05 PHP
php需登录的文件上传管理系统
2020/03/21 PHP
PHP处理bmp格式图片的方法分析
2017/07/04 PHP
php判断/计算闰年的方法小结【三种方法】
2019/07/06 PHP
JavaScript实现快速排序(自已编写)
2012/12/19 Javascript
js二级地域选择的实现方法
2013/06/17 Javascript
Jquery Uploadify上传带进度条的简单实例
2014/02/12 Javascript
微信小程序  生命周期详解
2016/10/27 Javascript
BootStrap中
2016/12/10 Javascript
详解Vue 事件驱动和依赖追踪
2017/04/22 Javascript
javascript中mouseenter与mouseover的异同
2017/06/06 Javascript
基于vue2实现上拉加载功能
2017/11/28 Javascript
jackson解析json字符串,首字母大写会自动转为小写的方法
2017/12/22 Javascript
微信小程序自定义toast组件的方法详解【含动画】
2019/05/11 Javascript
微信小程序select下拉框实现效果
2019/05/15 Javascript
通过扫小程序码实现网站登陆功能
2019/08/22 Javascript
nodejs简单抓包工具使用详解
2019/08/23 NodeJs
Python脚本在Appium库上对移动应用实现自动化测试
2015/04/17 Python
浅析Python中signal包的使用
2015/11/13 Python
python魔法方法-自定义序列详解
2016/07/21 Python
python如何在列表、字典中筛选数据
2018/03/19 Python
python3+PyQt5图形项的自定义和交互 python3实现page Designer应用程序
2020/07/20 Python
python画柱状图--不同颜色并显示数值的方法
2018/12/13 Python
python requests使用socks5的例子
2019/07/25 Python
详解基于python的多张不同宽高图片拼接成大图
2019/09/26 Python
CSS伪类与CSS伪元素的区别及由来具体说明
2012/12/07 HTML / CSS
澳大利亚手表品牌:Time IV Change
2018/10/06 全球购物
德国咖啡批发商:Coffeefair
2019/08/26 全球购物
杭州SQL浙江浙大网新恩普软件有限公司
2013/07/27 面试题
2014年关于两会精神的心得体会
2014/03/17 职场文书
关爱留守儿童主题班会
2015/08/13 职场文书
MySQL 全文索引使用指南
2021/05/25 MySQL
使用feign服务调用添加Header参数
2021/06/23 Java/Android