Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python爬虫headers设置后无效的解决方法
Oct 21 Python
pycharm 将django中多个app放到同个文件夹apps的处理方法
May 30 Python
python对列进行平移变换的方法(shift)
Jan 10 Python
Python基础之函数的定义与使用示例
Mar 23 Python
python Matplotlib底图中鼠标滑过显示隐藏内容的实例代码
Jul 31 Python
python 模拟银行转账功能过程详解
Aug 06 Python
python-opencv获取二值图像轮廓及中心点坐标的代码
Aug 27 Python
基于PyTorch的permute和reshape/view的区别介绍
Jun 18 Python
python中实现词云图的示例
Dec 19 Python
python基于tkinter制作m3u8视频下载工具
Apr 24 Python
Python采集股票数据并制作可视化柱状图
Apr 04 Python
python 镜像环境搭建总结
Sep 23 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
php基础知识:类与对象(1)
2006/12/13 PHP
PHP 配置open_basedir 让各虚拟站点独立运行
2009/11/12 PHP
让你成为更出色的PHP开发者的10个技巧
2011/02/25 PHP
七款最流行的PHP本地服务器分享
2013/02/19 PHP
以文件形式缓存php变量的方法
2015/06/26 PHP
微信 getAccessToken方法详解及实例
2016/11/23 PHP
在IE上直接编辑网页内容的js代码(IE地址栏js)
2009/04/27 Javascript
使用JavaScript 实现对象 匀速/变速运动的方法
2013/05/08 Javascript
非jQuery实现照片散落桌子上,单击放大的LightBox效果
2014/11/28 Javascript
JavaScript获取图片像素颜色并转换为box-shadow显示
2016/03/11 Javascript
使用递归遍历对象获得value值的实现方法
2016/06/14 Javascript
浅谈JavaScript 覆盖原型以及更改原型
2016/08/31 Javascript
使用express+multer实现node中的图片上传功能
2018/02/02 Javascript
微信小程序实现弹出菜单功能
2018/06/12 Javascript
Vue实现表格批量审核功能实例代码
2019/05/28 Javascript
Vue 动态路由的实现及 Springsecurity 按钮级别的权限控制
2019/09/05 Javascript
python 请求服务器的实现代码(http请求和https请求)
2018/05/25 Python
python创建文件时去掉非法字符的方法
2018/10/31 Python
强悍的Python读取大文件的解决方案
2019/02/16 Python
Django模型修改及数据迁移实现解析
2019/08/01 Python
Java文件与类动手动脑实例详解
2019/11/10 Python
Python 抓取数据存储到Redis中的操作
2020/07/16 Python
css3中transition属性详解
2014/09/02 HTML / CSS
HTML5中indexedDB 数据库的使用实例
2017/05/11 HTML / CSS
买卖正宗运动鞋:GOAT
2019/12/06 全球购物
JD Sports丹麦:英国领先的运动时尚零售商
2020/11/24 全球购物
static全局变量与普通的全局变量有什么区别
2014/05/27 面试题
行政部主管岗位职责
2013/12/28 职场文书
超市创业计划书
2014/09/15 职场文书
四风批评与自我批评范文
2014/10/14 职场文书
2014年食堂工作总结
2014/11/20 职场文书
皇城相府导游词
2015/02/06 职场文书
学生会辞职信
2015/03/02 职场文书
公司开除员工通知
2015/04/22 职场文书
涨价通知怎么写
2015/04/23 职场文书
《三国志》赏析
2019/08/27 职场文书