Pandas统计重复的列里面的值方法


Posted in Python onJanuary 30, 2019

pandas

代码如下:

import pandas as pd
import numpy as np

salaries = pd.DataFrame({
 'name': ['BOSS', 'Lilei', 'Lilei', 'Han', 'BOSS', 'BOSS', 'Han', 'BOSS'],
 'Year': [2016, 2016, 2016, 2016, 2017, 2017, 2017, 2017],
 'Salary': [1, 2, 3, 4, 5, 6, 7, 8],
 'Bonus': [2, 2, 2, 2, 3, 4, 5, 6]
})
print(salaries)
print(salaries['Bonus'].duplicated(keep='first'))
print(salaries[salaries['Bonus'].duplicated(keep='first')].index)
print(salaries[salaries['Bonus'].duplicated(keep='first')])
print(salaries['Bonus'].duplicated(keep='last'))
print(salaries[salaries['Bonus'].duplicated(keep='last')].index)
print(salaries[salaries['Bonus'].duplicated(keep='last')])

输出如下:

Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
4  3  5 2017 BOSS
5  4  6 2017 BOSS
6  5  7 2017 Han
7  6  8 2017 BOSS
0 False
1  True
2  True
3  True
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([1, 2, 3], dtype='int64')
 Bonus Salary Year name
1  2  2 2016 Lilei
2  2  3 2016 Lilei
3  2  4 2016 Han
0  True
1  True
2  True
3 False
4 False
5 False
6 False
7 False
Name: Bonus, dtype: bool
Int64Index([0, 1, 2], dtype='int64')
 Bonus Salary Year name
0  2  1 2016 BOSS
1  2  2 2016 Lilei
2  2  3 2016 Lilei

非pandas

对于如nunpy中的这些操作主要如下:

假设有数组

a = np.array([1, 2, 1, 3, 3, 3, 0])

想找出 [1 3]

则有

方法1

m = np.zeros_like(a, dtype=bool)
m[np.unique(a, return_index=True)[1]] = True
a[~m]
方法2

a[~np.in1d(np.arange(len(a)), np.unique(a, return_index=True)[1], assume_unique=True)]
方法3

np.setxor1d(a, np.unique(a), assume_unique=True)
方法4

u, i = np.unique(a, return_inverse=True)
u[np.bincount(i) > 1]
方法5

s = np.sort(a, axis=None)
s[:-1][s[1:] == s[:-1]]

参考:https://stackoverflow.com/questions/11528078/determining-duplicate-values-in-an-array

以上这篇Pandas统计重复的列里面的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
解决python写的windows服务不能启动的问题
Apr 15 Python
pycharm 使用心得(六)进行简单的数据库管理
Jun 06 Python
python使用append合并两个数组的方法
Apr 28 Python
Python基于identicon库创建类似Github上用的头像功能
Sep 25 Python
TensorFlow模型保存和提取的方法
Mar 08 Python
python topN 取最大的N个数或最小的N个数方法
Jun 04 Python
Python TCPServer 多线程多客户端通信的实现
Dec 31 Python
jupyter notebook oepncv 显示一张图像的实现
Apr 24 Python
Keras 切换后端方式(Theano和TensorFlow)
Jun 19 Python
13个Pandas实用技巧,助你提高开发效率
Aug 19 Python
python hmac模块验证客户端的合法性
Nov 07 Python
python基于tkinter制作m3u8视频下载工具
Apr 24 Python
自学python的建议和周期预算
Jan 30 #Python
python DataFrame 取差集实例
Jan 30 #Python
对python dataframe逻辑取值的方法详解
Jan 30 #Python
对Python中DataFrame选择某列值为XX的行实例详解
Jan 29 #Python
把pandas转换int型为str型的方法
Jan 29 #Python
使用pandas把某一列的字符值转换为数字的实例
Jan 29 #Python
Python不同目录间进行模块调用的实现方法
Jan 29 #Python
You might like
台湾中原大学php教程孙仲岳主讲
2008/01/07 PHP
php中比较简单的导入phpmyadmin生成的sql文件的方法
2011/06/28 PHP
PHP修改session_id示例代码
2014/01/08 PHP
ThinkPHP使用smarty模板引擎的方法
2014/07/01 PHP
Yii开启片段缓存的方法
2016/03/28 PHP
PHP文件上传操作实例详解
2016/09/27 PHP
PHP实现链式操作的三种方法详解
2017/11/16 PHP
thinkphp5 加载静态资源路径与常量的方法
2017/12/24 PHP
PHP时间日期增减操作示例【date strtotime实现加一天、加一月等操作】
2018/12/21 PHP
PHP实现会员账号单唯一登录的方法分析
2019/03/07 PHP
什么是PHP7中的孤儿进程与僵尸进程
2019/04/14 PHP
thinkphp3.2同时连接两个数据库的简单方法
2019/08/13 PHP
jQuery控制iFrame(实例代码)
2013/11/19 Javascript
js控制iframe的高度/宽度让其自适应内容
2014/04/09 Javascript
jQuery中hover方法和toggle方法使用指南
2015/02/27 Javascript
基于insertBefore制作简单的循环插空效果
2015/09/21 Javascript
jquery 无限极下拉菜单的简单实例(精简浓缩版)
2016/05/31 Javascript
使用BootStrap实现标签切换原理解析
2017/03/14 Javascript
ES6中Array.find()和findIndex()函数的用法详解
2017/09/16 Javascript
微信小程序中吸底按钮适配iPhone X方案
2017/11/29 Javascript
基于JS实现web端录音与播放功能
2019/04/17 Javascript
[49:43]VG vs FNATIC 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
利用soaplib搭建webservice详细步骤和实例代码
2013/11/20 Python
Python实现求最大公约数及判断素数的方法
2015/05/26 Python
Python 数据处理库 pandas进阶教程
2018/04/21 Python
pycharm显示远程图片的实现
2019/11/04 Python
解决Jupyter notebook更换主题工具栏被隐藏及添加目录生成插件问题
2020/04/20 Python
Python压缩模块zipfile实现原理及用法解析
2020/08/14 Python
Python安装第三方库攻略(pip和Anaconda)
2020/10/15 Python
Scrapy实现模拟登录的示例代码
2021/02/21 Python
Yankee Candle官网:美国最畅销蜡烛品牌之一
2020/01/05 全球购物
萤火虫之墓观后感
2015/06/05 职场文书
歌舞青春观后感
2015/06/10 职场文书
2021-4-3课程——SQL Server查询【2】
2021/04/05 SQL Server
自从在 IDEA 中用了热部署神器 JRebel 之后,开发效率提升了 10(真棒)
2021/06/26 Java/Android
MySQL定时备份数据库(全库备份)的实现
2021/09/25 MySQL