利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python正则表达式去掉数字中的逗号(python正则匹配逗号)
Dec 25 Python
在Django框架中编写Contact表单的教程
Jul 17 Python
Python运维自动化之nginx配置文件对比操作示例
Aug 29 Python
opencv python 图像去噪的实现方法
Aug 31 Python
Python常见数字运算操作实例小结
Mar 22 Python
对Python 中矩阵或者数组相减的法则详解
Aug 26 Python
python实现拼接图片
Mar 23 Python
PyInstaller的安装和使用的详细步骤
Jun 02 Python
虚拟机下载python是否需要联网
Jul 27 Python
基于python实现监听Rabbitmq系统日志代码示例
Nov 28 Python
python中os.path.join()函数实例用法
May 26 Python
基于tensorflow权重文件的解读
May 26 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
PHP实现把数字ID转字母ID
2013/08/12 PHP
小谈php正则提取图片地址
2014/03/27 PHP
ThinkPHP CURD方法之field方法详解
2014/06/18 PHP
Yii2 assets清除缓存的方法
2016/05/16 PHP
Yii2实现多域名跨域同步登录退出
2017/02/04 PHP
jQuery弹出层始终垂直居中相对于屏幕或当前窗口
2013/04/01 Javascript
JS点击链接后慢慢展开隐藏着图片的方法
2015/02/17 Javascript
angular.js之路由的选择方法
2016/09/24 Javascript
Node学习记录之cluster模块
2017/05/31 Javascript
vue中实现左右联动的效果
2018/06/22 Javascript
原生JavaScript实现刮刮乐
2020/09/29 Javascript
[04:42]5分钟带你了解什么是DOTA2(第一期)
2017/02/07 DOTA
对numpy中向量式三目运算符详解
2018/10/31 Python
Python将json文件写入ES数据库的方法
2019/04/10 Python
Python实现元素等待代码实例
2019/11/11 Python
Python利用PyExecJS库执行JS函数的案例分析
2019/12/18 Python
Python数据正态性检验实现过程
2020/04/18 Python
Python爬虫之Spider类用法简单介绍
2020/08/04 Python
详解如何在css3打包后自动追加前缀插件:autoprefixer
2018/12/18 HTML / CSS
Tory Burch美国官方网站:美国时尚生活品牌
2016/08/01 全球购物
extern在函数声明中是什么意思
2014/01/19 面试题
你经历的项目中的SCM配置项主要有哪些?什么是配置项?
2013/11/04 面试题
中医药大学毕业生自荐信
2013/11/08 职场文书
面试求职的个人自我评价
2013/11/16 职场文书
个人素质的自我评价分享
2013/12/16 职场文书
财政专业求职信范文
2014/02/19 职场文书
诚信考试承诺书
2014/03/27 职场文书
爱心捐助倡议书
2014/05/19 职场文书
保护环境的标语
2014/06/09 职场文书
物业总经理助理岗位职责
2014/06/29 职场文书
学校党的群众路线教育实践活动对照检查材料
2014/09/24 职场文书
前台岗位职责
2015/02/13 职场文书
在校学生证明格式
2015/06/24 职场文书
MySQL中优化SQL语句的方法(show status、explain分析服务器状态信息)
2022/04/09 MySQL
Django框架之路由用法
2022/06/10 Python
利用Apache Common将java对象池化的问题
2022/06/16 Servers