利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
用python写asp详细讲解
Dec 16 Python
python使用rsa加密算法模块模拟新浪微博登录
Jan 22 Python
python连接oracle数据库实例
Oct 17 Python
详解Python实现多进程异步事件驱动引擎
Aug 25 Python
浅谈Tensorflow由于版本问题出现的几种错误及解决方法
Jun 13 Python
漂亮的Django Markdown富文本app插件的实现
Jan 02 Python
Python获取Redis所有Key以及内容的方法
Feb 19 Python
Python中turtle库的使用实例
Sep 09 Python
pandas 对group进行聚合的例子
Dec 27 Python
解决Pycharm 导入其他文件夹源码的2种方法
Feb 12 Python
Python3监控windows,linux系统的CPU、硬盘、内存使用率和各个端口的开启情况详细代码实例
Mar 18 Python
python 实现的IP 存活扫描脚本
Dec 10 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
PHP仿盗链代码
2012/06/03 PHP
一个PHP的远程图片抓取函数分享
2013/09/25 PHP
zf框架的校验器使用使用示例(自定义校验器和校验器链)
2014/03/13 PHP
PHP实现GIF图片验证码
2015/11/04 PHP
javascript函数中的arguments参数
2010/08/01 Javascript
js 处理URL实用技巧
2010/11/23 Javascript
简单的邮箱登陆的提示效果类似于yahoo邮箱
2014/02/26 Javascript
JavaScript数组常用方法
2015/03/02 Javascript
JS实现支持多选的遍历下拉列表代码
2015/08/20 Javascript
浅谈bootstrap源码分析之scrollspy(滚动侦听)
2016/06/06 Javascript
解决iView中时间控件选择的时间总是少一天的问题
2018/03/15 Javascript
基于jQuery.i18n实现web前端的国际化
2018/05/04 jQuery
Vue 中文本内容超出规定行数后展开收起的处理的实现方法
2019/04/28 Javascript
详解vuex数据传输的两种方式及this.$store undefined的解决办法
2019/08/26 Javascript
vue 解决computed修改data数据的问题
2019/11/06 Javascript
前端使用crypto.js进行加密的函数代码
2020/08/16 Javascript
在Python下利用OpenCV来旋转图像的教程
2015/04/16 Python
Python使用matplotlib的pie函数绘制饼状图功能示例
2018/01/08 Python
100行python代码实现跳一跳辅助程序
2018/01/15 Python
TensorFlow神经网络优化策略学习
2018/03/09 Python
python正向最大匹配分词和逆向最大匹配分词的实例
2018/11/14 Python
Python安装selenium包详细过程
2019/07/23 Python
python 如何去除字符串头尾的多余符号
2019/11/19 Python
使用NumPy读取MNIST数据的实现代码示例
2019/11/20 Python
Python unittest单元测试框架实现参数化
2020/04/29 Python
解决Keras 中加入lambda层无法正常载入模型问题
2020/06/16 Python
Pycharm配置lua编译环境过程图解
2020/11/28 Python
python使用yaml 管理selenium元素的示例
2020/12/01 Python
学点简单的Django之第一个Django程序的实现
2021/02/24 Python
DTD的含义以及作用
2014/01/26 面试题
男女朋友协议书
2014/04/23 职场文书
离婚协议书范本(通用篇)
2014/11/30 职场文书
给朋友的道歉短信
2015/05/12 职场文书
《用字母表示数》教学反思
2016/02/17 职场文书
win11怎么用快捷键锁屏? windows11锁屏的几种方法
2021/11/21 数码科技
win10双系统怎么删除一个系统?win10电脑有两个系统删除一个的操作方法
2022/07/15 数码科技