利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python列表list数组array用法实例解析
Oct 28 Python
python 自动化将markdown文件转成html文件的方法
Sep 23 Python
Python初学时购物车程序练习实例(推荐)
Aug 08 Python
python爬虫 urllib模块反爬虫机制UA详解
Aug 20 Python
使用批处理脚本自动生成并上传NuGet包(操作方法)
Nov 19 Python
flask框架json数据的拿取和返回操作示例
Nov 28 Python
PyQt5中向单元格添加控件的方法示例
Mar 24 Python
Python 如何查找特定类型文件
Aug 17 Python
next在python中返回迭代器的实例方法
Dec 15 Python
Python面向对象之内置函数相关知识总结
Jun 24 Python
利用Python实现Picgo图床工具
Nov 23 Python
python lambda 表达式形式分析
Apr 03 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
php curl模拟post请求和提交多维数组的示例代码
2015/11/19 PHP
PHP中in_array的隐式转换的解决方法
2018/03/06 PHP
cookie.js 加载顺序问题怎么才有效
2013/07/31 Javascript
document.execCommand()的用法小结
2014/01/08 Javascript
js导航栏单击事件背景变换示例代码
2014/01/13 Javascript
JavaScript语言对Unicode字符集的支持详解
2014/12/30 Javascript
JavaScript匿名函数用法分析
2015/02/13 Javascript
bootstrap table实现x-editable的行单元格编辑及解决数据Empty和支持多样式问题
2017/08/10 Javascript
Bootstrap实现下拉菜单多级联动
2017/11/23 Javascript
[08:44]DOTA2发布会群星聚首 我们都是刀塔人
2014/03/21 DOTA
跟老齐学Python之不要红头文件(2)
2014/09/28 Python
Python contextlib模块使用示例
2015/02/18 Python
RC4文件加密的python实现方法
2015/06/30 Python
Python实现购物程序思路及代码
2017/07/24 Python
python自动截取需要区域,进行图像识别的方法
2018/05/17 Python
Python爬取个人微信朋友信息操作示例
2018/08/03 Python
Python使用matplotlib绘制随机漫步图
2018/08/27 Python
python 日期排序的实例代码
2019/07/11 Python
django的auth认证,authenticate和装饰器功能详解
2019/07/25 Python
python 实现手机自动拨打电话的方法(通话压力测试)
2019/08/08 Python
python 扩展print打印文件路径和当前时间信息的实例代码
2019/10/11 Python
Python将列表中的元素转化为数字并排序的示例
2019/12/25 Python
分布式全文检索引擎ElasticSearch原理及使用实例
2020/11/14 Python
解决canvas转base64/jpeg时透明区域变成黑色背景的方法
2016/10/23 HTML / CSS
电子邮箱格式怎么写
2014/01/12 职场文书
义和团口号
2014/06/17 职场文书
建筑工程造价专业自荐信
2014/07/08 职场文书
研修心得体会
2014/09/04 职场文书
成绩报告单家长评语
2014/12/30 职场文书
安徽导游词
2015/02/12 职场文书
毕业生个人自荐书
2015/03/05 职场文书
校运会广播稿
2015/08/19 职场文书
素质教育学习心得体会
2016/01/19 职场文书
2019教师的学习计划
2019/06/25 职场文书
Java比较两个对象中全部属性值是否相等的方法
2021/08/07 Java/Android
Golang中channel的原理解读(推荐)
2021/10/16 Golang