利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用 Python 获取 Linux 系统信息的代码
Jul 13 Python
Python中shape计算矩阵的方法示例
Apr 21 Python
Python读取sqlite数据库文件的方法分析
Aug 07 Python
Anaconda多环境多版本python配置操作方法
Sep 12 Python
Python编程求解二叉树中和为某一值的路径代码示例
Jan 04 Python
python使用tkinter实现简单计算器
Jan 30 Python
[原创]Python入门教程3. 列表基本操作【定义、运算、常用函数】
Oct 30 Python
pandas DataFrame 行列索引及值的获取的方法
Jul 02 Python
django 数据库连接模块解析及简单长连接改造方法
Aug 29 Python
python爬虫 Pyppeteer使用方法解析
Sep 28 Python
python numpy 反转 reverse示例
Dec 04 Python
python创建ArcGIS shape文件的实现
Dec 06 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
php防攻击代码升级版
2010/12/29 PHP
PHP gbk环境下json_dencode传送来的汉字
2012/11/13 PHP
php面向对象中的魔术方法中文说明
2014/03/04 PHP
ThinkPHP独立分组使用的注意事项
2014/11/25 PHP
PHP中类型转换 ,常量,系统常量,魔术常量的详解
2017/10/26 PHP
JS声明变量背后的编译原理剖析
2012/12/28 Javascript
jQuery中DOM树操作之复制元素的方法
2015/01/23 Javascript
原生JS实现美图瀑布流布局赏析
2015/09/07 Javascript
javascript自动恢复文本框点击清除后的默认文本
2016/01/12 Javascript
Javascript字符串拼接小技巧(推荐)
2016/06/02 Javascript
AngularJS 指令的交互详解及实例代码
2016/09/14 Javascript
微信小程序 数据绑定详解及实例
2016/10/25 Javascript
vue如何引入sass全局变量
2018/06/28 Javascript
JavaScript实现简单轮播图效果
2018/12/01 Javascript
node错误处理与日志记录的实现
2018/12/24 Javascript
JavaScript判断浏览器运行环境的详细方法
2019/06/30 Javascript
layui use 定义js外部引用函数的方法
2019/09/26 Javascript
vue中音频wavesurfer.js的使用方法
2020/02/20 Vue.js
VSCode 添加自定义注释的方法(附带红色警戒经典注释风格)
2020/08/27 Javascript
原生JS生成指定位数的验证码
2020/10/28 Javascript
python爬虫常用的模块分析
2014/08/29 Python
pyqt远程批量执行Linux命令程序的方法
2019/02/14 Python
华为旗下电子商务平台:华为商城
2016/08/06 全球购物
香港时装购物网站:ZALORA香港
2017/04/23 全球购物
哥伦比亚加拿大官网:Columbia Sportswear Canada
2020/09/07 全球购物
临床医学大学生求职信
2013/09/28 职场文书
学生自我鉴定范文
2013/10/04 职场文书
网络教育毕业生自我鉴定
2013/10/10 职场文书
团结就是力量演讲稿
2014/05/21 职场文书
应用外语系自荐信
2014/06/26 职场文书
2015年置业顾问工作总结
2015/04/07 职场文书
2015年小学英语教师工作总结
2015/05/12 职场文书
家长会感言
2015/08/01 职场文书
《玩出了名堂》教学反思
2016/02/17 职场文书
MongoDB连接数据库并创建数据等使用方法
2021/11/27 MongoDB
Elasticsearch Recovery 详细介绍
2022/04/19 Java/Android