利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
wxpython 学习笔记 第一天
Feb 09 Python
浅谈python jieba分词模块的基本用法
Nov 09 Python
TensorFlow实现Batch Normalization
Mar 08 Python
Python通过属性手段实现只允许调用一次的示例讲解
Apr 21 Python
Python简单处理坐标排序问题示例
Jul 11 Python
基于python3 pyQt5 QtDesignner实现窗口化猜数字游戏功能
Jul 15 Python
使用django的ORM框架按月统计近一年内的数据方法
Jul 18 Python
python程序 创建多线程过程详解
Sep 23 Python
解决keras使用cov1D函数的输入问题
Jun 29 Python
python3列表删除大量重复元素remove()方法的问题详解
Jan 04 Python
python UIAutomator2使用超详细教程
Feb 19 Python
python实现发送邮件
Mar 02 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
一个多文件上传的例子(原创)
2006/10/09 PHP
PHP使用mkdir创建多级目录的方法
2015/12/22 PHP
PHP正则删除HTML代码中宽高样式的方法
2017/06/12 PHP
Yii2框架自定义验证规则操作示例
2019/02/08 PHP
为调试JavaScript添加输出窗口的代码
2010/02/07 Javascript
js用Date对象处理时间实现思路及代码
2013/01/31 Javascript
使用window.prompt()实现弹出用户输入的对话框
2015/04/13 Javascript
Jquery中$.post和$.ajax的用法小结
2015/04/28 Javascript
学习JavaScript设计模式之单例模式
2016/01/19 Javascript
基于JS实现数字+字母+中文的混合排序方法
2016/06/06 Javascript
Vuejs 用$emit与$on来进行兄弟组件之间的数据传输通信
2017/02/23 Javascript
详解JS异步加载的三种方式
2017/03/07 Javascript
详解小程序循环require之坑
2019/03/08 Javascript
vue中使用vue-cli接入融云实现即时通信
2019/04/19 Javascript
详解JS预解析原理
2020/06/16 Javascript
vue修改Element的el-table样式的4种方法
2020/09/17 Javascript
Python输出9*9乘法表的方法
2015/05/25 Python
Python装饰器用法示例小结
2018/02/11 Python
python爬取内容存入Excel实例
2019/02/20 Python
python中bs4.BeautifulSoup的基本用法
2019/07/27 Python
Html5原创俄罗斯方块(基于canvas)
2019/01/07 HTML / CSS
乌克兰电子和家用电器商店:Foxtrot
2019/07/23 全球购物
Linux的主要特性
2014/10/06 面试题
竞选演讲稿范文
2013/12/28 职场文书
创先争优活动方案
2014/02/12 职场文书
弘扬民族精神演讲稿
2014/05/07 职场文书
中层干部竞聘演讲稿
2014/05/15 职场文书
教师民族团结演讲稿
2014/08/27 职场文书
乡党委干部党的群众路线教育实践活动个人对照检查材料思想汇报
2014/10/01 职场文书
2015公务员试用期工作总结
2014/12/12 职场文书
骨干教师事迹材料
2014/12/17 职场文书
西安兵马俑导游词
2015/02/02 职场文书
计划生育工作总结2015
2015/04/03 职场文书
2015个人年度工作总结范文
2015/05/28 职场文书
信息技术研修心得体会
2016/01/08 职场文书
美元符号 $
2022/02/17 杂记