利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python批量提交沙箱问题实例
Oct 08 Python
初步介绍Python中的pydoc模块和distutils模块
Apr 13 Python
Python的“二维”字典 (two-dimension dictionary)定义与实现方法
Apr 27 Python
python实现文本界面网络聊天室
Dec 12 Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 Python
浅析Python与Mongodb数据库之间的操作方法
Jul 01 Python
python监控进程状态,记录重启时间及进程号的实例
Jul 15 Python
Python 进程之间共享数据(全局变量)的方法
Jul 16 Python
python 进程 进程池 进程间通信实现解析
Aug 23 Python
Python 70行代码实现简单算式计算器解析
Aug 30 Python
通过python3实现投票功能代码实例
Sep 26 Python
python 制作网站小说下载器
Feb 20 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
简单采集了yahoo的一些数据
2007/02/14 PHP
PHP连接SQLSERVER 注意事项(附dll文件下载)
2012/06/28 PHP
php小技巧之过滤ascii控制字符
2014/05/14 PHP
PHP实现浏览器中直接输出图片的方法示例
2018/03/14 PHP
laravel7学习之无限级分类的最新实现方法
2020/09/30 PHP
JavaScript格式化数字的函数代码
2010/11/30 Javascript
jQuery根据纬度经度查看地图处理程序
2013/05/08 Javascript
jquery仿QQ商城带左右按钮控制焦点图片切换滚动效果
2013/06/27 Javascript
JS+CSS实现一个气泡提示框
2013/08/18 Javascript
jquery validation验证身份证号,护照,电话号码,email(实例代码)
2013/11/06 Javascript
JavaScript加入收藏夹功能(兼容IE、firefox、chrome)
2014/05/05 Javascript
jquery中push()的用法(数组添加元素)
2014/11/25 Javascript
node.js中的buffer.copy方法使用说明
2014/12/14 Javascript
浅谈javascript中字符串String与数组Array
2014/12/31 Javascript
详解如何在angular2中获取节点
2017/11/23 Javascript
React组件中的this的具体使用
2018/02/28 Javascript
对vue中v-on绑定自定事件的实例讲解
2018/09/06 Javascript
微信小程序HTTP接口请求封装的实现
2019/02/21 Javascript
Js on及addEventListener原理用法区别解析
2020/07/11 Javascript
js+canvas实现转盘效果(两个版本)
2020/09/13 Javascript
[49:17]DOTA2-DPC中国联赛 正赛 Phoenix vs Dynasty BO3 第三场 1月26日
2021/03/11 DOTA
Python与Redis的连接教程
2015/04/22 Python
python计算方程式根的方法
2015/05/07 Python
Python实现将照片变成卡通图片的方法【基于opencv】
2018/01/17 Python
Python实现爬虫从网络上下载文档的实例代码
2018/06/13 Python
梅尔倒谱系数(MFCC)实现
2019/06/19 Python
python复合条件下的字典排序
2020/12/18 Python
护理专科自荐书范文
2014/02/18 职场文书
服务之星事迹材料
2014/05/03 职场文书
人力资源管理专业求职信
2014/07/23 职场文书
受伤赔偿协议书
2014/09/24 职场文书
雷峰塔导游词
2015/02/09 职场文书
研究生个人学年总结
2015/02/14 职场文书
2015年医务人员医德医风自我评价
2015/03/03 职场文书
前台岗位职责范本
2015/04/16 职场文书
CSS精灵图的原理与使用方法介绍
2022/03/17 HTML / CSS