利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 列表list使用介绍
Nov 30 Python
Python计算三维矢量幅度的方法
Jun 15 Python
Python可变参数函数用法实例
Jul 07 Python
python中实现精确的浮点数运算详解
Nov 02 Python
Python中常用信号signal类型实例
Jan 25 Python
解决pandas无法在pycharm中使用plot()方法显示图像的问题
May 24 Python
python字典值排序并取出前n个key值的方法
Oct 17 Python
python3使用flask编写注册post接口的方法
Dec 28 Python
python 使用装饰器并记录log的示例代码
Jul 12 Python
详解Python time库的使用
Oct 10 Python
python+selenium实现12306模拟登录的步骤
Jan 21 Python
python中 Flask Web 表单的使用方法
May 20 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
PHP+FFMPEG实现将视频自动转码成H264标准Mp4文件
2014/09/24 PHP
PHP7 新特性详细介绍
2016/09/06 PHP
Codeigniter里的无刷新上传的实现代码
2019/04/14 PHP
PHP二维数组分页2种实现方法解析
2020/07/09 PHP
ThinkPHP5.1的权限控制怎么写?分享一个AUTH权限控制
2021/03/09 PHP
javascript 获取函数形参个数
2014/07/31 Javascript
理解jQuery stop()方法
2014/11/21 Javascript
AngularJS语法详解(续)
2015/01/23 Javascript
JS获取鼠标坐标位置实例分析
2016/01/20 Javascript
jQuery实现带遮罩层效果的blockUI弹出层示例【附demo源码下载】
2016/09/14 Javascript
jQuery Validate让普通按钮触发表单验证的方法
2016/12/15 Javascript
Javascript同时声明一连串(多个)变量的方法
2017/01/23 Javascript
微信小程序 共用变量值的实现
2017/07/12 Javascript
LayUI表格批量删除方法
2018/08/15 Javascript
3分钟了解vue数据劫持的原理实现
2019/05/01 Javascript
[46:43]DOTA2上海特级锦标赛D组小组赛#1 EG VS COL第三局
2016/02/28 DOTA
win10系统下Anaconda3安装配置方法图文教程
2018/09/19 Python
Python tkinter label 更新方法
2018/10/11 Python
python 搭建简单的http server,可直接post文件的实例
2019/01/03 Python
Python中的集合介绍
2019/01/28 Python
python异步存储数据详解
2019/03/19 Python
Opencv+Python实现图像运动模糊和高斯模糊的示例
2019/04/11 Python
PyQt5 实现给窗口设置背景图片的方法
2019/06/13 Python
python应用Axes3D绘图(批量梯度下降算法)
2020/03/25 Python
python db类用法说明
2020/07/07 Python
Python实现京东抢秒杀功能
2021/01/25 Python
python中openpyxl和xlsxwriter对Excel的操作方法
2021/03/01 Python
Html5监听手机摇一摇事件的实现
2019/11/07 HTML / CSS
新秀丽拉杆箱美国官方网站:Samsonite美国
2016/07/25 全球购物
车祸赔偿收入证明
2014/01/09 职场文书
预备党员政审材料
2014/02/04 职场文书
优秀管理者获奖感言
2014/02/17 职场文书
小学生推普周国旗下讲话稿
2014/09/21 职场文书
再婚婚前财产协议书范本
2014/10/19 职场文书
2014年销售员工作总结
2014/12/01 职场文书
汤姆索亚历险记读书笔记
2015/06/29 职场文书