利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)


Posted in Python onSeptember 04, 2020

前言

做数据分析的时候通常我们并不是对真个excel文件进行操作,换言之,每一列都是一个特征,我们需要针对分析。遇到这类问题的时候,我们通常想得到一列中所有符合条件的数据,挑出来,然后组成一个单独的文件进行分析。比如一列中我们希望找到所有大于100的所有行,又比如 我们希望得到一列中包含某个特定字母的所有行,那么我们应该怎么办呢,这里就说一下。

在这之前我们先介绍一个pandas里面一个函数 loc()

英文解释是这样的:Purely label-location based indexer for selection by label.

               .loc[] is primarily label based, but may also be used with a boolean array.

最通俗的讲就是标签索引器

了解了这个函数(具体用法下面两个例子就可以懂),我们可两个例子 就可以选择我们想要的行了

利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)

问题一:我们想要“behavior_type”列中所有为3或4的行

import pandas as pd
import numpy as np

import csv

for df in pd.read_csv(open(r'C:\Users\yang\Desktop\useer.csv','r'),chunksize=10000): 
 print(df.loc[df['behavior_type']>1,:])

从这个程序我们可以得出 .loc() 前面是我们的整个索引目标,括号中为索引标签(我们回到loc英文解释第二局话,可以索引布尔型) ,那么这么简单一句话就可以把所以为3,4的行输出了.后面的冒号代表从开始到最后索引

print(df.loc[df['behavior_type'].isin([3,4]),:])

注意 这里的isin([ ])有小括号 也有中括号集合的形式。

我们也可以利用isin代替大于号性质是一样的,该标签下所有为3,4的集合的布尔型 然后再索引

print(df[df['behavior_type'].isin([3,4])])

提到isin 我们想到了一个更为简单的方法,直接索引即可

问题一:我们想要“user_geohash”列中所有含有字母‘qo'的行

print(df.loc[df['user_geohash'].str.contains('qo')])

是不是已经想到了 利用loc就可以了,只要后面加上字符串str.contains()函数即可。

那么到这里所有的问题迎刃而解,那么我们想要索取特定行呢 我们想要索取特定列呢

没问题 让我们继续深入了解loc函数

df是一个dataframe,列名为A B C D

具体值如下:

A    B    C     D
0    ss   小红  8
1    aa   小明  d
4    f          f
6    ak   小紫  7

dataframe里的属性是不定的,空值默认为NA。

一、选取标签为A和C的列,并且选完类型还是dataframe

df = df.loc[:, ['A', 'C']]
df = df.iloc[:, [0, 2]]

二、选取标签为C并且只取前两行,选完类型还是dataframe

df = df.loc[0:2, ['A', 'C']] 
df = df.iloc[0:2, [0, 2]]

聪明的你发现loc的用法了吗?

总结

到此这篇关于利用python3筛选excel中特定的行(行值满足某个条件/行值属于某个集合)的文章就介绍到这了,更多相关python3筛选excel特定的行内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 编码处理-str与Unicode的区别
Sep 06 Python
python 数据清洗之数据合并、转换、过滤、排序
Feb 12 Python
Python微信库:itchat的用法详解
Aug 14 Python
python逆向入门教程
Jan 15 Python
python实现人人自动回复、抢沙发功能
Jun 08 Python
Python之lambda匿名函数及map和filter的用法
Mar 05 Python
Django的性能优化实现解析
Jul 30 Python
python快速排序的实现及运行时间比较
Nov 22 Python
浅谈python之自动化运维(Paramiko)
Jan 31 Python
python绘制玫瑰的实现代码
Mar 02 Python
如何判断pytorch是否支持GPU加速
Jun 01 Python
Python 数据可视化之Matplotlib详解
Nov 02 Python
Python读取Excel一列并计算所有对象出现次数的方法
Sep 04 #Python
学习Python需要哪些工具
Sep 04 #Python
详解python tkinter包获取本地绝对路径(以获取图片并展示)
Sep 04 #Python
Python程序慢的重要原因
Sep 04 #Python
利用Python实现朋友圈中的九宫格图片效果
Sep 03 #Python
详解pytorch中squeeze()和unsqueeze()函数介绍
Sep 03 #Python
Django实现微信小程序支付的示例代码
Sep 03 #Python
You might like
一个php作的文本留言本的例子(四)
2006/10/09 PHP
让你同时上传 1000 个文件 (二)
2006/10/09 PHP
附件名前加网站名
2008/03/23 PHP
对淘宝URL中ID提取的PHP代码
2013/09/01 PHP
php循环创建目录示例分享(php创建多级目录)
2014/03/04 PHP
PHP中使用数组指针函数操作数组示例
2014/11/19 PHP
PHP文件上传问题汇总(文件大小检测、大文件上传处理)
2015/12/24 PHP
ThinkPHP实现分页功能
2017/04/28 PHP
js chrome浏览器判断代码
2010/03/28 Javascript
javascript中怎么做对象的类型判断
2013/11/11 Javascript
详谈JavaScript 匿名函数及闭包
2014/11/14 Javascript
node.js中的fs.realpath方法使用说明
2014/12/16 Javascript
原生JS实现拖拽图片效果
2020/08/27 Javascript
nodeJS模块简单用法示例
2018/04/21 NodeJs
JavaScript设计模式之构造函数模式实例教程
2018/07/02 Javascript
vue interceptor 使用教程实例详解
2018/09/13 Javascript
纯javascript实现选择框的全选与反选功能
2019/04/08 Javascript
JavaScript实现选项卡效果的分析及步骤
2019/04/16 Javascript
Vue.js@2.6.10更新内置错误处机制Fundebug同步支持相应错误监控
2019/05/13 Javascript
vue-cli4.x创建企业级项目的方法步骤
2020/06/18 Javascript
在Linux系统上通过uWSGI配置Nginx+Python环境的教程
2015/12/25 Python
Django查询数据库的性能优化示例代码
2017/09/24 Python
python tkinter图形界面代码统计工具(更新)
2019/09/18 Python
wxPython实现列表增删改查功能
2019/11/19 Python
Python tkinter实现图片标注功能(完整代码)
2019/12/08 Python
pycharm无法导入本地模块的解决方式
2020/02/12 Python
Python 在函数上添加包装器
2020/07/28 Python
Python实现PS滤镜中的USM锐化效果
2020/12/04 Python
Pandas直接读取sql脚本的方法
2021/01/21 Python
Speedo速比涛德国官方网站:世界领先的泳装品牌
2019/08/26 全球购物
Oracle性能调优原则
2012/05/03 面试题
群众路线对照检查材料
2014/09/22 职场文书
群众路线个人自我剖析材料
2014/10/07 职场文书
《角的初步认识》教学反思
2016/02/17 职场文书
2019年度行政文员工作计划范本!
2019/07/04 职场文书
Win11使用CAD卡顿或者致命错误怎么办?Win11无法正常使用CAD的解决方法
2022/07/23 数码科技