使用pandas库对csv文件进行筛选保存


Posted in Python onMay 25, 2020

这个操作现在看来真没啥难的,但是我找相关的资料真的找了好久。

多数大佬都是直接pandas官网甩我脸上,然后举一个入门级的例子。

https://pandas.pydata.org/docs/reference/index.html

首先导入pandas库

import pandas as pd

然后使用read_csv来打开指定的csv文件

df = pd.read_csv('./IP2LOCATION.csv',encoding= 'utf-8')

这个函数里面需要写入csv文件的路径,如果是把csv文件保存到了python的工程文件夹下,则只需要./文件名即可,然后encoding='utf-8'是使用utf-8方式编码,有时候需要换成gbk。

虽然我们读取的是csv文件,但其实由于我们使用的是pandas库,所以我们实际获得的是一个DataFrame的数据结构。

可以使用print(type(df))进行检验

print(type(df))

使用pandas库对csv文件进行筛选保存

DataFrame 是表格型的数据结构。因此,我们可以将其当做表格。DataFrame 是以表格类似展示,而且还包含行标签、列标签。

我们可以添加一个列标签,使用方法为pandas.DataFrame.columns

在我们的例子中DataFrame类型的变量为df,因此使用方法为df.columns,我们添加的列标签为a、b、c、d、e、f

df.columns = ['a','b','c','d','e','f']

然后,我们想把某一列中等于特定值的那些行提取出来

可以将读出来的内容当做一个列表,然后这个列表的元素是表中的每一行,然后这每一行也是一个列表,也就是列表中的列表。

比如,我想将表中第5列中值为Andhra Pradesh的行提取出来,并且由于我们之前定义了第五列的列标签为e

因此代码为:

data = df[df['e'] == 'Andhra Pradesh']

最后我们可以通过pandas中的to_csv,来将筛选出来的数据保存到新的csv文件中。

data.to_csv('my_IP2LOCATION.csv')

用法为表名.to_csv('所要保存地方的路径/表名.csv')

最后总结一下我们的代码

import pandas as pd

df = pd.read_csv('./IP2LOCATION.csv',encoding= 'utf-8')
# print(type(df))
df.columns = ['a','b','c','d','e','f']
data = df[df['e'] == 'Andhra Pradesh']
data.to_csv('my_IP2LOCATION.csv')

IP2LOCATION.csv内容如下:

使用pandas库对csv文件进行筛选保存

总共有759727行

然后经过我们的筛选后的my_IP2LOCATION.csv

使用pandas库对csv文件进行筛选保存

只有3461行

PS:可以使用print(len(df.values))来查看行数

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python集合用法实例分析
May 30 Python
Linux下通过python访问MySQL、Oracle、SQL Server数据库的方法
Apr 23 Python
Python实现嵌套列表及字典并按某一元素去重复功能示例
Nov 30 Python
python 中字典嵌套列表的方法
Jul 03 Python
Windows下Python3.6安装第三方模块的方法
Nov 22 Python
python调用百度地图WEB服务API获取地点对应坐标值
Jan 16 Python
Python 绘制酷炫的三维图步骤详解
Jul 12 Python
python编写微信公众号首图思路详解
Dec 13 Python
python 计算概率密度、累计分布、逆函数的例子
Feb 25 Python
keras Lambda自定义层实现数据的切片方式,Lambda传参数
Jun 11 Python
如何把python项目部署到linux服务器
Aug 26 Python
python中的random模块和相关函数详解
Apr 22 Python
pytorch中 gpu与gpu、gpu与cpu 在load时相互转化操作
May 25 #Python
基于pandas向csv添加新的行和列
May 25 #Python
Python如何把十进制数转换成ip地址
May 25 #Python
tensorflow模型转ncnn的操作方式
May 25 #Python
MxNet预训练模型到Pytorch模型的转换方式
May 25 #Python
浅谈pytorch 模型 .pt, .pth, .pkl的区别及模型保存方式
May 25 #Python
Pytorch通过保存为ONNX模型转TensorRT5的实现
May 25 #Python
You might like
德生S2000电路分析
2021/03/02 无线电
从零开始学YII2框架(一)通过Composer安装Yii2框架
2014/08/20 PHP
php 后端实现JWT认证方法示例
2018/09/04 PHP
Laravel5.0+框架邮件发送功能实现方法图文与实例详解
2019/04/23 PHP
Javascript面向对象之四 继承
2011/02/08 Javascript
js 获取计算后的样式写法及注意事项
2013/02/25 Javascript
IE浏览器不支持getElementsByClassName的解决方法
2014/08/27 Javascript
jQuery实现跟随鼠标运动图层效果的方法
2015/02/02 Javascript
浅谈JavaScript中的作用域和闭包问题
2015/07/07 Javascript
vue loadmore 组件滑动加载更多源码解析
2017/07/19 Javascript
jQuery实现的简单手风琴效果示例
2018/08/29 jQuery
Node.js Buffer模块功能及常用方法实例分析
2019/01/05 Javascript
深入理解 JS 垃圾回收
2019/06/03 Javascript
js实现直播点击飘心效果
2020/08/19 Javascript
Python中的迭代器漫谈
2015/02/03 Python
Python类的定义、继承及类对象使用方法简明教程
2015/05/08 Python
Python基于PycURL实现POST的方法
2015/07/25 Python
深入剖析Python的爬虫框架Scrapy的结构与运作流程
2016/01/20 Python
python中json格式数据输出的简单实现方法
2016/10/31 Python
Python编程实现两个文件夹里文件的对比功能示例【包含内容的对比】
2017/06/20 Python
Python中关键字global和nonlocal的区别详解
2018/09/03 Python
Python实现针对json中某个关键字段进行排序操作示例
2018/12/25 Python
Django对models里的objects的使用详解
2019/08/17 Python
通过 Django Pagination 实现简单分页功能
2019/11/11 Python
Pytorch 多维数组运算过程的索引处理方式
2019/12/27 Python
tensorflow模型的save与restore,及checkpoint中读取变量方式
2020/05/26 Python
python获取命令行参数实例方法讲解
2020/11/02 Python
如何用用Python将地址标记在地图上
2021/02/07 Python
购买澳大利亚最好的服装和内衣在线:BONDS
2016/10/14 全球购物
英国网上电器商店:Electricshop
2020/03/15 全球购物
C#公司笔试题
2014/03/28 面试题
新闻学专业个人求职信写作
2014/02/04 职场文书
最经典的商业地产项目广告词
2014/03/13 职场文书
《回乡偶书》教学反思
2014/04/12 职场文书
志愿者爱心公益活动策划方案
2014/09/15 职场文书
利用Python多线程实现图片下载器
2022/03/25 Python