使用pandas读取csv文件的指定列方法


Posted in Python onApril 21, 2018

根据教程实现了读取csv文件前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。

之所以想实现读取前面的几列是因为我手头的一个csv文件恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:

GreydeMac-mini:chapter06 greyzhang$ cat data.csv

1,name_01,coment_01,,,,
2,name_02,coment_02,,,,
3,name_03,coment_03,,,,
4,name_04,coment_04,,,,
5,name_05,coment_05,,,,
6,name_06,coment_06,,,,
7,name_07,coment_07,,,,
8,name_08,coment_08,,,,
9,name_09,coment_09,,,,
10,name_10,coment_10,,,,
11,name_11,coment_11,,,,
12,name_12,coment_12,,,,
13,name_13,coment_13,,,,
14,name_14,coment_14,,,,
15,name_15,coment_15,,,,
16,name_16,coment_16,,,,
17,name_17,coment_17,,,,
18,name_18,coment_18,,,,
19,name_19,coment_19,,,,
20,name_20,coment_20,,,,
21,name_21,coment_21,,,,

如果使用pandas读取出全部的数据,打印的时候会出现以下结果:

In [41]: data = pd.read_csv('data.csv')

In [42]: data
Out[42]: 
  1 name_01 coment_01 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6
0 2 name_02 coment_02   NaN   NaN   NaN   NaN
1 3 name_03 coment_03   NaN   NaN   NaN   NaN
2 4 name_04 coment_04   NaN   NaN   NaN   NaN
3 5 name_05 coment_05   NaN   NaN   NaN   NaN
4 6 name_06 coment_06   NaN   NaN   NaN   NaN
5 7 name_07 coment_07   NaN   NaN   NaN   NaN
6 8 name_08 coment_08   NaN   NaN   NaN   NaN
7 9 name_09 coment_09   NaN   NaN   NaN   NaN
8 10 name_10 coment_10   NaN   NaN   NaN   NaN
9 11 name_11 coment_11   NaN   NaN   NaN   NaN
10 12 name_12 coment_12   NaN   NaN   NaN   NaN
11 13 name_13 coment_13   NaN   NaN   NaN   NaN
12 14 name_14 coment_14   NaN   NaN   NaN   NaN
13 15 name_15 coment_15   NaN   NaN   NaN   NaN
14 16 name_16 coment_16   NaN   NaN   NaN   NaN
15 17 name_17 coment_17   NaN   NaN   NaN   NaN
16 18 name_18 coment_18   NaN   NaN   NaN   NaN
17 19 name_19 coment_19   NaN   NaN   NaN   NaN
18 20 name_20 coment_20   NaN   NaN   NaN   NaN
19 21 name_21 coment_21   NaN   NaN   NaN   NaN

所说在学习的过程中这并不会给我带来什么障碍,但是在命令行终端界面呆久了总喜欢稍微清爽一点的风格。使用read_csv的参数usecols能够在一定程度上减少这种混乱感。

In [45]: data = pd.read_csv('data.csv',usecols=[0,1,2,3])

In [46]: data
Out[46]: 
  1 name_01 coment_01 Unnamed: 3
0 2 name_02 coment_02   NaN
1 3 name_03 coment_03   NaN
2 4 name_04 coment_04   NaN
3 5 name_05 coment_05   NaN
4 6 name_06 coment_06   NaN
5 7 name_07 coment_07   NaN
6 8 name_08 coment_08   NaN
7 9 name_09 coment_09   NaN
8 10 name_10 coment_10   NaN
9 11 name_11 coment_11   NaN
10 12 name_12 coment_12   NaN
11 13 name_13 coment_13   NaN
12 14 name_14 coment_14   NaN
13 15 name_15 coment_15   NaN
14 16 name_16 coment_16   NaN
15 17 name_17 coment_17   NaN
16 18 name_18 coment_18   NaN
17 19 name_19 coment_19   NaN
18 20 name_20 coment_20   NaN
19 21 name_21 coment_21   NaN

为了能够看到数据的“边界”,读取的时候显示了第一列无效的数据。正常的使用中,或许我们是想连上面结果中最后一列的信息也去掉的,那只需要在参数重去掉最后一列的列号。

In [47]: data = pd.read_csv('data.csv',usecols=[0,1,2])

In [48]: data
Out[48]: 
  1 name_01 coment_01
0 2 name_02 coment_02
1 3 name_03 coment_03
2 4 name_04 coment_04
3 5 name_05 coment_05
4 6 name_06 coment_06
5 7 name_07 coment_07
6 8 name_08 coment_08
7 9 name_09 coment_09
8 10 name_10 coment_10
9 11 name_11 coment_11
10 12 name_12 coment_12
11 13 name_13 coment_13
12 14 name_14 coment_14
13 15 name_15 coment_15
14 16 name_16 coment_16
15 17 name_17 coment_17
16 18 name_18 coment_18
17 19 name_19 coment_19
18 20 name_20 coment_20
19 21 name_21 coment_21

以上这篇使用pandas读取csv文件的指定列方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
整理Python中的赋值运算符
May 13 Python
5款非常棒的Python工具
Jan 05 Python
python使用tcp实现局域网内文件传输
Mar 20 Python
WIn10+Anaconda环境下安装PyTorch(避坑指南)
Jan 30 Python
python3.6使用tkinter实现弹跳小球游戏
May 09 Python
详解Python 多线程 Timer定时器/延迟执行、Event事件
Jun 27 Python
详解Python二维数组与三维数组切片的方法
Jul 18 Python
WxPython实现无边框界面
Nov 18 Python
PyCharm MySQL可视化Database配置过程图解
Jun 09 Python
Java如何基于wsimport调用wcf接口
Jun 17 Python
python生成随机数、随机字符、随机字符串
Apr 06 Python
pytorch 使用半精度模型部署的操作
May 24 Python
Python 3.7新功能之dataclass装饰器详解
Apr 21 #Python
pandas or sql计算前后两行数据间的增值方法
Apr 20 #Python
对pandas进行数据预处理的实例讲解
Apr 20 #Python
pandas 两列时间相减换算为秒的方法
Apr 20 #Python
详谈pandas中agg函数和apply函数的区别
Apr 20 #Python
Python使用pip安装pySerial串口通讯模块
Apr 20 #Python
pandas apply 函数 实现多进程的示例讲解
Apr 20 #Python
You might like
PHP PDOStatement::getColumnMeta讲解
2019/02/01 PHP
PHP chop()函数讲解
2019/02/11 PHP
PHP7原生MySQL数据库操作实现代码
2020/07/03 PHP
非常有用的40款jQuery 插件推荐(系列二)
2011/12/25 Javascript
精心挑选的15个jQuery下拉菜单制作教程
2012/06/15 Javascript
js判断上传文件的类型和大小示例代码
2013/10/18 Javascript
JavaScript禁止页面操作的示例代码
2013/12/17 Javascript
网页实时显示服务器时间和javscript自运行时钟
2014/06/09 Javascript
JavaScript设计模式之观察者模式(发布者-订阅者模式)
2014/09/24 Javascript
JQuery限制复选框checkbox可选中个数的方法
2015/04/20 Javascript
js实现带有介绍的Select列表菜单实例
2015/08/18 Javascript
详解JavaScript中双等号引起的隐性类型转换
2016/05/30 Javascript
js从外部获取图片的实现方法
2016/08/05 Javascript
微信小程序 Record API详解及实例代码
2016/09/30 Javascript
浅谈js算法和流程控制
2016/12/29 Javascript
jquery实现简单实用的轮播器
2017/05/23 jQuery
CSS3结合jQuery实现动画效果及回调函数的实例
2017/12/27 jQuery
ReactNative实现Toast的示例
2017/12/31 Javascript
vue 表单输入格式化中文输入法异常问题
2018/05/30 Javascript
JavaScript模板引擎应用场景及实现原理详解
2018/12/14 Javascript
vue.js 2.*项目环境搭建、运行、打包发布的详细步骤
2019/05/01 Javascript
Python 文件操作技巧(File operation) 实例代码分析
2008/08/11 Python
python统计日志ip访问数的方法
2015/07/06 Python
python中安装模块包版本冲突问题的解决
2017/05/02 Python
Python实现读写INI配置文件的方法示例
2018/06/09 Python
Python叠加矩形框图层2种方法及效果
2020/06/18 Python
python实现按日期归档文件
2021/01/30 Python
捷克购买家具网站:JENA nábytek
2020/03/19 全球购物
搞笑的爱情检讨书
2014/10/01 职场文书
幸福家庭事迹材料
2014/12/20 职场文书
2015年综治宣传月活动总结
2015/03/25 职场文书
团委工作总结2015
2015/04/02 职场文书
2016党员党课心得体会
2016/01/07 职场文书
Springboot使用Spring Data JPA实现数据库操作
2021/06/30 Java/Android
教你利用Nginx 服务搭建子域环境提升二维地图加载性能的步骤
2021/09/25 Servers
python和anaconda的区别
2022/05/06 Python