使用pandas读取csv文件的指定列方法


Posted in Python onApril 21, 2018

根据教程实现了读取csv文件前面的几行数据,一下就想到了是不是可以实现前面几列的数据。经过多番尝试总算试出来了一种方法。

之所以想实现读取前面的几列是因为我手头的一个csv文件恰好有后面几列没有可用数据,但是却一直存在着。原来的数据如下:

GreydeMac-mini:chapter06 greyzhang$ cat data.csv

1,name_01,coment_01,,,,
2,name_02,coment_02,,,,
3,name_03,coment_03,,,,
4,name_04,coment_04,,,,
5,name_05,coment_05,,,,
6,name_06,coment_06,,,,
7,name_07,coment_07,,,,
8,name_08,coment_08,,,,
9,name_09,coment_09,,,,
10,name_10,coment_10,,,,
11,name_11,coment_11,,,,
12,name_12,coment_12,,,,
13,name_13,coment_13,,,,
14,name_14,coment_14,,,,
15,name_15,coment_15,,,,
16,name_16,coment_16,,,,
17,name_17,coment_17,,,,
18,name_18,coment_18,,,,
19,name_19,coment_19,,,,
20,name_20,coment_20,,,,
21,name_21,coment_21,,,,

如果使用pandas读取出全部的数据,打印的时候会出现以下结果:

In [41]: data = pd.read_csv('data.csv')

In [42]: data
Out[42]: 
  1 name_01 coment_01 Unnamed: 3 Unnamed: 4 Unnamed: 5 Unnamed: 6
0 2 name_02 coment_02   NaN   NaN   NaN   NaN
1 3 name_03 coment_03   NaN   NaN   NaN   NaN
2 4 name_04 coment_04   NaN   NaN   NaN   NaN
3 5 name_05 coment_05   NaN   NaN   NaN   NaN
4 6 name_06 coment_06   NaN   NaN   NaN   NaN
5 7 name_07 coment_07   NaN   NaN   NaN   NaN
6 8 name_08 coment_08   NaN   NaN   NaN   NaN
7 9 name_09 coment_09   NaN   NaN   NaN   NaN
8 10 name_10 coment_10   NaN   NaN   NaN   NaN
9 11 name_11 coment_11   NaN   NaN   NaN   NaN
10 12 name_12 coment_12   NaN   NaN   NaN   NaN
11 13 name_13 coment_13   NaN   NaN   NaN   NaN
12 14 name_14 coment_14   NaN   NaN   NaN   NaN
13 15 name_15 coment_15   NaN   NaN   NaN   NaN
14 16 name_16 coment_16   NaN   NaN   NaN   NaN
15 17 name_17 coment_17   NaN   NaN   NaN   NaN
16 18 name_18 coment_18   NaN   NaN   NaN   NaN
17 19 name_19 coment_19   NaN   NaN   NaN   NaN
18 20 name_20 coment_20   NaN   NaN   NaN   NaN
19 21 name_21 coment_21   NaN   NaN   NaN   NaN

所说在学习的过程中这并不会给我带来什么障碍,但是在命令行终端界面呆久了总喜欢稍微清爽一点的风格。使用read_csv的参数usecols能够在一定程度上减少这种混乱感。

In [45]: data = pd.read_csv('data.csv',usecols=[0,1,2,3])

In [46]: data
Out[46]: 
  1 name_01 coment_01 Unnamed: 3
0 2 name_02 coment_02   NaN
1 3 name_03 coment_03   NaN
2 4 name_04 coment_04   NaN
3 5 name_05 coment_05   NaN
4 6 name_06 coment_06   NaN
5 7 name_07 coment_07   NaN
6 8 name_08 coment_08   NaN
7 9 name_09 coment_09   NaN
8 10 name_10 coment_10   NaN
9 11 name_11 coment_11   NaN
10 12 name_12 coment_12   NaN
11 13 name_13 coment_13   NaN
12 14 name_14 coment_14   NaN
13 15 name_15 coment_15   NaN
14 16 name_16 coment_16   NaN
15 17 name_17 coment_17   NaN
16 18 name_18 coment_18   NaN
17 19 name_19 coment_19   NaN
18 20 name_20 coment_20   NaN
19 21 name_21 coment_21   NaN

为了能够看到数据的“边界”,读取的时候显示了第一列无效的数据。正常的使用中,或许我们是想连上面结果中最后一列的信息也去掉的,那只需要在参数重去掉最后一列的列号。

In [47]: data = pd.read_csv('data.csv',usecols=[0,1,2])

In [48]: data
Out[48]: 
  1 name_01 coment_01
0 2 name_02 coment_02
1 3 name_03 coment_03
2 4 name_04 coment_04
3 5 name_05 coment_05
4 6 name_06 coment_06
5 7 name_07 coment_07
6 8 name_08 coment_08
7 9 name_09 coment_09
8 10 name_10 coment_10
9 11 name_11 coment_11
10 12 name_12 coment_12
11 13 name_13 coment_13
12 14 name_14 coment_14
13 15 name_15 coment_15
14 16 name_16 coment_16
15 17 name_17 coment_17
16 18 name_18 coment_18
17 19 name_19 coment_19
18 20 name_20 coment_20
19 21 name_21 coment_21

以上这篇使用pandas读取csv文件的指定列方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python多线程threading.Lock锁用法实例
Nov 01 Python
python的else子句使用指南
Feb 27 Python
python实现决策树、随机森林的简单原理
Mar 26 Python
Python实现的简单计算器功能详解
Aug 25 Python
对Python 窗体(tkinter)文本编辑器(Text)详解
Oct 11 Python
使用python serial 获取所有的串口名称的实例
Jul 02 Python
Python Flask上下文管理机制实例解析
Mar 16 Python
python多线程实现同时执行两个while循环的操作
May 02 Python
Django使用Profile扩展User模块方式
May 14 Python
Python图像处理二值化方法实例汇总
Jul 24 Python
Django创建一个后台的基本步骤记录
Oct 02 Python
微信小程序调用python模型
Apr 21 Python
Python 3.7新功能之dataclass装饰器详解
Apr 21 #Python
pandas or sql计算前后两行数据间的增值方法
Apr 20 #Python
对pandas进行数据预处理的实例讲解
Apr 20 #Python
pandas 两列时间相减换算为秒的方法
Apr 20 #Python
详谈pandas中agg函数和apply函数的区别
Apr 20 #Python
Python使用pip安装pySerial串口通讯模块
Apr 20 #Python
pandas apply 函数 实现多进程的示例讲解
Apr 20 #Python
You might like
PHP学习之输出字符串(echo,print,printf,print_r和var_dump)
2011/04/17 PHP
php判断正常访问和外部访问的示例
2014/02/10 PHP
php检测apache mod_rewrite模块是否安装的方法
2015/03/14 PHP
php微信公众号开发(4)php实现自定义关键字回复
2016/12/15 PHP
JavaScript中的集合及效率
2010/01/08 Javascript
读jQuery之八 包装事件对象
2011/06/21 Javascript
jquery $.each()使用探讨
2013/09/23 Javascript
window.location.href中url中数据量太大时的解决方法
2013/12/23 Javascript
jquery处理json对象
2014/11/03 Javascript
JavaScript事件 "事件对象"的注意要点
2016/01/14 Javascript
详解在Javascript中进行面向切面编程
2019/04/28 Javascript
wxPython事件驱动实例详解
2014/09/28 Python
python编写弹球游戏的实现代码
2018/03/12 Python
python3+PyQt5重新实现自定义数据拖放处理
2018/04/19 Python
Python使用sort和class实现的多级排序功能示例
2018/08/15 Python
Python读取Excel表格,并同时画折线图和柱状图的方法
2018/10/14 Python
Python SMTP发送邮件遇到的一些问题及解决办法
2018/10/24 Python
基于Python对数据shape的常见操作详解
2018/12/25 Python
PyTorch中Tensor的维度变换实现
2019/08/18 Python
Django之编辑时根据条件跳转回原页面的方法
2019/08/21 Python
Python关键字及可变参数*args,**kw原理解析
2020/04/04 Python
python opencv实现直线检测并测出倾斜角度(附源码+注释)
2020/12/31 Python
python上下文管理的使用场景实例讲解
2021/03/03 Python
大学毕业生自我鉴定
2013/11/05 职场文书
教师自我评价范文
2013/12/16 职场文书
财务会计毕业生个人求职信
2014/02/03 职场文书
房地产推广策划方案
2014/05/19 职场文书
高三励志标语
2014/06/05 职场文书
工厂仓管员岗位职责范本
2014/07/17 职场文书
小学生国庆65周年演讲稿范文(2篇)
2014/09/21 职场文书
党的群众路线教育实践活动个人整改措施范文
2014/11/04 职场文书
毕业生个人总结
2015/02/28 职场文书
2015年司机年终工作总结
2015/05/14 职场文书
nginx+lua单机上万并发的实现
2021/05/31 Servers
Python+Matplotlib+LaTeX玩转数学公式
2022/02/24 Python
SQL Server表分区降低运维和维护成本
2022/04/08 SQL Server