pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
python简单判断序列是否为空的方法
Jun 30 Python
浅谈Python类的__getitem__和__setitem__特殊方法
Dec 25 Python
快速实现基于Python的微信聊天机器人示例代码
Mar 03 Python
numpy中实现二维数组按照某列、某行排序的方法
Apr 04 Python
对python numpy数组中冒号的使用方法详解
Apr 17 Python
Python返回数组/List长度的实例
Jun 23 Python
python dataframe向下向上填充,fillna和ffill的方法
Nov 28 Python
如何在django里上传csv文件并进行入库处理的方法
Jan 02 Python
Python开发网站目录扫描器的实现
Feb 21 Python
pytorch实现Tensor变量之间的转换
Feb 17 Python
Python自动化办公Excel模块openpyxl原理及用法解析
Nov 05 Python
深入理解pytorch库的dockerfile
Jun 10 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
php5中date()得出的时间为什么不是当前时间的解决方法
2008/06/30 PHP
PHP无限分类代码,支持数组格式化、直接输出菜单两种方式
2011/05/18 PHP
php字符串过滤与替换小结
2015/01/26 PHP
PHP实现的json类实例
2015/07/28 PHP
php实现网站文件批量压缩下载功能
2015/10/28 PHP
php微信公众号开发(4)php实现自定义关键字回复
2016/12/15 PHP
PHP实现的mysql主从数据库状态检测功能示例
2017/07/20 PHP
php post json参数的传递和接收处理方法
2018/05/31 PHP
php 中self,this的区别和操作方法实例分析
2019/11/04 PHP
使用隐藏的new来创建对象
2011/03/29 Javascript
使用React实现轮播效果组件示例代码
2016/09/05 Javascript
各种选择框jQuery的选中方法(实例讲解)
2017/06/27 jQuery
jQuery实现动态添加节点与遍历节点功能示例
2017/11/09 jQuery
Vue动态组件与异步组件实例详解
2019/02/23 Javascript
[50:27]OG vs LGD 2018国际邀请赛淘汰赛BO3 第一场 8.26
2018/08/30 DOTA
跟老齐学Python之复习if语句
2014/10/02 Python
python检测某个变量是否有定义的方法
2015/05/20 Python
Python过滤列表用法实例分析
2016/04/29 Python
django DRF图片路径问题的解决方法
2018/09/10 Python
详解Python利用random生成一个列表内的随机数
2019/08/21 Python
手写一个python迭代器过程详解
2019/08/27 Python
python是否适合网页编程详解
2019/10/04 Python
Python栈的实现方法示例【列表、单链表】
2020/02/22 Python
PyTorch在Windows环境搭建的方法步骤
2020/05/12 Python
Python3.9.0 a1安装pygame出错解决全过程(小结)
2021/02/02 Python
AmazeUI 导航条的实现示例
2020/08/14 HTML / CSS
英国百年闻名的优质健康产品连锁店:Holland & Barrett
2019/12/19 全球购物
关于赌博的检讨书
2014/01/08 职场文书
幼儿园春游活动方案
2014/01/19 职场文书
比赛口号大全
2014/06/10 职场文书
工地宣传标语
2014/06/18 职场文书
党员批评与自我批评范文
2014/09/23 职场文书
省委召开党的群众路线教育实践活动总结大会报告
2014/10/21 职场文书
2016年艾滋病宣传活动总结
2016/04/01 职场文书
 Python 中 logging 模块使用详情
2022/03/03 Python
python如何利用cv2.rectangle()绘制矩形框
2022/12/24 Python