pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
python实现rest请求api示例
Apr 22 Python
python从网络读取图片并直接进行处理的方法
May 22 Python
使用apidocJs快速生成在线文档的实例讲解
Feb 07 Python
在python3.5中使用OpenCV的实例讲解
Apr 02 Python
数组保存为txt, npy, csv 文件, 数组遍历enumerate的方法
Jul 09 Python
对python中的six.moves模块的下载函数urlretrieve详解
Dec 19 Python
PySide和PyQt加载ui文件的两种方法
Feb 27 Python
Python循环结构的应用场景详解
Jul 11 Python
详解字符串在Python内部是如何省内存的
Feb 03 Python
Python实现实时数据采集新型冠状病毒数据实例
Feb 04 Python
Python网页解析器使用实例详解
May 30 Python
keras.utils.to_categorical和one hot格式解析
Jul 02 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
星际争霸 Starcraft 秘技补丁
2020/03/14 星际争霸
phpBB BBcode处理的漏洞
2006/10/09 PHP
php blowfish加密解密算法
2016/07/02 PHP
文本框水印提示效果的简单实现代码
2014/02/22 Javascript
js给网页加上背景音乐及选择音效的方法
2015/03/03 Javascript
浅谈下拉菜单中的Option对象
2015/05/10 Javascript
分享我的jquery实现下拉菜单心的
2015/11/29 Javascript
JavaScript实现显示函数调用堆栈的方法
2016/04/21 Javascript
jQuery获取attr()与prop()属性值的方法及区别介绍
2016/07/06 Javascript
JavaScript 继承详解(六)
2016/10/11 Javascript
JSON 数据详解及实例代码分析
2017/01/20 Javascript
jQuery Validate 相关参数及常用的自定义验证规则
2017/03/06 Javascript
Vuejs仿网易云音乐实现听歌及搜索功能
2017/03/30 Javascript
JS+CSS实现网页加载中的动画效果
2017/10/27 Javascript
jquery ztree实现右键收藏功能
2017/11/20 jQuery
在vue项目创建的后初始化首次使用stylus安装方法分享
2018/01/25 Javascript
微信小程序实现tab页面切换功能
2018/07/13 Javascript
JS函数节流和防抖之间的区分和实现详解
2019/01/11 Javascript
layui表格分页 记录勾选的实例
2019/09/02 Javascript
python实现备份目录的方法
2015/08/03 Python
Python3操作SQL Server数据库(实例讲解)
2017/10/21 Python
centos7之Python3.74安装教程
2019/08/15 Python
python实现批量文件重命名
2019/10/31 Python
Python中的四种交换数值的方法解析
2019/11/18 Python
python读取mysql数据绘制条形图
2020/03/25 Python
基于Keras的格式化输出Loss实现方式
2020/06/17 Python
幼儿园教师备课制度
2014/01/12 职场文书
《小池塘》教学反思
2014/02/28 职场文书
规划编制实施方案
2014/03/15 职场文书
学习党的群众路线教育实践活动剖析材料
2014/10/13 职场文书
2014年行政执法工作总结
2014/12/11 职场文书
上班迟到检讨书范文
2015/05/06 职场文书
2019关于实习生工作安排及待遇的管理方案!
2019/07/16 职场文书
Spring boot应用启动后首次访问很慢的解决方案
2021/06/23 Java/Android
python脚本框架webpy的url映射详解
2021/11/20 Python
pt-archiver 主键自增
2022/04/26 MySQL