pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
使用Python的Twisted框架编写简单的网络客户端
Apr 16 Python
python检查字符串是否是正确ISBN的方法
Jul 11 Python
Django实现的自定义访问日志模块示例
Jun 23 Python
Python之Scrapy爬虫框架安装及简单使用详解
Dec 22 Python
Python设计模式之MVC模式简单示例
Jan 10 Python
Python 判断 有向图 是否有环的实例讲解
Feb 01 Python
Python把对应格式的csv文件转换成字典类型存储脚本的方法
Feb 12 Python
Python Numpy 实现交换两行和两列的方法
Jun 26 Python
Python参数类型以及常见的坑详解
Jul 08 Python
Python time库基本使用方法分析
Dec 13 Python
python3 实现口罩抽签的功能
Mar 11 Python
Python Matplotlib绘图基础知识代码解析
Aug 31 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
PHP去除字符串最后一个字符的三种方法实例
2017/03/01 PHP
laravel按天、按小时,查询数据的实例
2019/10/09 PHP
JavaScript中的类继承
2010/11/25 Javascript
jQuery写的日历(包括日历的样式及功能)
2013/04/23 Javascript
js实现鼠标感应图片展示的方法
2015/02/27 Javascript
jquery中表单 多选框的一种巧妙写法
2015/09/06 Javascript
javascript的列表切换【实现代码】
2016/05/03 Javascript
JavaScript实现复制或剪切内容到剪贴板功能的方法
2016/05/23 Javascript
仿百度换肤功能的简单实例代码
2016/07/11 Javascript
AngularJS中的拦截器实例详解
2017/04/07 Javascript
Vue中引入样式文件的方法
2017/08/18 Javascript
JQuery判断正整数整理小结
2017/08/21 jQuery
JavaScript中如何判断一个值的类型
2017/09/15 Javascript
简单的Vue SSR的示例代码
2018/01/12 Javascript
微信小程序 wxParse插件显示视频问题
2019/09/27 Javascript
简单了解Vue + ElementUI后台管理模板
2020/04/07 Javascript
jQuery开发仿QQ版音乐播放器
2020/07/10 jQuery
简介JavaScript错误处理机制
2020/08/04 Javascript
jQuery插件实现图片轮播效果
2020/10/19 jQuery
[02:28]DOTA2英雄基础教程 狼人
2013/12/23 DOTA
使用Python的PEAK来适配协议的教程
2015/04/14 Python
详解Python函数作用域的LEGB顺序
2016/05/14 Python
python在新的图片窗口显示图片(图像)的方法
2019/07/11 Python
Python netmiko模块的使用
2020/02/14 Python
python实现最速下降法
2020/03/24 Python
matplotlib自定义鼠标光标坐标格式的实现
2021/01/08 Python
CSS3 实现倒计时效果
2020/11/25 HTML / CSS
改变生活的男士内衣:SAXX Underwear
2019/08/28 全球购物
苏格兰领先的多渠道鞋店:Begg Shoes
2019/10/22 全球购物
国际商务专业学生个人的自我评价
2013/09/28 职场文书
高一数学教学反思
2014/02/07 职场文书
党员活动日总结
2014/05/05 职场文书
个人学习群众路线心得体会
2014/11/05 职场文书
2015年学校安全管理工作总结
2015/05/11 职场文书
Redis特殊数据类型HyperLogLog基数统计算法讲解
2022/06/01 Redis
Windows Server 2012 R2服务器安装与配置的完整步骤
2022/07/15 Servers