pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
Python实现将xml导入至excel
Nov 20 Python
python编写微信远程控制电脑的程序
Jan 05 Python
Python实现PS图像抽象画风效果的方法
Jan 23 Python
Python爬虫抓取技术的一些经验
Jul 12 Python
Django 反向生成url实例详解
Jul 30 Python
Django文件存储 默认存储系统解析
Aug 02 Python
Tensorflow: 从checkpoint文件中读取tensor方式
Feb 10 Python
pytorch 中的重要模块化接口nn.Module的使用
Apr 02 Python
使用Python防止SQL注入攻击的实现示例
May 21 Python
python如何更新包
Jun 11 Python
浅谈keras使用中val_acc和acc值不同步的思考
Jun 18 Python
Python基础之条件语句详解
Jun 16 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
windows环境下php配置memcache的具体操作步骤
2013/06/09 PHP
Laravel自定义 封装便捷返回Json数据格式的引用方法
2019/09/29 PHP
JavaScript基本概念初级讲解论坛贴的学习记录
2009/02/22 Javascript
使用jQuery向asp.net Mvc传递复杂json数据-ModelBinder篇
2010/05/07 Javascript
asp.net下使用jquery 的ajax+WebService+json 实现无刷新取后台值的实现代码
2010/09/19 Javascript
javascript算法学习(直接插入排序)
2011/04/12 Javascript
JS删除数组元素的函数介绍
2013/03/27 Javascript
JavaScript获取FCK编辑器信息的具体方法
2013/07/12 Javascript
js实现浏览器的各种菜单命令比如打印、查看源文件等等
2013/10/24 Javascript
js/jquery获取文本框输入焦点的方法
2014/03/04 Javascript
JavaScript实现cookie的写入、读取、删除功能
2015/11/05 Javascript
js中substr,substring,indexOf,lastIndexOf,split,replace的用法详解
2015/11/09 Javascript
javascript插件开发的一些感想和心得
2016/02/28 Javascript
jQuery EasyUI框架中的Datagrid数据表格组件结构详解
2016/06/09 Javascript
第一次接触神奇的Bootstrap网格系统
2016/07/27 Javascript
angularjs 表单密码验证自定义指令实现代码
2016/10/27 Javascript
javascript实现table单元格点击展开隐藏效果(实例代码)
2017/04/10 Javascript
js代码实现轮播图
2020/05/04 Javascript
[47:04]LGD vs infamous Supermajor小组赛D组 BO3 第二场 6.3
2018/06/04 DOTA
在pandas中一次性删除dataframe的多个列方法
2018/04/10 Python
python 巧用正则寻找字符串中的特定字符的位置方法
2018/05/02 Python
python实现连连看辅助之图像识别延伸
2019/07/17 Python
关于torch.optim的灵活使用详解(包括重写SGD,加上L1正则)
2020/02/20 Python
python将logging模块封装成单独模块并实现动态切换Level方式
2020/05/12 Python
python修改微信和支付宝步数的示例代码
2020/10/12 Python
css图标制作教程制作云图标
2014/01/19 HTML / CSS
一款CSS3实现多功能下拉菜单(带分享按)的教程
2014/11/05 HTML / CSS
英语专业毕业个人求职自荐信
2013/09/21 职场文书
天鹅的故事教学反思
2014/02/04 职场文书
财务部绩效考核方案
2014/05/04 职场文书
小学生关于梦想的演讲稿
2014/08/22 职场文书
2015年机关纠风工作总结
2015/05/15 职场文书
同学聚会感言一句话
2015/07/30 职场文书
节约用水广告语60条
2019/11/14 职场文书
晶体管单管来复再生式收音机
2021/04/22 无线电
使用php的mail()函数实现发送邮件功能
2021/06/03 PHP