pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
Python中用sleep()方法操作时间的教程
May 22 Python
Python下载指定页面上图片的方法
May 12 Python
python 生成器生成杨辉三角的方法(必看)
Apr 10 Python
解决pip install xxx报错SyntaxError: invalid syntax的问题
Nov 30 Python
python 返回一个列表中第二大的数方法
Jul 09 Python
将python依赖包打包成window下可执行文件bat方式
Dec 26 Python
Python3标准库之threading进程中管理并发操作方法
Mar 30 Python
keras之权重初始化方式
May 21 Python
pandas创建DataFrame的7种方法小结
Jun 14 Python
python给视频添加背景音乐并改变音量的具体方法
Jul 19 Python
Python机器学习之逻辑回归
May 11 Python
用Python进行栅格数据的分区统计和批量提取
May 27 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
php 按指定元素值去除数组元素的实现方法
2011/11/04 PHP
php中socket通信机制实例详解
2015/01/03 PHP
php判断一个数组是否为有序的方法
2015/03/27 PHP
PHP匿名函数(闭包函数)详解
2019/03/22 PHP
js location.replace与location.reload的区别
2010/09/08 Javascript
JavaScript XML和string相互转化实现代码
2011/07/04 Javascript
通过复制Table生成word和excel的javascript代码
2014/01/20 Javascript
jquery 新建的元素事件绑定问题解决方案
2014/06/12 Javascript
基于jQuery实现响应式圆形图片轮播特效
2015/11/25 Javascript
Node.js刷新session过期时间的实现方法推荐
2016/05/18 Javascript
浅析Node.js实现HTTP文件下载
2016/08/05 Javascript
jQuery Ajax 实现在html页面实时显示用户登录状态
2016/12/30 Javascript
Webpack中css-loader和less-loader的使用教程
2017/04/27 Javascript
Vue+jquery实现表格指定列的文字收缩的示例代码
2018/01/09 jQuery
js中let能否完全替代IIFE
2019/06/15 Javascript
JS 逻辑判断不要只知道用 if-else 和 switch条件判断(小技巧)
2020/05/27 Javascript
JavaScript中交换值的10种方法总结
2020/08/18 Javascript
vue-calendar-component 封装多日期选择组件的实例代码
2020/12/04 Vue.js
[02:26]2016国际邀请赛8月3日开战 中国军团出征西雅图
2016/08/02 DOTA
[01:09:50]VP vs Pain 2018国际邀请赛小组赛BO2 第二场
2018/08/20 DOTA
[48:00]完美世界DOTA2联赛循环赛 Forest vs Inki BO2第二场 11.04
2020/11/04 DOTA
Python中join和split用法实例
2015/04/14 Python
python3.5实现socket通讯示例(TCP)
2017/02/07 Python
tensorflow构建BP神经网络的方法
2018/03/12 Python
python中将正则过滤的内容输出写入到文件中的实例
2018/10/21 Python
python读取word文档,插入mysql数据库的示例代码
2018/11/07 Python
在django中图片上传的格式校验及大小方法
2019/07/28 Python
python序列化与数据持久化实例详解
2019/12/20 Python
Python调用scp向服务器上传文件示例
2019/12/22 Python
Python 实现Image和Ndarray互相转换
2020/02/19 Python
基于Python爬取京东双十一商品价格曲线
2020/10/23 Python
pandas数据分组groupby()和统计函数agg()的使用
2021/03/04 Python
英语专业毕业个人求职自荐信
2013/09/21 职场文书
年度安全生产目标责任书
2014/07/23 职场文书
2016年9月份红领巾广播稿
2015/12/21 职场文书
python 自动刷新网页的两种方法
2021/04/20 Python