pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
寻找网站后台地址的python脚本
Sep 01 Python
编写Python爬虫抓取豆瓣电影TOP100及用户头像的方法
Jan 20 Python
Python算法输出1-9数组形成的结果为100的所有运算式
Nov 03 Python
pip命令无法使用的解决方法
Jun 12 Python
使用Flask集成bootstrap的方法
Jul 24 Python
python代码 输入数字使其反向输出的方法
Dec 22 Python
Python 实现输入任意多个数,并计算其平均值的例子
Jul 16 Python
使用tensorboard可视化loss和acc的实例
Jan 21 Python
Django关于admin的使用技巧和知识点
Feb 10 Python
Python之京东商品秒杀的实现示例
Jan 06 Python
python 获取谷歌浏览器保存的密码
Jan 06 Python
使用pandas生成/读取csv文件的方法实例
Jul 09 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
实现获取http内容的php函数分享
2014/02/16 PHP
php快速查找数据库中恶意代码的方法
2015/04/01 PHP
thinkPHP中create方法与令牌验证实例浅析
2015/12/08 PHP
php结合md5的加密解密算法实例
2016/09/30 PHP
js 数值项目的格式化函数代码
2010/05/14 Javascript
25个好玩的JavaScript小游戏分享
2011/04/22 Javascript
JavaScript的parseInt 取整使用
2011/05/09 Javascript
另一个javascript小测验(代码集合)
2011/07/27 Javascript
深入理解JavaScript系列(25):设计模式之单例模式详解
2015/03/03 Javascript
jQuery对指定元素中指定字符串进行替换的方法
2015/03/17 Javascript
JavaScript返回当前会话cookie全部键值对照的方法
2015/04/03 Javascript
在for循环中length值是否需要缓存
2015/07/27 Javascript
关于JavaScript作用域你想知道的一切
2016/02/04 Javascript
js操作DOM--添加、删除节点的简单实例
2016/07/08 Javascript
js面向对象实现canvas制作彩虹球喷枪效果
2016/09/24 Javascript
js实现图片上传预览原理分析
2017/07/13 Javascript
你有必要知道的10个JavaScript难点
2017/07/25 Javascript
Nuxt.js踩坑总结分享
2018/01/18 Javascript
Vue项目vscode 安装eslint插件的方法(代码自动修复)
2020/04/15 Javascript
VUE前端从后台请求过来的数据进行转换数据结构操作
2020/11/11 Javascript
[01:44]Ti10举办地公布
2019/08/25 DOTA
解决python os.mkdir创建目录失败的问题
2018/10/16 Python
Python模拟浏览器上传文件脚本的方法(Multipart/form-data格式)
2018/10/22 Python
Python 实现域名解析为ip的方法
2019/02/14 Python
Python实现求两个数组交集的方法示例
2019/02/23 Python
详解基于Jupyter notebooks采用sklearn库实现多元回归方程编程
2020/03/25 Python
python 识别登录验证码图片功能的实现代码(完整代码)
2020/07/03 Python
CSS3 box-sizing属性详解
2016/11/15 HTML / CSS
html5 css3网站菜单实现代码
2013/12/23 HTML / CSS
亚洲独特体验旅游专家:eOasia
2018/08/15 全球购物
流动人口婚育证明范本
2014/09/26 职场文书
市级三好学生评语
2014/12/29 职场文书
地道战观后感500字
2015/06/04 职场文书
开学典礼校长致辞
2015/07/29 职场文书
2019最新版股权转让及委托持股协议书范本
2019/08/07 职场文书
详解nginx location指令
2022/01/18 Servers