pandas进行数据输入和输出的方法详解


Posted in Python onMarch 23, 2022

1.文本格式数据的读写

read_csv():从文件、URL或文件型对象读取分隔好的数据,逗号是默认分隔符

read_table():从文件、URL或文件型对象读取分隔好的数据,制表符('\t')是默认分隔符

Windows用户打印文件的原始内容

pandas进行数据输入和输出的方法详解

因为这个文件是逗号分隔的,我们可以使用read_csv将它读入一个DataFrame:

pandas进行数据输入和输出的方法详解

也可以用read_table,并指定分隔符

pandas进行数据输入和输出的方法详解

 刚刚是文件包含表头行的情况,但有的文件并不包含表头行,比如

pandas进行数据输入和输出的方法详解

如果直接读取的话,默认将第一行作为表头了,也就是默认header=0,表示第一行为标题行。

pandas进行数据输入和输出的方法详解

 有两种方法改,

一是允许pandas自动分配默认列名,

pandas进行数据输入和输出的方法详解

 二是自己指定列名。

pandas进行数据输入和输出的方法详解

 假设想要message列成为返回DataFrame的索引,可以指定位置4的列为索引,或将'message'传给参数index_col:

pandas进行数据输入和输出的方法详解

 从多个列中形成一个分层索引

pandas进行数据输入和输出的方法详解

 解析函数有很多附加参数处理各种发生异常的文件格式,例如,可以使用skiprows来跳过第一行,第三行,第四行。

pandas进行数据输入和输出的方法详解

处理缺失值

通常情况下,缺失值要么不显示(空字符串,要么用一些标识值)

默认情况下,pandas用一些常见的标识,如NaN和NULL

pandas进行数据输入和输出的方法详解

na_values选项可以传入一个列表或一组字符串来处理缺失值

pandas进行数据输入和输出的方法详解

在字典中,每列可以指定不同的缺失值标识

pandas进行数据输入和输出的方法详解

 1.1 分块读入文本文件

如果只想读取一小部分(避免读取整个文件),可以指明nrows

pandas进行数据输入和输出的方法详解

 为了分块读入文件,可以指定chunksize作为每一块的行数

pandas进行数据输入和输出的方法详解

 read_csv返回的TextParser对象允许根据chunksize遍历文件,并对'a'列聚合获得计数值

 1.2 将数据写入文本格式

使用DataFrame的to_csv方法,可将数据导出为逗号分隔的文件

pandas进行数据输入和输出的方法详解

 默认若是没有其他选项被指定的话,行和列的标签都会被写入,不过二者也都可以禁止写入

pandas进行数据输入和输出的方法详解

也可以仅仅写入列的子集,并且按照选择的顺序写入

pandas进行数据输入和输出的方法详解

默认缺失值在输出时以空字符串出现,可以用其他标识值对缺失值进行标注

(写入到sys.stdout时,控制台中打印的文本结果)

pandas进行数据输入和输出的方法详解

默认分隔符是逗号,可以用sep选项选择分隔符

pandas进行数据输入和输出的方法详解

 Series也有to_csv方法

pandas进行数据输入和输出的方法详解

 不知道为啥最后写入有,0这行????

总结

本篇文章就到这里了,希望能够给你带来帮助,也希望您能够多多关注三水点靠木的更多内容!

Python 相关文章推荐
python文件读写并使用mysql批量插入示例分享(python操作mysql)
Feb 17 Python
Python读写Excel文件方法介绍
Nov 22 Python
python抓取网页中图片并保存到本地
Dec 01 Python
python 创建一个空dataframe 然后添加行数据的实例
Jun 07 Python
python爬取网页转换为PDF文件
Jun 07 Python
对web.py设置favicon.ico的方法详解
Dec 04 Python
python之array赋值技巧分享
Nov 28 Python
python实现批量处理将图片粘贴到另一张图片上并保存
Dec 12 Python
Flask框架搭建虚拟环境的步骤分析
Dec 21 Python
Python 给下载文件显示进度条和下载时间的实现
Apr 02 Python
tensorflow/core/platform/cpu_feature_guard.cc:140] Your CPU supports instructions that this T
Jun 22 Python
Python使用正则表达式实现爬虫数据抽取
Aug 17 Python
基于Python编写简易版的天天跑酷游戏的示例代码
Python中的嵌套循环详情
Mar 23 #Python
python装饰器代码解析
Mar 23 #Python
基于Python实现将列表数据生成折线图
Python必备技巧之字符数据操作详解
Pytorch中使用ImageFolder读取数据集时忽略特定文件
Mar 23 #Python
Python借助with语句实现代码段只执行有限次
Mar 23 #Python
You might like
不错的PHP学习之php4与php5之间会穿梭一点点感悟
2007/05/03 PHP
如何利用PHP执行.SQL文件
2013/07/05 PHP
php中通过数组进行高效随机抽取指定条记录的算法
2013/09/09 PHP
php通过curl模拟登陆DZ论坛
2015/05/11 PHP
thinkPHP5实现的查询数据库并返回json数据实例
2017/10/23 PHP
javascript FormatNumber函数实现方法
2008/12/30 Javascript
js调试工具console.log()方法查看js代码的执行情况
2014/08/08 Javascript
jQuery热气球动画半透明背景的后台登录界面代码分享
2015/08/28 Javascript
理解javascript正则表达式
2016/03/08 Javascript
详解AngularJs中$sce与$sceDelegate上下文转义服务
2016/09/21 Javascript
jQuery实现两个select控件的互移操作
2016/12/22 Javascript
Bootstrap 下拉多选框插件Bootstrap Multiselect
2017/01/22 Javascript
js实现5秒倒计时重新发送短信功能
2017/02/05 Javascript
初识NodeJS服务端开发入门(Express+MySQL)
2017/04/07 NodeJs
微信小程序开发入门基础教程
2017/04/19 Javascript
bootstrap modal+gridview实现弹出框效果
2017/08/15 Javascript
jQuery实现鼠标响应式透明度渐变动画效果示例
2018/02/13 jQuery
如何用vue-cli3脚手架搭建一个基于ts的基础脚手架的方法
2019/12/12 Javascript
javascript实现鼠标点击生成文字特效
2019/12/24 Javascript
如何通过JS实现转码与解码
2020/02/21 Javascript
vue 使用 canvas 实现手写电子签名
2020/03/06 Javascript
[02:08]2018年度CS GO枪械皮肤设计大赛优秀作者-完美盛典
2018/12/16 DOTA
Python 2与Python 3版本和编码的对比
2017/02/14 Python
Python系统监控模块psutil功能与经典用法分析
2018/05/24 Python
python编写简易聊天室实现局域网内聊天功能
2018/07/28 Python
纽约家具、家居装饰和地毯店:ABC Carpet & Home
2017/06/21 全球购物
澳大利亚领先的美容护肤品零售商之一:SkincareStore
2018/01/22 全球购物
以工厂直接定价的传奇性能:Ben Hogan Golf
2019/01/04 全球购物
党的群众路线教育实践活动心得体会900字
2014/03/07 职场文书
小学兴趣小组活动总结
2014/07/07 职场文书
三严三实对照检查材料
2014/08/25 职场文书
房屋分割离婚协议书范本
2014/12/01 职场文书
董事长秘书岗位职责
2015/02/13 职场文书
让生命充满爱观后感
2015/06/08 职场文书
维护民族团结心得体会2016
2016/01/15 职场文书
2019商业计划书格式、范文
2019/04/24 职场文书