pandas中read_csv的缺失值处理方式


Posted in Python onDecember 19, 2019

今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值。对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。

看pandas文档中read_csv函数中这两个参数的描述,默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN,且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数,这个参数的作用是决定要不要保留默认应该转换的缺失值列表,将这个参数设为False之后同时不定义na_values参数,就可以在读取文件时不将任何值转换为缺失值NaN。

例:

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现脚本锁功能(同时只能执行一个脚本)
May 10 Python
深入理解Python分布式爬虫原理
Nov 23 Python
python自动发邮件库yagmail的示例代码
Feb 23 Python
Python实现确认字符串是否包含指定字符串的实例
May 02 Python
对pandas的算术运算和数据对齐实例详解
Dec 22 Python
对Python发送带header的http请求方法详解
Jan 02 Python
详解Python数据分析--Pandas知识点
Mar 23 Python
python仿evething的文件搜索器实例代码
May 13 Python
python爬虫之爬取百度音乐的实现方法
Aug 24 Python
Python协程 yield与协程greenlet简单用法示例
Nov 22 Python
Python实现汇率转换操作
May 03 Python
Python实现制作销售数据可视化看板详解
Nov 27 Python
python错误调试及单元文档测试过程解析
Dec 19 #Python
Python3.5 win10环境下导入kera/tensorflow报错的解决方法
Dec 19 #Python
解决Python列表字符不区分大小写的问题
Dec 19 #Python
简单了解为什么python函数后有多个括号
Dec 19 #Python
解决Python使用列表副本的问题
Dec 19 #Python
python读写Excel表格的实例代码(简单实用)
Dec 19 #Python
python装饰器原理与用法深入详解
Dec 19 #Python
You might like
PHP 字符串编码截取函数(兼容utf-8和gb2312)
2009/05/02 PHP
详解PHP序列化反序列化的方法
2015/10/27 PHP
ThinkPHP中类的构造函数_construct()与_initialize()的区别详解
2017/03/13 PHP
jscript之Open an Excel Spreadsheet
2007/06/13 Javascript
asp javascript 实现关闭窗口时保存数据的办法
2007/11/24 Javascript
javascript 隔行换色函数代码
2010/10/24 Javascript
JS延迟加载加快页面打开速度示例代码
2013/12/30 Javascript
Jquery原生态实现表格header头随滚动条滚动而滚动
2014/03/18 Javascript
用JS动态改变表单form里的action值属性的两种方法
2016/05/25 Javascript
js实现5秒倒计时重新发送短信功能
2017/02/05 Javascript
详解Angular结合zTree异步加载节点数据
2018/01/20 Javascript
使用JavaScript实现贪吃蛇游戏
2020/09/29 Javascript
python改变日志(logging)存放位置的示例
2014/03/27 Python
python求pi的方法
2014/10/08 Python
Python实现简单HTML表格解析的方法
2015/06/15 Python
Python的Socket编程过程中实现UDP端口复用的实例分享
2016/03/19 Python
Python编程实现输入某年某月某日计算出这一天是该年第几天的方法
2017/04/18 Python
Python编程对列表中字典元素进行排序的方法详解
2017/05/26 Python
对pandas的dataframe绘图并保存的实现方法
2017/08/05 Python
教你用Python创建微信聊天机器人
2020/03/31 Python
Python读写zip压缩文件的方法
2018/08/29 Python
Python 将Matrix、Dict保存到文件的方法
2018/10/30 Python
Python3获取拉勾网招聘信息的方法实例
2019/04/03 Python
在Python中COM口的调用方法
2019/07/03 Python
python 利用turtle库绘制笑脸和哭脸的例子
2019/11/23 Python
Python函数的返回值、匿名函数lambda、filter函数、map函数、reduce函数用法实例分析
2019/12/26 Python
Python tkinter 下拉日历控件代码
2020/03/04 Python
记一次python 爬虫爬取深圳租房信息的过程及遇到的问题
2020/11/24 Python
在印度上传处方,在线订购药品:Medlife
2019/03/28 全球购物
Ariat英国官网:为世界顶级马术运动员制造最优质的鞋类和服装
2020/02/14 全球购物
北京一家公司的.net开发工程师笔试题
2012/04/17 面试题
婚礼新郎父母答谢词
2014/01/16 职场文书
商场中秋节活动方案
2014/02/07 职场文书
学校门卫岗位职责范本
2014/06/30 职场文书
教师国庆节演讲稿范文2014
2014/09/21 职场文书
Windows server 2022创建创建林、域树、子域的步骤
2022/06/25 Servers