pandas中read_csv的缺失值处理方式


Posted in Python onDecember 19, 2019

今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值。对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。

看pandas文档中read_csv函数中这两个参数的描述,默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN,且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数,这个参数的作用是决定要不要保留默认应该转换的缺失值列表,将这个参数设为False之后同时不定义na_values参数,就可以在读取文件时不将任何值转换为缺失值NaN。

例:

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中urllib+urllib2+cookielib模块编写爬虫实战
Jan 20 Python
python运行时间的几种方法
Jun 17 Python
Python 逐行分割大txt文件的方法
Oct 10 Python
python实现单向链表详解
Feb 08 Python
使用pycharm生成代码模板的实例
May 23 Python
Python 查找list中的某个元素的所有的下标方法
Jun 27 Python
Django页面数据的缓存与使用的具体方法
Apr 23 Python
python getpass模块用法及实例详解
Oct 07 Python
Python While循环语句实例演示及原理解析
Jan 03 Python
Python接口测试数据库封装实现原理
May 09 Python
浅谈sklearn中predict与predict_proba区别
Jun 28 Python
python用分数表示矩阵的方法实例
Jan 11 Python
python错误调试及单元文档测试过程解析
Dec 19 #Python
Python3.5 win10环境下导入kera/tensorflow报错的解决方法
Dec 19 #Python
解决Python列表字符不区分大小写的问题
Dec 19 #Python
简单了解为什么python函数后有多个括号
Dec 19 #Python
解决Python使用列表副本的问题
Dec 19 #Python
python读写Excel表格的实例代码(简单实用)
Dec 19 #Python
python装饰器原理与用法深入详解
Dec 19 #Python
You might like
全国FM电台频率大全 - 5 内蒙古自治区
2020/03/11 无线电
php上传文件,创建递归目录的实例代码
2013/10/18 PHP
php循环创建目录示例分享(php创建多级目录)
2014/03/04 PHP
PHP实现多维数组转字符串和多维数组转一维数组的方法
2015/08/08 PHP
PHP时间处理类操作示例
2018/09/05 PHP
php写app用的框架整理
2019/09/29 PHP
比较详细的关于javascript中void(0)的具体含义解释
2007/08/02 Javascript
asp.net网站开发中用jquery实现滚动浏览器滚动条加载数据(类似于腾讯微博)
2012/03/14 Javascript
如何在一个页面显示多个百度地图
2013/04/07 Javascript
解析JavaScript中instanceof对于不同的构造器或许都返回true
2013/12/03 Javascript
jQuery子窗体取得父窗体元素的方法
2015/05/11 Javascript
javascript中return,return true,return false三者的用法及区别
2015/11/17 Javascript
基于JS实现移动端访问PC端页面时跳转到对应的移动端网页
2020/12/24 Javascript
jQuery 全选 全部选 反选 实现代码
2016/08/17 Javascript
Vue表单验证插件的制作过程
2017/04/01 Javascript
详解AngularJS 路由 resolve用法
2017/04/24 Javascript
JavaScript实现form表单的多文件上传
2020/03/27 Javascript
Angular4项目中添加i18n国际化插件ngx-translate的步骤详解
2017/07/02 Javascript
详谈Node.js之操作文件系统
2017/08/29 Javascript
JavaScript闭包的简单应用
2017/09/01 Javascript
解决echarts的多个折现数据出现坐标和值对不上的问题
2018/12/28 Javascript
解决 window.onload 被覆盖的问题方法
2020/01/14 Javascript
vue中可编辑树状表格的实现代码
2020/10/31 Javascript
分析python服务器拒绝服务攻击代码
2014/01/16 Python
python机器学习之决策树分类详解
2017/12/20 Python
python中map的基本用法示例
2018/09/10 Python
python实现电子产品商店
2019/02/26 Python
VS2019+python3.7+opencv4.1+tensorflow1.13配置详解
2020/04/16 Python
Python实现打包成库供别的模块调用
2020/07/13 Python
kmart凯马特官网:美国最大的打折零售商和全球最大的批发商之一
2016/11/17 全球购物
软件测试企业面试试卷
2016/07/13 面试题
毕业设计指导教师评语
2014/12/30 职场文书
运动会表扬稿
2015/01/16 职场文书
新员工入职感想
2015/08/07 职场文书
python之django路由和视图案例教程
2021/07/26 Python
Vue router配置与使用分析讲解
2022/12/24 Vue.js