pandas中read_csv的缺失值处理方式


Posted in Python onDecember 19, 2019

今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值。对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。

看pandas文档中read_csv函数中这两个参数的描述,默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN,且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数,这个参数的作用是决定要不要保留默认应该转换的缺失值列表,将这个参数设为False之后同时不定义na_values参数,就可以在读取文件时不将任何值转换为缺失值NaN。

例:

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Flask框架学习笔记(一)安装篇(windows安装与centos安装)
Jun 25 Python
Python内置函数dir详解
Apr 14 Python
利用Python获取赶集网招聘信息前篇
Apr 18 Python
Python通过Pygame绘制移动的矩形实例代码
Jan 03 Python
python 列表,数组,矩阵两两转换tolist()的实例
Apr 04 Python
python 借助numpy保存数据为csv格式的实现方法
Jul 04 Python
使用Python测试Ping主机IP和某端口是否开放的实例
Dec 17 Python
解决Alexnet训练模型在每个epoch中准确率和loss都会一升一降问题
Jun 17 Python
Python+OpenCV图像处理——打印图片属性、设置存储路径、调用摄像头
Oct 22 Python
python 基于opencv去除图片阴影
Jan 26 Python
pytorch 如何把图像数据集进行划分成train,test和val
May 31 Python
使用pandas生成/读取csv文件的方法实例
Jul 09 Python
python错误调试及单元文档测试过程解析
Dec 19 #Python
Python3.5 win10环境下导入kera/tensorflow报错的解决方法
Dec 19 #Python
解决Python列表字符不区分大小写的问题
Dec 19 #Python
简单了解为什么python函数后有多个括号
Dec 19 #Python
解决Python使用列表副本的问题
Dec 19 #Python
python读写Excel表格的实例代码(简单实用)
Dec 19 #Python
python装饰器原理与用法深入详解
Dec 19 #Python
You might like
人大复印资料处理程序_输入篇
2006/10/09 PHP
php数组相加 array(“a”)+array(“b”)结果还是array(“a”)
2012/09/19 PHP
ThinkPHP3.1新特性之查询条件预处理简介
2014/06/19 PHP
php获取图片信息的方法详解
2015/12/10 PHP
如何使用PHP给图片加水印
2016/10/12 PHP
php使用Jpgraph创建折线图效果示例
2017/02/15 PHP
Yii2 队列 shmilyzxt/yii2-queue 简单概述
2017/08/02 PHP
建议大家看下JavaScript重要知识更新
2007/07/08 Javascript
从零开始学习jQuery (八) 插播:jQuery实施方案
2011/02/23 Javascript
js控制的遮罩层实例介绍
2013/05/29 Javascript
window.print打印指定div实例代码
2013/12/13 Javascript
nodejs中实现路由功能
2014/12/29 NodeJs
浅谈EasyUI中Treegrid节点的删除
2015/03/01 Javascript
js获取新浪天气接口的实现代码
2016/06/06 Javascript
jQuery实现淡入淡出的模态框
2017/02/09 Javascript
详解vue与后端数据交互(ajax):vue-resource
2017/03/16 Javascript
基于js原生和ajax的get和post方法以及jsonp的原生写法实例
2017/10/16 Javascript
node thread.sleep实现示例
2018/06/20 Javascript
JavaScript中 ES6变量的结构赋值
2018/07/10 Javascript
基于vue实现web端超大数据量表格的卡顿解决
2019/04/02 Javascript
element-ui中Table表格省市区合并单元格的方法实现
2019/08/07 Javascript
[01:03:56]Mineski vs TNC 2018国际邀请赛淘汰赛BO1 8.21
2018/08/22 DOTA
[01:01:14]完美世界DOTA2联赛PWL S2 SZ vs Rebirth 第一场 11.21
2020/11/23 DOTA
介绍Python的Django框架中的静态资源管理器django-pipeline
2015/04/25 Python
python爬虫面试宝典(常见问题)
2018/03/02 Python
python-opencv颜色提取分割方法
2018/12/08 Python
Pycharm保存不能自动同步到远程服务器的解决方法
2019/06/27 Python
python GUI库图形界面开发之PyQt5美化窗体与控件(异形窗体)实例
2020/02/25 Python
Cpython解释器中的GIL全局解释器锁
2020/11/09 Python
python+selenium+chrome实现淘宝购物车秒杀自动结算
2021/01/07 Python
销售自我评价
2013/10/22 职场文书
优秀干部获奖感言
2014/01/31 职场文书
社区党员群众路线教育实践活动心得体会
2014/11/03 职场文书
《围炉夜话》110句人生箴言,精辟有内涵,引人深思
2019/10/23 职场文书
Kubernetes中Deployment的升级与回滚
2022/04/01 Servers
Android实现获取短信验证码并自动填充
2023/05/21 Java/Android