pandas中read_csv的缺失值处理方式


Posted in Python onDecember 19, 2019

今天遇到的问题是,要将一份csv数据读入dataframe,但某些列中含有NA值。对于这些列来说,NA应该作为一个有意义的level,而不是缺失值,但read_csv函数会自动将类似的缺失值理解为缺失值并变为NaN。

看pandas文档中read_csv函数中这两个参数的描述,默认会将'-1.#IND', ‘1.#QNAN', ‘1.#IND', ‘-1.#QNAN', ‘#N/A N/A','#N/A', ‘N/A', ‘NA', ‘#NA', ‘NULL', ‘NaN', ‘-NaN', ‘nan', ‘-nan', ''转换为NaN,且na_values参数还支持定义另外的应处理为缺失值的值。

值得注意的是keep_default_na参数,这个参数的作用是决定要不要保留默认应该转换的缺失值列表,将这个参数设为False之后同时不定义na_values参数,就可以在读取文件时不将任何值转换为缺失值NaN。

例:

import pandas as pd
df = pd.read_csv('train.csv', keep_default_na=False)

以上这篇pandas中read_csv的缺失值处理方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python操作字符串之rindex()方法的使用
May 19 Python
Python实现抓取网页生成Excel文件的方法示例
Aug 05 Python
python调用Delphi写的Dll代码示例
Dec 05 Python
tensorflow 获取模型所有参数总和数量的方法
Jun 14 Python
tensorflow: variable的值与variable.read_value()的值区别详解
Jul 30 Python
python os模块简单应用示例
May 23 Python
用Python从0开始实现一个中文拼音输入法的思路详解
Jul 20 Python
对Pytorch神经网络初始化kaiming分布详解
Aug 18 Python
python实现指定ip端口扫描方式
Dec 17 Python
pytorch载入预训练模型后,实现训练指定层
Jan 06 Python
Python运行提示缺少模块问题解决方案
Apr 02 Python
Python基于Opencv识别两张相似图片
Apr 25 Python
python错误调试及单元文档测试过程解析
Dec 19 #Python
Python3.5 win10环境下导入kera/tensorflow报错的解决方法
Dec 19 #Python
解决Python列表字符不区分大小写的问题
Dec 19 #Python
简单了解为什么python函数后有多个括号
Dec 19 #Python
解决Python使用列表副本的问题
Dec 19 #Python
python读写Excel表格的实例代码(简单实用)
Dec 19 #Python
python装饰器原理与用法深入详解
Dec 19 #Python
You might like
php 删除记录同时删除图片文件的实现代码
2010/05/12 PHP
PHP生成不同颜色、不同大小的tag标签函数
2013/09/23 PHP
php foreach循环中使用引用的问题
2013/11/06 PHP
PHP中把stdClass Object转array的几个方法
2014/05/08 PHP
ThinkPHP实例化模型的四种方法概述
2014/08/22 PHP
thinkPHP查询方式小结
2016/01/09 PHP
php使用正则验证中文
2016/04/06 PHP
TP5框架页面跳转样式操作示例
2020/04/05 PHP
在JavaScript中,为什么要尽可能使用局部变量?
2009/04/06 Javascript
Javascript判断图片尺寸大小实例分析
2014/06/16 Javascript
AngularJS中取消对HTML片段转义的方法例子
2015/01/04 Javascript
js实现带农历和八字等信息的日历特效
2016/05/16 Javascript
关于Bootstrap按钮组件消除黄框的方法
2017/05/19 Javascript
JS实现二维数组横纵列转置的方法
2018/04/17 Javascript
vue自定义指令实现方法详解
2019/02/11 Javascript
解决layui数据表格排序图标被超出的表头挤出去的问题
2019/09/19 Javascript
解决Layui数据表格显示无数据提示的问题
2019/11/14 Javascript
JavaScript实现网页计算器功能
2020/10/29 Javascript
SpringBoot+Vue 前后端合并部署的配置方法
2020/12/30 Vue.js
[01:06:18]DOTA2-DPC中国联赛 正赛 Phoenix vs Dynasty BO3 第二场 1月26日
2021/03/11 DOTA
PyQt5实现下载进度条效果
2018/04/19 Python
pandas DataFrame实现几列数据合并成为新的一列方法
2018/06/08 Python
Python面向对象之类的封装操作示例
2019/06/08 Python
django处理select下拉表单实例(从model到前端到post到form)
2020/03/13 Python
基于python实现MQTT发布订阅过程原理解析
2020/07/27 Python
CSS3制作ajax loader icon实现思路及代码
2013/08/25 HTML / CSS
Html5新标签datalist实现输入框与后台数据库数据的动态匹配
2017/05/18 HTML / CSS
MATCHESFASHION.COM法国官网:英国奢侈品零售商
2018/01/04 全球购物
美国滑雪和滑雪板商店:Buckman
2018/03/03 全球购物
统计每一学生的平均成绩
2014/06/06 面试题
你对IPv6了解程度
2016/02/09 面试题
客服专员岗位职责
2014/02/28 职场文书
人事专员的岗位职责
2014/03/01 职场文书
外贸采购员岗位职责
2014/03/08 职场文书
2015团员个人年度总结
2015/11/24 职场文书
索尼ICF-5900W收音机测评
2022/04/24 无线电