pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python批量提交沙箱问题实例
Oct 08 Python
Python字符串和文件操作常用函数分析
Apr 08 Python
Python实现pdf文档转txt的方法示例
Jan 19 Python
python自动化之Ansible的安装教程
Jun 13 Python
django-allauth入门学习和使用详解
Jul 03 Python
python中的Elasticsearch操作汇总
Oct 30 Python
Python Celery多队列配置代码实例
Nov 22 Python
pytorch forward两个参数实例
Jan 17 Python
Pycharm如何运行.py文件的方法步骤
Mar 03 Python
浅谈Pycharm的项目文件名是红色的原因及解决方式
Jun 01 Python
Python偏函数Partial function使用方法实例详解
Jun 17 Python
python 单机五子棋对战游戏
Apr 28 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
php+mysql事务rollback&commit示例
2010/02/08 PHP
phpStudy 2016 使用教程详解(支持PHP7)
2017/10/18 PHP
php判断数组是否为空的实例方法
2020/05/10 PHP
jQuery 树形结构的选择器
2010/02/15 Javascript
使用滤镜设置透明导致 IE 6/7/8/9 解析异常的解决方法
2011/04/07 Javascript
在网站上应该用的30个jQuery插件整理
2011/11/03 Javascript
JavaScript高级程序设计(第3版)学习笔记4 js运算符和操作符
2012/10/11 Javascript
jquery click([data],fn)使用方法实例介绍
2013/07/08 Javascript
Node.js 的异步 IO 性能探讨
2014/10/08 Javascript
js阻止事件追加的具体实现
2014/10/15 Javascript
jQuery中even选择器的定义和用法
2014/12/23 Javascript
JavaScript中的console.log()函数详细介绍
2014/12/29 Javascript
BootStrap智能表单实战系列(三)分块表单配置详解
2016/06/13 Javascript
jquery checkbox的相关操作总结
2016/10/17 Javascript
快速入门Vue
2016/12/19 Javascript
React 子组件向父组件传值的方法
2017/07/24 Javascript
IntelliJ IDEA 安装vue开发插件的方法
2017/11/21 Javascript
JS中async/await实现异步调用的方法
2019/08/28 Javascript
es6中let和const的使用方法详解
2020/02/24 Javascript
JavaScript async/await原理及实例解析
2020/12/02 Javascript
nestjs中异常过滤器Exceptionfilter的具体使用
2021/02/07 Javascript
Python字典操作简明总结
2015/04/13 Python
python创建一个最简单http webserver服务器的方法
2015/05/08 Python
详解详解Python中writelines()方法的使用
2015/05/25 Python
小议Python中自定义函数的可变参数的使用及注意点
2016/06/21 Python
基于python元祖与字典与集合的粗浅认识
2017/08/23 Python
PyQt实现界面翻转切换效果
2018/04/20 Python
详解python 3.6 安装json 模块(simplejson)
2019/04/02 Python
Django接收照片储存文件的实例代码
2020/03/07 Python
Python叠加矩形框图层2种方法及效果
2020/06/18 Python
法国美发器材和产品购物网站:Beauty Coiffure
2016/12/05 全球购物
大学活动总结范文
2014/04/29 职场文书
2015年度服装销售工作总结
2015/03/31 职场文书
无保留意见审计报告
2015/06/05 职场文书
格林童话读书笔记
2015/06/30 职场文书
2016年党员创先争优公开承诺书
2016/03/25 职场文书