pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之Import 模块
Oct 13 Python
Python简单生成随机姓名的方法示例
Dec 27 Python
对Python实现累加函数的方法详解
Jan 23 Python
Python实现带下标索引的遍历操作示例
May 30 Python
python性能测量工具cProfile使用解析
Sep 26 Python
Pandas时间序列:重采样及频率转换方式
Dec 26 Python
python生成13位或16位时间戳以及反向解析时间戳的实例
Mar 03 Python
使用Keras画神经网络准确性图教程
Jun 15 Python
Python venv虚拟环境配置过程解析
Jul 08 Python
python中数字是否为可变类型
Jul 08 Python
Django nginx配置实现过程详解
Sep 10 Python
jupyter notebook更换皮肤主题的实现
Jan 07 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
3个PHP多维数组转为一维数组的方法实例
2014/03/13 PHP
php socket实现的聊天室代码分享
2014/08/16 PHP
PHP中使用BigMap实例
2015/03/30 PHP
PHP时间和日期函数详解
2015/05/08 PHP
CodeIgniter框架验证码类库文件与用法示例
2017/03/18 PHP
PHP写的简单数字验证码实例
2017/05/23 PHP
总结PHP内存释放以及垃圾回收
2018/03/29 PHP
PHP实用小技巧之调用录像的方法
2019/12/05 PHP
php获取小程序码的实现代码(B类接口)
2020/06/13 PHP
phpstudy2020搭建站点的实现示例
2020/10/30 PHP
JQuery Tips(2) 关于$()包装集你不知道的
2009/12/14 Javascript
Jquery AutoComplete自动完成 的使用方法实例
2010/03/19 Javascript
使用js判断TextBox控件值改变然后出发事件
2014/03/07 Javascript
window.location 对象所包含的属性
2014/10/10 Javascript
node.js实现BigPipe详解
2014/12/05 Javascript
跟我学习javascript的prototype使用注意事项
2015/11/17 Javascript
node.js 和HTML5开发本地桌面应用程序
2016/12/13 Javascript
基于js文件加载优化(详解)
2018/01/03 Javascript
解决vue 按钮多次点击重复提交数据问题
2018/05/10 Javascript
JS/HTML5游戏常用算法之路径搜索算法 随机迷宫算法详解【普里姆算法】
2018/12/13 Javascript
Vue 技巧之控制父类的 slot
2020/02/24 Javascript
[33:19]完美世界DOTA2联赛PWL S2 PXG vs InkIce 第一场 11.26
2020/11/30 DOTA
Python解释执行原理分析
2014/08/22 Python
django启动uwsgi报错的解决方法
2018/04/08 Python
使用Python做垃圾分类的原理及实例代码附源码
2019/07/02 Python
如何不用安装python就能在.NET里调用Python库
2019/07/12 Python
Python调用C语言的实现
2019/07/26 Python
Python定义一个函数的方法
2020/06/15 Python
门卫岗位安全职责
2013/12/13 职场文书
入党积极分子思想汇报范文
2014/01/05 职场文书
协议书范本
2014/04/23 职场文书
知识竞赛拉拉队口号
2014/06/16 职场文书
大学教师个人总结
2015/02/10 职场文书
小学六一儿童节活动总结
2015/05/05 职场文书
婚礼必备主持词范本!
2019/07/23 职场文书
利用Python判断你的密码难度等级
2021/06/02 Python