pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python爬虫实现简单的爬取有道翻译功能示例
Jul 13 Python
python模拟登陆,用session维持回话的实例
Dec 27 Python
python实现kmp算法的实例代码
Apr 03 Python
基于python if 判断选择结构的实例详解
May 06 Python
Python 使用 prettytable 库打印表格美化输出功能
Dec 26 Python
Python vtk读取并显示dicom文件示例
Jan 13 Python
Python3 元组tuple入门基础
Feb 09 Python
windows下Pycharm安装opencv的多种方法
Mar 05 Python
浅谈keras中的Merge层(实现层的相加、相减、相乘实例)
May 23 Python
Python自动化xpath实现自动抢票抢货
Sep 19 Python
Python自然语言处理之切分算法详解
Apr 25 Python
只需要这一行代码就能让python计算速度提高十倍
May 24 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
phpmyadmin安装时提示:Warning: require_once(./libraries/common.inc.php)错误解决办法
2011/08/18 PHP
Yii框架获取当前controlle和action对应id的方法
2014/12/03 PHP
php专用数组排序类ArraySortUtil用法实例
2015/04/03 PHP
laravel-admin 在列表页添加自定义按钮的例子
2019/09/30 PHP
JavaScript进阶教程(第四课第一部分)
2007/04/05 Javascript
Jquery异步请求数据实例代码
2011/12/28 Javascript
IE关闭时判断及AJAX注销案例学习
2013/02/18 Javascript
jQuery实现类似淘宝购物车全选状态示例
2013/06/26 Javascript
jQuery实现类似滑动门切换效果的层切换
2013/09/23 Javascript
html5 canvas js(数字时钟)实例代码
2013/12/23 Javascript
JavaScript实现页面5秒后自动跳转的方法
2015/04/16 Javascript
浅谈bootstrap源码分析之tab(选项卡)
2016/06/06 Javascript
jQuery用noConflict代替$的实现方法
2017/04/12 jQuery
vue.js element-ui tree树形控件改iview的方法
2018/03/29 Javascript
微信小程序实现发红包功能
2018/07/11 Javascript
mpvue微信小程序多列选择器用法之省份城市选择的实现
2019/03/07 Javascript
python操作ie登陆土豆网的方法
2015/05/09 Python
理解Python中的With语句
2016/03/18 Python
详解 Python中LEGB和闭包及装饰器
2017/08/03 Python
Python判断一个三位数是否为水仙花数的示例
2018/11/13 Python
对python中Librosa的mfcc步骤详解
2019/01/09 Python
django框架自定义模板标签(template tag)操作示例
2019/06/24 Python
Python通过Manager方式实现多个无关联进程共享数据的实现
2019/11/07 Python
Python迷宫生成和迷宫破解算法实例
2019/12/24 Python
python装饰器的特性原理详解
2019/12/25 Python
python实现全排列代码(回溯、深度优先搜索)
2020/02/26 Python
Html5实现移动端、PC端 刮刮卡效果
2016/06/30 HTML / CSS
日本最大的旅游网站:Rakuten Travel(乐天旅游)
2018/08/02 全球购物
英国在线女鞋目的地:SIMMI
2018/12/27 全球购物
Java如何支持I18N?
2016/10/31 面试题
英文版银行求职信
2013/10/09 职场文书
医院深入开展党的群众路线教育实践活动实施方案
2014/08/27 职场文书
机动车交通事故协议书
2015/01/29 职场文书
2015年前台个人工作总结
2015/04/03 职场文书
想要创业,那么你做好准备了吗?
2019/07/01 职场文书
Spring中的@Transactional的工作原理
2022/06/05 Java/Android