pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python使用htpasswd实现基本认证授权的例子
Jun 10 Python
Python2.x版本中maketrans()方法的使用介绍
May 19 Python
详解Python的Django框架中的模版相关知识
Jul 15 Python
mysql 之通过配置文件链接数据库
Aug 12 Python
Python实现正弦信号的时域波形和频谱图示例【基于matplotlib】
May 04 Python
python 用下标截取字符串的实例
Dec 25 Python
Python使用pymongo库操作MongoDB数据库的方法实例
Feb 22 Python
11个Python3字典内置方法大全与示例汇总
May 13 Python
详解10个可以快速用Python进行数据分析的小技巧
Jun 24 Python
python 使用pdfminer3k 读取PDF文档的例子
Aug 27 Python
Python下载网易云歌单歌曲的示例代码
Aug 12 Python
Python ConfigParser模块的使用示例
Oct 12 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
php iconv() : Detected an illegal character in input string
2010/12/05 PHP
php xml 入门学习资料
2011/01/01 PHP
php动态实现表格跨行跨列实现代码
2012/11/06 PHP
利用php生成验证码
2017/02/23 PHP
详解CSS样式中的 !important * _ 符号
2021/03/09 HTML / CSS
js form 验证函数 当前比较流行的错误提示
2009/06/23 Javascript
js左侧多级菜单动态的解决方案
2010/02/01 Javascript
JQuery页面的表格数据的增加与分页的实现
2013/12/10 Javascript
深入理解JQuery keyUp和keyDown的区别
2013/12/12 Javascript
javaScript对文字按照拼音排序实现代码
2013/12/27 Javascript
JavaScript字符串对象slice方法入门实例(用于字符串截取)
2014/10/16 Javascript
js实现最短的XML格式化工具实例
2015/03/12 Javascript
js实现显示当前状态的导航效果代码
2015/08/28 Javascript
13个PHP函数超实用
2015/10/21 Javascript
JavaScript驾驭网页-CSS与DOM
2016/03/24 Javascript
JQuery异步加载PartialView的方法
2016/06/07 Javascript
easyui datebox 时间限制,datebox开始时间限制结束时间,datebox截止日期比起始日期大的实现代码
2017/01/12 Javascript
详解vue项目首页加载速度优化
2017/10/18 Javascript
利用js给datalist或select动态添加option选项的方法
2018/01/25 Javascript
vue结合Echarts实现点击高亮效果的示例
2018/03/17 Javascript
详解如何给React-Router添加路由页面切换时的过渡动画
2019/04/25 Javascript
JavaScript canvas动画实现时钟效果
2020/02/10 Javascript
webpack3.0升级4.0的方法步骤
2020/04/02 Javascript
用Javascript实现发送短信验证码间隔功能
2021/02/08 Javascript
[46:55]Ti4 冒泡赛第二轮 LGD vs C9
2014/07/14 DOTA
Python中for循环详解
2014/01/17 Python
Python用GET方法上传文件
2015/03/10 Python
举例详解Python中的split()函数的使用方法
2015/04/07 Python
Django form表单与请求的生命周期步骤详解
2020/06/07 Python
2014年迎新年活动方案
2014/02/19 职场文书
《雨点儿》教学反思
2014/04/14 职场文书
节约用水倡议书
2014/04/16 职场文书
团队精神口号
2014/06/06 职场文书
先进集体申报材料
2014/12/25 职场文书
行政答辩状范文
2015/05/21 职场文书
vue本地构建热更新卡顿的问题“75 advanced module optimization”完美解决方案
2022/08/05 Vue.js