pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 文件操作实现代码
Oct 07 Python
Python实现端口复用实例代码
Jul 03 Python
讲解Python中for循环下的索引变量的作用域
Apr 15 Python
python正常时间和unix时间戳相互转换的方法
Apr 23 Python
Python递归遍历列表及输出的实现方法
May 19 Python
Diango + uwsgi + nginx项目部署的全过程(可外网访问)
Apr 22 Python
Django REST framework 分页的实现代码
Jun 19 Python
Python的log日志功能及设置方法
Jul 11 Python
python异常触发及自定义异常类解析
Aug 06 Python
Python日志syslog使用原理详解
Feb 18 Python
Python使用正则表达式实现爬虫数据抽取
Aug 17 Python
关于Python中进度条的六个实用技巧分享
Apr 05 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
基于PHP常用字符串的总结(待续)
2013/06/07 PHP
Zend studio文件注释模板设置方法
2013/09/29 PHP
php去除换行(回车换行)的三种方法
2014/03/26 PHP
javascript获取设置div的高度和宽度兼容任何浏览器
2013/09/22 Javascript
jQuery背景插件backstretch使用指南
2015/04/21 Javascript
第五章之BootStrap 栅格系统
2016/04/25 Javascript
jQuery简单创建节点的方法
2016/09/09 Javascript
把json格式的字符串转换成javascript对象或数组的方法总结
2016/11/03 Javascript
原生JS查找元素的方法(推荐)
2016/11/22 Javascript
JavaScript构建自己的对象示例
2016/11/29 Javascript
Bootstrap弹出框(Popover)被挤压的问题小结
2017/07/11 Javascript
jQuery选择器之属性筛选选择器用法详解
2017/09/19 jQuery
jQuery实现的简单前端搜索功能示例
2017/10/28 jQuery
使用FormData实现上传多个文件
2018/12/04 Javascript
跟老齐学Python之总结参数的传递
2014/10/10 Python
Python列表计数及插入实例
2014/12/17 Python
在Python中使用Mako模版库的简单教程
2015/04/08 Python
Python解决N阶台阶走法问题的方法分析
2017/12/28 Python
在windows下Python打印彩色字体的方法
2018/05/15 Python
python程序变成软件的实操方法
2019/06/24 Python
MNIST数据集转化为二维图片的实现示例
2020/01/10 Python
解决Jupyter Notebook使用parser.parse_args出现错误问题
2020/04/20 Python
python为什么会环境变量设置不成功
2020/06/23 Python
python中HTMLParser模块知识点总结
2021/01/25 Python
CSS3 Columns分列式布局方法简介
2014/05/03 HTML / CSS
澳大利亚新奇小玩意网站:Yellow Octopus
2017/12/28 全球购物
乌克兰网上服装店:Bolf.ua
2018/10/30 全球购物
法律进社区实施方案
2014/03/21 职场文书
优质护理服务演讲稿
2014/05/07 职场文书
大学生工作自荐书
2014/06/16 职场文书
2015年财务工作总结范文
2015/03/31 职场文书
志愿服务心得体会
2016/01/15 职场文书
2016五一手机促销广告语
2016/01/28 职场文书
Redisson实现Redis分布式锁的几种方式
2021/08/07 Redis
vue如何使用模拟的json数据查看效果
2022/03/31 Vue.js
HTML实现仿Windows桌面主题特效的实现
2022/06/28 HTML / CSS