pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python编写简单的画图板程序的示例教程
Dec 08 Python
浅谈python中scipy.misc.logsumexp函数的运用场景
Jun 23 Python
Python 的类、继承和多态详解
Jul 16 Python
Python图像处理之颜色的定义与使用分析
Jan 03 Python
对python中的控制条件、循环和跳出详解
Jun 24 Python
python3.8 微信发送服务器监控报警消息代码实现
Nov 05 Python
python实现一个点绕另一个点旋转后的坐标
Dec 04 Python
Keras实现DenseNet结构操作
Jul 06 Python
使用python库xlsxwriter库来输出各种xlsx文件的示例
Sep 01 Python
python 爬虫爬取京东ps4售卖情况
Dec 18 Python
在PyCharm中安装PaddlePaddle的方法
Feb 05 Python
matplotlib之pyplot模块坐标轴标签设置使用(xlabel()、ylabel())
Feb 22 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
php下载远程文件类(支持断点续传)
2008/11/14 PHP
给ECShop添加最新评论
2015/01/07 PHP
分享10段PHP常用代码
2015/11/11 PHP
WordPress开发中用于获取近期文章的PHP函数使用解析
2016/01/05 PHP
JavaScript中的Document文档对象
2008/01/16 Javascript
extjs 学习笔记 四 带分页的grid
2009/10/20 Javascript
jQuery总体架构的理解分析
2011/03/07 Javascript
js window.print实现打印特定控件或内容
2013/09/16 Javascript
JavaScript 语言基础知识点总结(思维导图)
2013/11/10 Javascript
JavaScript禁止页面操作的示例代码
2013/12/17 Javascript
JS实现点击按钮后框架内载入不同网页的方法
2015/05/05 Javascript
BootStrap中的表单大全
2016/09/07 Javascript
vue引入jq插件的实例讲解
2017/09/12 Javascript
详解使用create-react-app快速构建React开发环境
2018/05/16 Javascript
详解vue中async-await的使用误区
2018/12/05 Javascript
jQuery实现验证用户登录
2019/12/10 jQuery
[49:35]KG vs SECRET 2019国际邀请赛小组赛 BO2 第一场 8.16
2019/08/19 DOTA
Python连接mssql数据库编码问题解决方法
2015/01/01 Python
Django应用程序中如何发送电子邮件详解
2017/02/04 Python
用python3 返回鼠标位置的实现方法(带界面)
2019/07/05 Python
详细介绍Python进度条tqdm的使用
2019/07/31 Python
Python 项目转化为so文件实例
2019/12/23 Python
python logging.info在终端没输出的解决
2020/05/12 Python
Python OpenCV实现测量图片物体宽度
2020/05/27 Python
Html5页面内使用JSON动画的实现
2019/01/29 HTML / CSS
澳大利亚领先的在线礼品网站:Gifts Australia
2020/08/15 全球购物
如何用Python输出一个Fibonacci数列
2016/08/28 面试题
经典优秀毕业生求职信范文分享
2013/12/18 职场文书
建议书怎么写
2014/03/12 职场文书
教师应聘自荐信范文
2014/03/14 职场文书
2014年端午节演讲稿范文
2014/05/23 职场文书
优秀学生党员先进事迹材料
2014/05/29 职场文书
幼师求职信
2014/06/23 职场文书
2014年党员自我剖析材料
2014/10/07 职场文书
幼儿园学前班幼儿评语
2014/12/29 职场文书
【超详细】八大排序算法的各项比较以及各自特点
2021/03/31 Python