pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
将Python的Django框架与认证系统整合的方法
Jul 24 Python
python增加矩阵维度的实例讲解
Apr 04 Python
Python查找文件中包含中文的行方法
Dec 19 Python
Python中栈、队列与优先级队列的实现方法
Jun 30 Python
libreoffice python 操作word及excel文档的方法
Jul 04 Python
根据tensor的名字获取变量的值方式
Jan 04 Python
python 用pandas实现数据透视表功能
Dec 21 Python
python 实现体质指数BMI计算
May 26 Python
教你使用Python pypinyin库实现汉字转拼音
May 27 Python
Python实现智慧校园自动评教全新版
Jun 18 Python
python开发制作好看的时钟效果
May 02 Python
LyScript实现绕过反调试保护的示例详解
Aug 14 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
PHP个人网站架设连环讲(四)
2006/10/09 PHP
PHP编实现程动态图像的创建代码
2008/09/28 PHP
php empty函数 使用说明
2009/08/10 PHP
php中动态修改ini配置
2014/10/14 PHP
ThinkPHP 404页面的设置方法
2015/01/14 PHP
php车辆违章查询数据示例
2016/10/14 PHP
PHP实现的简单异常处理类示例
2017/05/04 PHP
thinkPHP5实现数据库添加内容的方法
2017/10/25 PHP
php在windows环境下获得cpu内存实时使用率(推荐)
2018/02/08 PHP
php 调用百度sms来发送短信的实现示例
2018/11/02 PHP
PHP PDOStatement::nextRowset讲解
2019/02/01 PHP
php日志函数error_log用法实例分析
2019/09/23 PHP
不要小看注释掉的JS 引起的安全问题
2008/12/27 Javascript
JavaScript实现上下浮动的窗口效果代码
2015/10/12 Javascript
Bootstrap布局之栅格系统详解
2016/06/13 Javascript
bootstrap laydate日期组件使用详解
2017/01/04 Javascript
vue.js项目nginx部署教程
2018/04/05 Javascript
mpvue小程序仿qq左滑置顶删除组件
2018/08/03 Javascript
jQuery实现动态生成年月日级联下拉列表示例
2019/05/11 jQuery
在NodeJs中使用node-schedule增加定时器任务的方法
2020/06/08 NodeJs
Django在win10下的安装并创建工程
2017/11/20 Python
PyCharm代码提示忽略大小写设置方法
2018/10/28 Python
在mac下查找python包存放路径site-packages的实现方法
2018/11/06 Python
pandas的排序和排名的具体使用
2019/07/31 Python
利用Python实现Json序列化库的方法步骤
2020/09/09 Python
需要知道的CSS3动画技术
2010/01/01 HTML / CSS
html5实现图片转圈的动画效果——让页面动起来
2017/10/16 HTML / CSS
eDreams澳大利亚:预订机票、酒店和度假产品
2017/04/19 全球购物
优秀干部获奖感言
2014/01/31 职场文书
演讲稿格式
2014/04/30 职场文书
十佳家长事迹材料
2014/08/26 职场文书
学校四风对照检查材料
2014/08/28 职场文书
《清澈的湖水》教学反思
2016/02/17 职场文书
珍惜时间的诗歌赏析
2019/08/23 职场文书
SQL Server2019数据库之简单子查询的具有方法
2021/04/27 SQL Server
python 如何用terminal输入参数
2021/05/25 Python