pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python读取键盘输入的2种方法
Jun 16 Python
Python读取和处理文件后缀为.sqlite的数据文件(实例讲解)
Jun 27 Python
sublime python3 输入换行不结束的方法
Apr 19 Python
使用TensorFlow实现二分类的方法示例
Feb 05 Python
pyqt5实现绘制ui,列表窗口,滚动窗口显示图片的方法
Jun 20 Python
python实现图片中文字分割效果
Jul 22 Python
python如何实现不用装饰器实现登陆器小程序
Dec 14 Python
Python3将ipa包中的文件按大小排序
Apr 17 Python
tensorflow模型转ncnn的操作方式
May 25 Python
python Scrapy框架原理解析
Jan 04 Python
python 指定源路径来解决import问题的操作
Mar 04 Python
使用pd.merge表连接出现多余行的问题解决
Jun 16 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
php 文件缓存函数
2011/10/08 PHP
PHP 输出缓冲控制(Output Control)详解
2016/08/25 PHP
php web环境和命令行环境下查找php.ini的位置
2019/07/17 PHP
tp5.1 框架查询表达式用法详解
2020/05/25 PHP
JQuery 选项卡效果(JS与HTML的分离)
2010/04/01 Javascript
Js setInterval与setTimeout(定时执行与循环执行)的代码(可以传入参数)
2010/06/11 Javascript
js有序数组的连接问题
2013/10/01 Javascript
通过Javascript读取本地Excel文件内容的代码示例
2014/04/08 Javascript
javascript中in运算符用法分析
2015/04/28 Javascript
js图片轮播特效代码分享
2015/09/07 Javascript
js创建jsonArray传输至后台及后台全面解析
2016/04/11 Javascript
angularjs封装$http为factory的方法
2017/05/18 Javascript
ES6中Array.copyWithin()函数的用法实例详解
2017/09/16 Javascript
Vue2.5通过json文件读取数据的方法
2018/02/27 Javascript
JS判断字符串是否为整数的方法--简单的正则判断
2018/07/23 Javascript
详解Vue.js v-for不支持IE9的解决方法
2018/12/29 Javascript
详解vue的数据劫持以及操作数组的坑
2019/04/18 Javascript
微信小程序之侧边栏滑动实现过程解析(附完整源码)
2019/08/23 Javascript
JavaScript Reflect Metadata实现详解
2019/12/12 Javascript
vue绑定class的三种方法
2020/12/24 Vue.js
[14:36]2014 DOTA2国际邀请赛中国区预选赛5.21 Orenda VS NE
2014/05/22 DOTA
python3实现表白神器
2019/04/09 Python
一行Python代码制作动态二维码的实现
2019/09/09 Python
canvas与html5实现视频截图功能示例
2016/12/15 HTML / CSS
美国汽车交易网站:Edmunds
2016/08/17 全球购物
标签和贴纸印刷:Lightning Labels
2018/03/22 全球购物
什么是ESB?请介绍一下ESB?
2015/05/27 面试题
销售演讲稿范文
2014/01/08 职场文书
新课培训心得体会
2014/09/03 职场文书
2014镇党委班子对照检查材料思想汇报
2014/09/23 职场文书
缓刑期间思想汇报范文
2014/10/10 职场文书
2014年军人思想汇报范文
2014/10/12 职场文书
幼儿园开学通知
2015/04/24 职场文书
小平小道观后感
2015/06/09 职场文书
Python标准库之typing的用法(类型标注)
2021/06/02 Python
SSM VUE Axios详解
2021/10/05 Vue.js