pandas使用get_dummies进行one-hot编码的方法


Posted in Python onJuly 10, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])
 
df.columns = ['color', 'size', 'prize', 'class label']
 
size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)
 
class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{'XL':3,'L':2,'M':1}

pandas使用get_dummies进行one-hot编码的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot编码
pd.get_dummies(df)

pandas使用get_dummies进行one-hot编码的方法

以上这篇pandas使用get_dummies进行one-hot编码的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python+Splinter自动刷新抢12306火车票
Jan 03 Python
python web基础之加载静态文件实例
Mar 20 Python
终端命令查看TensorFlow版本号及路径的方法
Jun 13 Python
ActiveMQ:使用Python访问ActiveMQ的方法
Jan 30 Python
Django 框架模型操作入门教程
Nov 05 Python
selenium中get_cookies()和add_cookie()的用法详解
Jan 06 Python
Python统计学一数据的概括性度量详解
Mar 03 Python
Python3批量创建Crowd用户并分配组
May 20 Python
如何写python的配置文件
Jun 07 Python
python3爬虫中异步协程的用法
Jul 10 Python
Python的collections模块真的很好用
Mar 01 Python
Python爬取某拍短视频
Jun 11 Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
Python Dataframe 指定多列去重、求差集的方法
Jul 10 #Python
Python实现对文件进行单词划分并去重排序操作示例
Jul 10 #Python
You might like
免费的ip数据库淘宝IP地址库简介和PHP调用实例
2014/04/08 PHP
php的SimpleXML方法读写XML接口文件实例解析
2014/06/16 PHP
ThinkPHP实现批量删除数据的代码实例
2014/07/02 PHP
PHP中in_array的隐式转换的解决方法
2018/03/06 PHP
实例讲解PHP表单
2020/06/10 PHP
Node.js生成HttpStatusCode辅助类发布到npm
2013/04/09 Javascript
jquery统计用户选中的复选框的个数
2014/06/06 Javascript
深入理解JavaScript系列(46):代码复用模式(推荐篇)详解
2015/03/04 Javascript
JavaScript模版引擎的基本实现方法浅析
2016/02/15 Javascript
第二次聊一聊JS require.js模块化工具的基础知识
2016/04/17 Javascript
利用node.js搭建简单web服务器的方法教程
2017/02/20 Javascript
JQuery和html+css实现带小圆点和左右按钮的轮播图实例
2017/07/22 jQuery
bmob js-sdk 在vue中的使用教程
2018/01/21 Javascript
vue.js使用v-model指令实现的数据双向绑定功能示例
2018/05/22 Javascript
对angular4子路由&辅助路由详解
2018/10/09 Javascript
Node.js的进程管理的深入理解
2019/01/09 Javascript
小程序实现列表多个批量倒计时
2021/01/29 Javascript
Vuex中实现数据状态查询与更改
2019/11/08 Javascript
浅谈vue单页面中有多个echarts图表时的公用代码写法
2020/07/19 Javascript
Javascript如何递归遍历本地文件夹
2020/08/06 Javascript
[13:16]INFAMOUS vs VGJ T BO3
2018/06/07 DOTA
Python常见字符串操作函数小结【split()、join()、strip()】
2018/02/02 Python
Python测试人员需要掌握的知识
2018/02/08 Python
Pycharm 操作Django Model的简单运用方法
2018/05/23 Python
Python wxPython库Core组件BoxSizer用法示例
2018/09/03 Python
解决Python 命令行执行脚本时,提示导入的包找不到的问题
2019/01/19 Python
pycharm 2019 最新激活方式(pycharm破解、激活)
2020/09/22 Python
Python collections模块的使用方法
2020/10/09 Python
HTML5之WebGL 3D概述(上)—WebGL原生开发开启网页3D渲染新时代
2013/01/31 HTML / CSS
美国Jeep配件购物网站:Morris 4×4 Center
2019/05/01 全球购物
世界经理人咨询有限公司面试
2014/09/23 面试题
Linux开机引导的步骤是什么
2014/02/26 面试题
数学国培研修感言
2014/02/13 职场文书
设备收款委托书范本
2014/10/02 职场文书
2016年党员读书月活动总结
2016/04/06 职场文书
写一个Python脚本下载哔哩哔哩舞蹈区的所有视频
2021/05/31 Python