基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python中操作时间之strptime()方法的使用
Dec 30 Python
关于pip的安装,更新,卸载模块以及使用方法(详解)
May 19 Python
浅谈python中np.array的shape( ,)与( ,1)的区别
Jun 04 Python
在Django下测试与调试REST API的方法详解
Aug 29 Python
python+selenium 点击单选框-radio的实现方法
Sep 03 Python
YUV转为jpg图像的实现
Dec 09 Python
python梯度下降算法的实现
Feb 24 Python
Django跨域资源共享问题(推荐)
Mar 09 Python
Keras使用ImageNet上预训练的模型方式
May 23 Python
django美化后台django-suit的安装配置操作
Jul 12 Python
关于Kotlin中SAM转换的那些事
Sep 15 Python
Python 随机按键模拟2小时
Dec 30 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
php数据类型判断函数有哪些
2013/09/23 PHP
深入浅析Yii admin的权限控制
2016/08/31 PHP
PHP入门教程之字符串处理技巧总结(转换,过滤,解析,查找,截取,替换等)
2016/09/11 PHP
php根据用户名和手机号查询是否存在手机号码
2017/02/16 PHP
golang实现php里的serialize()和unserialize()序列和反序列方法详解
2018/10/30 PHP
php数组函数array_push()、array_pop()及array_shift()简单用法示例
2020/01/26 PHP
如何让动态插入的javascript脚本代码跑起来。
2007/01/09 Javascript
javascript下对于事件、事件流、事件触发的顺序随便说说
2010/07/17 Javascript
jQuery UI AutoComplete 使用说明
2011/06/20 Javascript
深入理解JavaScript系列(12) 变量对象(Variable Object)
2012/01/16 Javascript
ExtJS 刷新后如何默认选中刷新前最后一次选中的节点
2014/04/03 Javascript
javascript 原型链维护和继承详解
2014/11/26 Javascript
js实现下拉框选择要显示图片的方法
2015/02/16 Javascript
JavaScript中数组的合并以及排序实现示例
2015/10/24 Javascript
JavaScript 继承详解(五)
2016/10/11 Javascript
js实现字符全排列算法的简单方法
2017/05/01 Javascript
使用淘宝镜像cnpm安装Vue.js的图文教程
2018/05/17 Javascript
基于Electron实现桌面应用开发代码实例
2020/07/07 Javascript
关于better-scroll插件的无法滑动bug(2021通过插件解决)
2021/03/01 Javascript
[04:56]经典回顾:前Ehome 与 前LGD
2015/02/26 DOTA
忘记ftp密码使用python ftplib库暴力破解密码的方法示例
2014/01/22 Python
Python写的Socks5协议代理服务器
2014/08/06 Python
Python中encode()方法的使用简介
2015/05/18 Python
Python的dict字典结构操作方法学习笔记
2016/05/07 Python
numpy的文件存储.npy .npz 文件详解
2018/07/09 Python
使用python绘制3维正态分布图的方法
2018/12/29 Python
Python redis操作实例分析【连接、管道、发布和订阅等】
2019/05/16 Python
Python字符串处理的8招秘籍(小结)
2019/08/13 Python
python基于socket函数实现端口扫描
2020/05/28 Python
使用Keras预训练好的模型进行目标类别预测详解
2020/06/27 Python
Python3实现英文字母转换哥特式字体实例代码
2020/09/01 Python
Ted Baker美国官网:英国时尚品牌
2018/10/29 全球购物
澳大利亚排名第一的狂热牛仔品牌:ONETEASPOON
2018/11/20 全球购物
娇韵诗香港官网:Clarins香港
2020/08/13 全球购物
公司营业员的自我评价
2014/03/04 职场文书
教师自我剖析材料
2014/09/29 职场文书