基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python调用shell的方法
Nov 20 Python
Python Web开发模板引擎优缺点总结
May 06 Python
Flask框架学习笔记(一)安装篇(windows安装与centos安装)
Jun 25 Python
python批量制作雷达图的实现方法
Jul 26 Python
Python浅复制中对象生存周期实例分析
Apr 02 Python
在PyCharm环境中使用Jupyter Notebook的两种方法总结
May 24 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 Python
python config文件的读写操作示例
Sep 27 Python
python+Django实现防止SQL注入的办法
Oct 31 Python
Python tensorflow实现mnist手写数字识别示例【非卷积与卷积实现】
Dec 19 Python
PyTorch-GPU加速实例
Jun 23 Python
Anaconda使用IDLE的实现示例
Sep 23 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
PHP基本语法实例总结
2016/09/09 PHP
用cookies实现的可记忆的样式切换效果代码下载
2007/12/24 Javascript
类似CSDN图片切换效果脚本
2009/09/17 Javascript
JavaScript将相对地址转换为绝对地址示例代码
2013/07/19 Javascript
js控制浏览器全屏示例代码
2014/02/20 Javascript
JS实现在页面随时自定义背景颜色的方法
2015/02/27 Javascript
javascript实现表格增删改操作实例详解
2015/05/15 Javascript
javascript实现五星评分功能
2015/11/10 Javascript
js判断请求的url是否可访问,支持跨域判断的实现方法
2016/09/17 Javascript
jQuery特殊符号转义的实现
2016/11/30 Javascript
简单谈谈gulp-changed插件
2017/02/21 Javascript
JavaScript选取(picking)和反选(rejecting)对象的属性方法
2017/08/16 Javascript
webpack本地开发环境无法用IP访问的解决方法
2018/03/20 Javascript
javacript replace 正则取字符串中的值并替换【推荐】
2018/09/13 Javascript
vue 使用vue-i18n做全局中英文切换的方法
2018/10/29 Javascript
keep-alive不能缓存多层级路由菜单问题解决
2020/03/10 Javascript
vue-cli3自动消除console.log()的调试信息方式
2020/10/21 Javascript
[02:44]2014DOTA2 国际邀请赛中国区预选赛 大神红毯秀
2014/05/25 DOTA
python装饰器使用方法实例
2013/11/21 Python
Python查看多台服务器进程的脚本分享
2014/06/11 Python
Python抓取京东图书评论数据
2014/08/31 Python
sublime text 3配置使用python操作方法
2017/06/11 Python
python2.7 mayavi 安装图文教程(推荐)
2017/06/22 Python
利用ctypes获取numpy数组的指针方法
2019/02/12 Python
对PyQt5中的菜单栏和工具栏实例详解
2019/06/20 Python
解析HTML5中的新功能本地存储localStorage
2016/03/01 HTML / CSS
英国领先的男装设计师服装购物网站:Mainline Menswear
2018/02/04 全球购物
Turnbull & Asser官网:英国皇室御用的顶级定制衬衫
2019/01/31 全球购物
哈萨克斯坦最大的时装、鞋子和配饰在线商店:Lamoda.kz
2019/11/19 全球购物
葛优非诚勿扰搞笑征婚台词
2014/03/17 职场文书
2015年纪检监察工作总结
2015/04/08 职场文书
关于车尾的标语大全
2015/08/11 职场文书
利用html+css实现菜单栏缓慢下拉效果的示例代码
2021/03/30 HTML / CSS
MySql新手入门的基本操作汇总
2021/05/13 MySQL
nginx服务器的下载安装与使用详解
2021/08/02 Servers
css如何把元素固定在容器底部的四种方式
2022/06/16 HTML / CSS