基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用turtle库绘制时钟
Mar 25 Python
python使用pdfminer解析pdf文件的方法示例
Dec 20 Python
Python集中化管理平台Ansible介绍与YAML简介
Jun 12 Python
Pandas 重塑(stack)和轴向旋转(pivot)的实现
Jul 22 Python
python中的subprocess.Popen()使用详解
Dec 25 Python
详解python常用命令行选项与环境变量
Feb 20 Python
Python Pandas 对列/行进行选择,增加,删除操作
May 17 Python
Keras在训练期间可视化训练误差和测试误差实例
Jun 16 Python
Python基础之常用库常用方法整理
Apr 30 Python
Python实现随机生成迷宫并自动寻路
Jun 13 Python
python Django框架快速入门教程(后台管理)
Jul 21 Python
Python+Matplotlib图像上指定坐标的位置添加文本标签与注释
Apr 11 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
php输入流php://input使用浅析
2014/09/02 PHP
PHP的PDO大对象(LOBs)
2019/01/27 PHP
网页中返回顶部代码(多种方法)另附注释说明
2013/04/24 Javascript
jquery简单的拖动效果实现原理及示例
2013/07/26 Javascript
巧用局部变量提升javascript性能
2014/02/24 Javascript
javascript判断移动端访问设备并解析对应CSS的方法
2015/02/05 Javascript
JavaScript使用ActiveXObject访问Access和SQL Server数据库
2015/04/02 Javascript
跟我学习javascript的prototype使用注意事项
2015/11/17 Javascript
JS中递归函数
2016/06/17 Javascript
jquery注册文本框获取焦点清空,失去焦点赋值的简单实例
2016/09/08 Javascript
Avalonjs 实现简单购物车功能(实例代码)
2017/02/07 Javascript
微信小程序 wx.login解密出现乱码的问题解决办法
2017/03/10 Javascript
详解nodejs实现本地上传图片并预览功能(express4.0+)
2017/06/28 NodeJs
Vue2.0利用vue-resource上传文件到七牛的实例代码
2017/07/28 Javascript
vue-cli如何引入bootstrap工具的方法
2017/10/19 Javascript
分享vue.js devtools遇到一系列问题
2017/10/24 Javascript
AngularJS实现的获取焦点及失去焦点时的表单验证功能示例
2017/10/25 Javascript
Vue路由守卫及页面登录权限控制的设置方法(两种)
2020/03/31 Javascript
[02:40]DOTA2殁境神蚀者 英雄基础教程
2013/11/26 DOTA
[47:36]Optic vs Newbee 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/18 DOTA
Python列表推导式的使用方法
2013/11/21 Python
在GitHub Pages上使用Pelican搭建博客的教程
2015/04/25 Python
Python卸载模块的方法汇总
2016/06/07 Python
wxPython之解决闪烁的问题
2018/01/15 Python
Python用61行代码实现图片像素化的示例代码
2018/12/10 Python
python tkinter canvas 显示图片的示例
2019/06/13 Python
神经网络训练采用gpu设置的方式
2021/03/03 Python
打架检讨书100字
2014/01/19 职场文书
2015年元旦联欢晚会活动总结
2014/11/28 职场文书
材料采购员岗位职责
2015/04/03 职场文书
2015年行政工作总结范文
2015/04/09 职场文书
三八节祝酒词
2015/08/11 职场文书
党风廉洁教育心得体会
2016/01/20 职场文书
再见,2019我们不负使命;你好,2020我们砥砺前行
2020/01/03 职场文书
英国数字版游戏销量周榜公布 《小缇娜的奇幻之地》登顶
2022/04/03 其他游戏
Java+swing实现抖音上的表白程序详解
2022/06/25 Java/Android