基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
深度剖析使用python抓取网页正文的源码
Jun 11 Python
详解Python中映射类型(字典)操作符的概念和使用
Aug 19 Python
基于python yield机制的异步操作同步化编程模型
Mar 18 Python
Python错误: SyntaxError: Non-ASCII character解决办法
Jun 08 Python
hmac模块生成加入了密钥的消息摘要详解
Jan 11 Python
pandas 两列时间相减换算为秒的方法
Apr 20 Python
解决pycharm运行程序出现卡住scanning files to index索引的问题
Jun 27 Python
python将print输出的信息保留到日志文件中
Sep 27 Python
Pycharm debug调试时带参数过程解析
Feb 03 Python
Python爬虫获取豆瓣电影并写入excel
Jul 31 Python
Python 中如何使用 virtualenv 管理虚拟环境
Jan 21 Python
pycharm配置安装autopep8自动规范代码的实现
Mar 02 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
一个PHP模板,主要想体现一下思路
2006/12/25 PHP
php使用百度ping服务代码实例
2014/06/19 PHP
PHP基于php_imagick_st-Q8.dll实现JPG合成GIF图片的方法
2014/07/11 PHP
详解Laravel视图间共享数据与视图Composer
2016/08/04 PHP
PHP中危险的file_put_contents函数详解
2017/11/04 PHP
Jquery中$.get(),$.post(),$.ajax(),$.getJSON()的用法总结
2013/11/14 Javascript
js几秒以后倒计时跳转示例
2013/12/26 Javascript
sogou地图API用法实例教程
2014/09/11 Javascript
setTimeout内不支持jquery的选择器的解决方案
2015/04/28 Javascript
jquery.cookie实现的客户端购物车操作实例
2015/12/24 Javascript
Javascript中Date类型和Math类型详解
2016/02/27 Javascript
Angularjs实现多个页面共享数据的方式
2016/03/29 Javascript
AngularJS 单元测试(一)详解
2016/09/21 Javascript
浅谈Javascript中的函数、this以及原型
2016/10/09 Javascript
JavaScript 监控微信浏览器且自带返回按钮时间
2016/11/27 Javascript
jQuery EasyUi 验证功能实例解析
2017/01/06 Javascript
JavaScript监听手机物理返回键的两种解决方法
2017/08/14 Javascript
Angularjs中数据绑定的实例详解
2017/08/25 Javascript
区别JavaScript函数声明与变量声明
2018/09/12 Javascript
小程序Request的另类用法详解
2019/08/09 Javascript
微信小程序自定义底部弹出框动画
2020/11/18 Javascript
flask + pymysql操作Mysql数据库的实例
2017/11/13 Python
pygame游戏之旅 创建游戏窗口界面
2018/11/20 Python
Python之Matplotlib文字与注释的使用方法
2020/06/18 Python
使用darknet框架的imagenet数据分类预训练操作
2020/07/07 Python
pycharm配置python 设置pip安装源为豆瓣源
2021/02/05 Python
CSS实现进度条和订单进度条的示例
2020/11/05 HTML / CSS
什么是View State?
2013/01/27 面试题
MIS软件工程师的面试题
2016/04/22 面试题
巾帼志愿者活动方案
2014/08/17 职场文书
党员批评与自我批评发言
2014/10/02 职场文书
银行客户经理岗位职责
2015/04/09 职场文书
入伍通知书
2015/04/23 职场文书
企业党员岗位承诺书
2015/04/27 职场文书
无犯罪记录证明样本
2015/06/16 职场文书
护士医德医风心得体会
2016/01/25 职场文书