基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python连接池实现示例程序
Nov 26 Python
Python入门篇之函数
Oct 20 Python
Python基于有道实现英汉字典功能
Jul 25 Python
django创建自定义模板处理器的实例详解
Aug 14 Python
Python编程之gui程序实现简单文件浏览器代码
Dec 08 Python
python中将\\uxxxx转换为Unicode字符串的方法
Sep 06 Python
在python 不同时区之间的差值与转换方法
Jan 14 Python
python求平均数、方差、中位数的例子
Aug 22 Python
python将字典列表导出为Excel文件的方法
Sep 02 Python
TensorFlow实现批量归一化操作的示例
Apr 22 Python
python3实现将json对象存入Redis以及数据的导入导出
Jul 16 Python
Python爬虫进阶之Beautiful Soup库详解
Apr 29 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
php结合飞信 免费天气预报短信
2009/05/07 PHP
php 转换字符串编码 iconv与mb_convert_encoding的区别说明
2011/11/10 PHP
解决文件名解压后乱码的问题 将文件名进行转码的代码
2012/01/10 PHP
ThinkPHP的模版中调用session数据的方法
2014/07/01 PHP
PHP7新特性foreach 修改示例介绍
2016/08/26 PHP
php array_walk_recursive 使用自定的函数处理数组中的每一个元素
2016/11/16 PHP
Thinkphp 框架扩展之类库扩展操作详解
2020/04/23 PHP
PHP rsa加密解密算法原理解析
2020/12/09 PHP
转一个日期输入控件,支持FF
2007/04/27 Javascript
jQuery-ui中自动完成实现方法
2010/06/10 Javascript
jquery常用特效方法使用示例
2014/04/25 Javascript
基于NodeJS的前后端分离的思考与实践(六)Nginx + Node.js + Java 的软件栈部署实践
2014/09/26 NodeJs
网站基于flash实现的Banner图切换效果代码
2014/10/14 Javascript
JS实现点击按钮后框架内载入不同网页的方法
2015/05/05 Javascript
理解javascript中的严格模式
2016/02/01 Javascript
BootStrap实现响应式布局导航栏折叠隐藏效果(在小屏幕、手机屏幕浏览时自动折叠隐藏)
2016/11/30 Javascript
基于Vue实现timepicker
2017/04/25 Javascript
Node.JS段点续传:Nginx配置文件分段下载功能的实现方法
2018/03/12 Javascript
Python实现动态加载模块、类、函数的方法分析
2017/07/18 Python
python 计算一个字符串中所有数字的和实例
2019/06/11 Python
Python动态导入模块:__import__、importlib、动态导入的使用场景实例分析
2020/03/30 Python
python模拟哔哩哔哩滑块登入验证的实现
2020/04/24 Python
python中numpy.empty()函数实例讲解
2021/02/05 Python
Smallable英国家庭概念店:设计师童装及家居装饰
2017/07/05 全球购物
英国电子专家:maplin
2019/09/04 全球购物
Android面试宝典
2013/08/06 面试题
大一自我鉴定范文
2013/10/04 职场文书
毕业自荐信
2013/12/16 职场文书
文字自荐书范文
2014/02/10 职场文书
保密承诺书
2014/03/27 职场文书
王兆力在市委党的群众路线教育实践活动总结大会上的讲话稿
2014/10/25 职场文书
群众路线学习心得体会范文
2014/11/05 职场文书
2014年学校团委工作总结
2014/12/20 职场文书
车间主任岗位职责范本
2015/04/08 职场文书
2015年七夕情人节活动方案
2015/05/06 职场文书
台式电脑蓝牙适配器怎么安装?台式电脑蓝牙适配器安装教程
2022/04/08 数码科技