基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的数据结构与算法之基本搜索详解
Apr 22 Python
Django与遗留的数据库整合的方法指南
Jul 24 Python
分享一下如何编写高效且优雅的 Python 代码
Sep 07 Python
Python字符编码与函数的基本使用方法
Sep 30 Python
Django在win10下的安装并创建工程
Nov 20 Python
浅谈Python使用Bottle来提供一个简单的web服务
Dec 27 Python
对django中render()与render_to_response()的区别详解
Oct 16 Python
使用python os模块复制文件到指定文件夹的方法
Aug 22 Python
jupyter 导入csv文件方式
Apr 21 Python
获取python运行输出的数据并解析存为dataFrame实例
Jul 07 Python
pytorch中index_select()的用法详解
Jan 06 Python
matplotlib部件之套索Lasso的使用
Feb 24 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
php下过滤HTML代码的函数
2007/12/10 PHP
PHP迅雷、快车、旋风下载专用链转换代码
2010/06/15 PHP
深入php list()函数的详解
2013/06/05 PHP
php 在windows下配置虚拟目录的方法介绍
2013/06/26 PHP
一组PHP加密解密函数分享
2014/06/05 PHP
关于Javascript 的 prototype问题。
2007/01/03 Javascript
6款新颖的jQuery和CSS3进度条插件推荐
2013/03/05 Javascript
javascript函数声明和函数表达式区别分析
2014/12/02 Javascript
javascript实时显示北京时间的方法
2015/03/12 Javascript
讲解JavaScript中for...in语句的使用方法
2015/06/03 Javascript
jQuery.Callbacks()回调函数队列用法详解
2016/06/14 Javascript
JS实现iframe自适应高度的方法示例
2017/01/07 Javascript
vue router仿天猫底部导航栏功能
2017/10/18 Javascript
Javascript实现动态时钟效果
2018/11/17 Javascript
JavaScript剩余操作符Rest Operator详解
2019/07/20 Javascript
javascript中call,apply,callee,caller用法实例分析
2019/07/24 Javascript
Vue可自定义tab组件用法实例
2019/10/24 Javascript
js实现自动播放匀速轮播图
2020/02/06 Javascript
vue中实现动态生成二维码的方法
2020/02/21 Javascript
[52:37]完美世界DOTA2联赛循环赛 Forest vs DM BO2第一场 10.29
2020/10/29 DOTA
python 不关闭控制台的实现方法
2011/10/23 Python
Python验证码识别处理实例
2015/12/28 Python
Python创建字典的八种方式
2019/02/27 Python
Python模块、包(Package)概念与用法分析
2019/05/31 Python
Windows10下Tensorflow2.0 安装及环境配置教程(图文)
2019/11/21 Python
TensorFLow 不同大小图片的TFrecords存取实例
2020/01/20 Python
获取CSDN文章内容并转换为markdown文本的python
2020/09/06 Python
HTML5验证以及日期显示的实现详解
2013/07/05 HTML / CSS
英国在线照明超市:Castlegate Lights
2019/10/30 全球购物
班组长安全职责
2014/01/05 职场文书
档案检查欢迎词
2014/01/13 职场文书
八年级数学教学反思
2014/01/31 职场文书
珍惜资源保护环境的建议书
2014/05/14 职场文书
邻里守望志愿服务活动方案
2014/08/15 职场文书
幼儿园法制宣传日活动总结
2014/11/01 职场文书
简短的人生哲理(38句)
2019/08/13 职场文书