基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
rhythmbox中文名乱码问题解决方法
Sep 06 Python
Python2.7 实现引入自己写的类方法
Apr 29 Python
python 获取当天每个准点时间戳的实例
May 22 Python
widows下安装pycurl并利用pycurl请求https地址的方法
Oct 15 Python
python 获取微信好友列表的方法(微信web)
Feb 21 Python
Python 类的魔法属性用法实例分析
Nov 21 Python
详解Python Opencv和PIL读取图像文件的差别
Dec 27 Python
Pytorch技巧:DataLoader的collate_fn参数使用详解
Jan 08 Python
Python基于codecs模块实现文件读写案例解析
May 11 Python
详解Python利用configparser对配置文件进行读写操作
Nov 03 Python
python中lower函数实现方法及用法讲解
Dec 23 Python
Python NumPy灰度图像的压缩原理讲解
Aug 04 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
编写PHP的安全策略
2006/10/09 PHP
让你的WINDOWS同时支持MYSQL4,MYSQL4.1,MYSQL5X
2006/12/06 PHP
PHP正则表达式函数preg_replace用法实例分析
2020/06/04 PHP
jquery 使用点滴函数代码
2011/05/20 Javascript
js实现页面转发功能示例代码
2013/08/05 Javascript
jQuery实现响应浏览器缩放大小并改变背景颜色
2014/10/31 Javascript
js焦点文字滚动效果代码分享
2015/08/25 Javascript
jQuery获取父元素节点、子元素节点及兄弟元素节点的方法
2016/04/14 Javascript
JS控制静态页面传递参数并获取参数应用
2016/08/10 Javascript
深入理解bootstrap框架之第二章整体架构
2016/10/09 Javascript
EditPlus中的正则表达式 实战(4)
2016/12/15 Javascript
jQuery简单实现MD5加密的方法
2017/03/03 Javascript
VUE搭建手机商城心得和遇到的坑
2019/02/21 Javascript
微信小程序 弹窗输入组件的实现解析
2019/08/12 Javascript
微信小程序获取地理位置及经纬度授权代码实例
2019/09/18 Javascript
Vue.js页面中有多个input搜索框如何实现防抖操作
2019/11/04 Javascript
javascript实现获取中文汉字拼音首字母
2020/05/19 Javascript
python自动zip压缩目录的方法
2015/06/28 Python
通过Python实现自动填写调查问卷
2017/09/06 Python
python实现读取大文件并逐行写入另外一个文件
2018/04/19 Python
python 获取一个值在某个区间的指定倍数的值方法
2018/11/12 Python
Python3.6.x中内置函数总结及讲解
2019/02/22 Python
python turtle库画一个方格和圆实例
2019/06/27 Python
Python序列对象与String类型内置方法详解
2019/10/22 Python
python下对hsv颜色空间进行量化操作
2020/06/04 Python
Appium+Python实现简单的自动化登录测试的实现
2021/01/26 Python
中学生自我评价范文
2014/02/08 职场文书
市场营销大学生职业规划书
2014/02/25 职场文书
自我鉴定总结
2014/03/24 职场文书
暑期政治学习心得体会
2014/09/02 职场文书
公司领导班子对照检查材料
2014/09/24 职场文书
大班下学期幼儿评语
2014/12/30 职场文书
婚宴新郎致辞
2015/07/28 职场文书
CSS中Single Div 绘图技巧的实现
2021/06/18 HTML / CSS
bootstrapv4轮播图去除两侧阴影及线框的方法
2022/02/15 HTML / CSS
python index() 与 rindex() 方法的使用示例详解
2022/12/24 Python