基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python批量下载图片的三种方法
Apr 22 Python
python实现360皮肤按钮控件示例
Feb 21 Python
Python实现删除Android工程中的冗余字符串
Jan 19 Python
在Python中处理时间之clock()方法的使用
May 22 Python
详解duck typing鸭子类型程序设计与Python的实现示例
Jun 03 Python
用Python下载一个网页保存为本地的HTML文件实例
May 21 Python
详解Python最长公共子串和最长公共子序列的实现
Jul 07 Python
Python 给屏幕打印信息加上颜色的实现方法
Apr 24 Python
python调用pyaudio使用麦克风录制wav声音文件的教程
Jun 26 Python
python pandas移动窗口函数rolling的用法
Feb 29 Python
Python Selenium 设置元素等待的三种方式
Mar 18 Python
python如何使用腾讯云发送短信
Sep 17 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
javascript,php获取函数参数对象的代码
2011/02/03 PHP
基于PHP的cURL快速入门教程 (小偷采集程序)
2011/06/02 PHP
解析php DOMElement 操作xml 文档的实现代码
2013/05/10 PHP
使用session判断用户登录用户权限(超简单)
2013/06/08 PHP
深入理解PHP中的global
2014/08/19 PHP
php自动给网址加上链接的方法
2015/06/02 PHP
php正则去除网页中所有的html,js,css,注释的实现方法
2016/11/03 PHP
php获取网站根目录物理路径的几种方法(推荐)
2017/03/04 PHP
ThinkPHP下表单令牌错误与解决方法分析
2017/05/20 PHP
Thinkphp 框架扩展之应用模式实现方法分析
2020/04/27 PHP
基于jquery的表头固定的若干方法
2011/01/27 Javascript
js 动态加载事件的几种方法总结
2013/12/25 Javascript
javascript回车完美实现tab切换功能
2014/03/13 Javascript
moment.js轻松实现获取当前日期是当年的第几周
2015/02/05 Javascript
跟我学习javascript的prototype原型和原型链
2015/11/18 Javascript
javascript 常用验证函数总结
2016/06/28 Javascript
jquery动态遍历Json对象的属性和值的方法
2016/07/27 Javascript
js实现图片360度旋转
2017/01/22 Javascript
JS解决IOS中拍照图片预览旋转90度BUG的问题
2017/09/13 Javascript
vue.js给动态绑定的radio列表做批量编辑的方法
2018/02/28 Javascript
layui获取选中行数据的实例讲解
2018/08/19 Javascript
JavaScript数组特性与实践应用深入详解
2018/12/30 Javascript
Vue时间轴 vue-light-timeline的用法说明
2020/10/29 Javascript
Python的ORM框架SQLObject入门实例
2014/04/28 Python
python处理文本文件实现生成指定格式文件的方法
2014/07/31 Python
利用Python实现kNN算法的代码
2019/08/16 Python
CSS3 新增选择器的实例
2019/11/13 HTML / CSS
Ootori在线按摩椅店:一家专业的按摩椅制造商
2019/04/10 全球购物
女大学生毕业找工作的自我评价
2013/10/03 职场文书
2013的个人自我评价
2013/12/26 职场文书
幼儿园中班教学反思
2014/02/10 职场文书
党支部四风整改方案
2014/10/25 职场文书
初二学生评语大全
2014/12/26 职场文书
初中毕业生自我评价
2015/03/02 职场文书
年度考核表个人总结
2015/03/06 职场文书
python中subplot大小的设置步骤
2021/06/28 Python