基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python两个整数相除得到浮点数值的方法
Mar 18 Python
简单的Python2.7编程初学经验总结
Apr 01 Python
Python实现豆瓣图片下载的方法
May 25 Python
在unittest中使用 logging 模块记录测试数据的方法
Nov 30 Python
基于django channel实现websocket的聊天室的方法示例
Apr 11 Python
Pandas 重塑(stack)和轴向旋转(pivot)的实现
Jul 22 Python
如何使用python3获取当前路径及os.path.dirname的使用
Dec 13 Python
python psutil监控进程实例
Dec 17 Python
pygame实现飞机大战
Mar 11 Python
Python约瑟夫生者死者小游戏实例讲解
Jan 04 Python
python里glob模块知识点总结
Jan 05 Python
python自动化调用百度api解决验证码
Apr 13 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
Laravel 5.0 发布 新版本特性详解
2015/02/10 PHP
php检测mysql表是否存在的方法小结
2017/07/20 PHP
js操作ajax返回的json的注意问题!
2010/02/23 Javascript
使用jquery制作弹出框效果
2015/04/03 Javascript
jQuery实现的淡入淡出二级菜单效果代码
2015/09/15 Javascript
Eclipse编辑jsp、js文件时卡死现象的解决办法汇总
2016/02/02 Javascript
jQuery组件easyui基本布局实现代码
2016/08/25 Javascript
bootstrap datepicker限定可选时间范围实现方法
2016/09/28 Javascript
学习Node.js模块机制
2016/10/17 Javascript
AngularJS实现DOM元素的显示与隐藏功能
2016/11/22 Javascript
微信扫码支付零云插件版实例详解
2017/04/26 Javascript
JS实现点击Radio动态更新table数据
2017/07/18 Javascript
解决VUE框架 导致绑定事件的阻止冒泡失效问题
2018/02/24 Javascript
vue指令只能输入正数并且只能输入一个小数点的方法
2018/06/08 Javascript
node链接mongodb数据库的方法详解【阿里云服务器环境ubuntu】
2019/03/07 Javascript
element-ui组件中input等的change事件中传递自定义参数
2019/05/22 Javascript
详解解决小程序中webview页面多层history返回问题
2019/08/20 Javascript
vue h5移动端禁止缩放代码
2019/10/28 Javascript
Python UnicodeEncodeError: 'gbk' codec can't encode character 解决方法
2015/04/24 Python
python利用拉链法实现字典方法示例
2017/03/25 Python
VScode编写第一个Python程序HelloWorld步骤
2018/04/06 Python
Django ManyToManyField 跨越中间表查询的方法
2018/12/18 Python
Python面向对象之类的定义与继承用法示例
2019/01/14 Python
对Django项目中的ORM映射与模糊查询的使用详解
2019/07/18 Python
把django中admin后台界面的英文修改为中文显示的方法
2019/07/26 Python
keras处理欠拟合和过拟合的实例讲解
2020/05/25 Python
html5中canvas图表实现柱状图的示例
2017/11/13 HTML / CSS
html5跳转小程序wx-open-launch-weapp踩坑
2020/12/02 HTML / CSS
美国精品家居用品网站:US-Mattress
2016/08/24 全球购物
李维斯德国官方网上商店:Levi’s德国
2016/09/10 全球购物
汽车电子与维修专业大学生求职信
2013/09/28 职场文书
初中校园之声广播稿
2014/01/15 职场文书
学校师德师风自我剖析材料
2014/09/29 职场文书
升学宴答谢词
2015/01/05 职场文书
入党申请书怎么写?
2019/06/11 职场文书
Java面试题冲刺第十九天--数据库(4)
2021/08/07 Java/Android