基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python中bisect模块用法实例
Sep 25 Python
python实现人脸识别代码
Nov 08 Python
解决Python3 控制台输出InsecureRequestWarning问题
Jul 15 Python
python中append实例用法总结
Jul 30 Python
python网络编程之多线程同时接受和发送
Sep 03 Python
Django之路由层的实现
Sep 09 Python
python中对_init_的理解及实例解析
Oct 11 Python
使用jupyter notebook直接打开.md格式的文件
Apr 10 Python
Python requests及aiohttp速度对比代码实例
Jul 16 Python
为什么说python更适合树莓派编程
Jul 20 Python
浅析PyCharm 的初始设置(知道)
Oct 12 Python
Python爬虫基础初探selenium
May 31 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
咖啡店都有些什么常规豆子呢?有什么风味在里面
2021/03/04 咖啡文化
《PHP编程最快明白》第七讲:php图片验证码与缩略图
2010/11/01 PHP
美图秀秀web开放平台--PHP流式上传和表单上传示例分享
2014/06/22 PHP
PHP获取文件夹大小函数用法实例
2015/07/01 PHP
Yii框架表单模型和验证用法
2016/05/20 PHP
php实现的XML操作(读取)封装类完整实例
2017/02/23 PHP
jquery 弹出层注册页面等(asp.net后台)
2010/06/17 Javascript
js里取容器大小、定位、距离等属性搜集整理
2013/08/19 Javascript
轻松掌握JavaScript享元模式
2016/08/27 Javascript
微信小程序 参数传递详解
2016/10/24 Javascript
JS实现焦点图轮播效果的方法详解
2016/12/19 Javascript
微信小程序 支付功能开发错误总结
2017/02/21 Javascript
浅谈微信小程序之官方UI框架we-ui使用教程
2018/08/20 Javascript
axios 封装上传文件的请求方法
2018/09/26 Javascript
命令行批量截图Node脚本示例代码
2019/01/25 Javascript
如何在JavaScript中谨慎使用代码注释
2019/06/21 Javascript
vue实现移动端触屏拖拽功能
2020/08/21 Javascript
详解Python中heapq模块的用法
2016/06/28 Python
wxpython中自定义事件的实现与使用方法分析
2016/07/21 Python
通过python3实现投票功能代码实例
2019/09/26 Python
python 在sql语句中使用%s,%d,%f说明
2020/06/06 Python
django 实现后台从富文本提取纯文本
2020/07/02 Python
澳大利亚领先的在线美容商城:Adore Beauty
2017/04/14 全球购物
Waterford美国官网:爱尔兰水晶制品品牌
2017/04/26 全球购物
美国波道夫·古德曼百货官网:Bergdorf Goodman
2017/11/07 全球购物
我们是伦敦女孩:WalG
2018/01/08 全球购物
Cinque网上商店:德国服装品牌
2019/03/17 全球购物
决定成败的关键——创业计划书
2014/01/24 职场文书
本溪关门山导游词
2015/02/09 职场文书
学校光盘行动倡议书
2015/04/28 职场文书
2015年乡镇党务公开工作总结
2015/05/19 职场文书
2019大学生实习报告
2019/06/21 职场文书
聊聊Python中关于a=[[]]*3的反思
2021/06/02 Python
mysql定时自动备份数据库的方法步骤
2021/07/07 MySQL
Redis超详细讲解高可用主从复制基础与哨兵模式方案
2022/04/07 Redis
解决vue自定义组件@click点击失效问题
2022/04/30 Vue.js