基于pandas将类别属性转化为数值属性的方法


Posted in Python onJuly 25, 2018

离散特征的编码分为两种情况:

1、离散特征的取值之间没有大小的意义,比如color:[red,blue],那么就使用one-hot编码

2、离散特征的取值有大小的意义,比如size:[X,XL,XXL],那么就使用数值的映射{X:1,XL:2,XXL:3}

使用pandas可以很方便的对离散型特征进行one-hot编码

import pandas as pd
df = pd.DataFrame([
   ['green', 'M', 10.1, 'class1'], 
   ['red', 'L', 13.5, 'class2'], 
   ['blue', 'XL', 15.3, 'class1']])

df.columns = ['color', 'size', 'prize', 'class label']

size_mapping = {
   'XL': 3,
   'L': 2,
   'M': 1}
df['size'] = df['size'].map(size_mapping)

class_mapping = {label:idx for idx,label in enumerate(set(df['class label']))}
df['class label'] = df['class label'].map(class_mapping)

说明:对于有大小意义的离散特征,直接使用映射就可以了,{‘XL':3,'L':2,'M':1 }

基于pandas将类别属性转化为数值属性的方法

Using the get_dummies will create a new column for every unique string in a certain column:使用get_dummies进行one-hot

编码

pd.get_dummies(df)

基于pandas将类别属性转化为数值属性的方法

以上这篇基于pandas将类别属性转化为数值属性的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用python实现简单EXCEL数据统计的实例
Jan 24 Python
通过python+selenium3实现浏览器刷简书文章阅读量
Dec 26 Python
Python编写一个优美的下载器
Apr 15 Python
详解python 模拟豆瓣登录(豆瓣6.0)
Apr 18 Python
使用pip安装python库的多种方式
Jul 31 Python
python机器学习包mlxtend的安装和配置详解
Aug 21 Python
Python高级特性之闭包与装饰器实例详解
Nov 19 Python
详解Python 实现 ZeroMQ 的三种基本工作模式
Mar 24 Python
Python3爬虫中关于Ajax分析方法的总结
Jul 10 Python
Python logging自定义字段输出及打印颜色
Nov 30 Python
python中Tkinter 窗口之输入框和文本框的实现
Apr 12 Python
教你怎么用Python生成九宫格照片
May 20 Python
Django实现支付宝付款和微信支付的示例代码
Jul 25 #Python
Python走楼梯问题解决方法示例
Jul 25 #Python
python 批量修改/替换数据的实例
Jul 25 #Python
django 实现电子支付功能的示例代码
Jul 25 #Python
python 去除txt文本中的空格、数字、特定字母等方法
Jul 24 #Python
Python将文本去空格并保存到txt文件中的实例
Jul 24 #Python
python批量修改图片大小的方法
Jul 24 #Python
You might like
我的论坛源代码(四)
2006/10/09 PHP
PHP引用的调用方法分析
2016/04/25 PHP
PHP实现上一篇下一篇的方法实例总结
2016/09/22 PHP
Chrome中JSON.parse的特殊实现
2011/01/12 Javascript
3种不同方式的焦点图轮播特效分享
2013/10/30 Javascript
JavaScript中检测变量是否存在遇到的一些问题
2013/11/11 Javascript
node.js中的fs.symlinkSync方法使用说明
2014/12/15 Javascript
jQuery实现内容定时切换效果完整实例
2016/04/06 Javascript
详解RequireJS按需加载样式文件
2017/04/12 Javascript
Vue.js基础指令实例讲解(各种数据绑定、表单渲染大总结)
2017/07/03 Javascript
对layui中表单元素的使用详解
2018/08/15 Javascript
JS数组求和的常用方法总结【5种方法】
2019/01/14 Javascript
关于layui 弹出层一闪而过就消失的解决方法
2019/09/09 Javascript
Javascript call及apply应用场景及实例
2020/08/26 Javascript
如何在JavaScript中正确处理变量
2020/12/25 Javascript
Python标准库之循环器(itertools)介绍
2014/11/25 Python
Python3数据库操作包pymysql的操作方法
2018/07/16 Python
深度辨析Python的eval()与exec()的方法
2019/03/26 Python
在python image 中安装中文字体的实现方法
2019/08/22 Python
Python socket非阻塞模块应用示例
2019/09/12 Python
Python如何使用bokeh包和geojson数据绘制地图
2020/03/21 Python
python sleep和wait对比总结
2021/02/03 Python
css3 iphone玻璃透明气泡完美实现
2013/03/20 HTML / CSS
美国婚礼礼品网站:MyWeddingFavors
2018/09/26 全球购物
abstract class和interface有什么区别?
2012/01/03 面试题
存储过程的优点有哪些
2012/09/27 面试题
西部世纪.net笔试题面试题
2014/04/03 面试题
销售高级职员求职信
2013/10/29 职场文书
校园之星获奖感言
2014/01/29 职场文书
班级文化建设标语
2014/06/23 职场文书
关于国庆节的演讲稿
2014/09/05 职场文书
颂军魂爱军营演讲稿
2014/09/13 职场文书
行政助理岗位职责范本
2015/04/11 职场文书
圣诞晚会主持词开场白
2015/05/28 职场文书
SQL Server数据库基本概念、组成、常用对象与约束
2022/03/20 SQL Server
Nginx速查手册及常见问题
2022/04/07 Servers