对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 拷贝对象(深拷贝deepcopy与浅拷贝copy)
Sep 06 Python
简单介绍Python中的RSS处理
Apr 13 Python
python 的列表遍历删除实现代码
Apr 12 Python
python的变量与赋值详细分析
Nov 08 Python
Python使用pymysql从MySQL数据库中读出数据的方法
Jul 25 Python
Window10下python3.7 安装与卸载教程图解
Sep 30 Python
代码总结Python2 和 Python3 字符串的区别
Jan 28 Python
如何在django中添加日志功能
Feb 06 Python
Python利用for循环打印星号三角形的案例
Apr 12 Python
Python 实现打印单词的菱形字符图案
Apr 12 Python
python opencv把一张图片嵌入(叠加)到另一张图片上的实现代码
Jun 11 Python
python中_del_还原数据的方法
Dec 09 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
PHP5中实现多态的两种方法实例分享
2014/04/21 PHP
PHP实现支持SSL连接的SMTP邮件发送类
2015/03/05 PHP
php ucwords() 函数将字符串中每个单词的首字符转换为大写(实现代码)
2016/05/12 PHP
PHP实现链表的定义与反转功能示例
2018/06/09 PHP
JavaScript下利用fso判断文件是否存在的代码
2010/12/11 Javascript
angularjs在ng-repeat中使用ng-model遇到的问题
2016/01/21 Javascript
前端jquery部分很精彩
2016/05/03 Javascript
微信小程序 实战实例开发流程详细介绍
2017/01/05 Javascript
Angularjs使用指令做表单校验的方法
2017/03/31 Javascript
ES5 ES6中Array对象去除重复项的方法总结
2017/04/27 Javascript
vue页面跳转后返回原页面初始位置方法
2018/02/11 Javascript
webpack v4 从dev到prd的方法
2018/04/02 Javascript
bootstrap 路径导航 分页 进度条的实例代码
2018/08/06 Javascript
微信小程序的部署方法步骤
2018/09/04 Javascript
JS高阶函数原理与用法实例分析
2019/01/15 Javascript
ES6基础之 Promise 对象用法实例详解
2019/08/22 Javascript
javascript实现扫雷简易版
2020/08/18 Javascript
使用JavaScript实现贪吃蛇游戏
2020/09/29 Javascript
[01:42]TI4西雅图DOTA2前线报道 第一顿早饭哦
2014/07/08 DOTA
[05:11]TI9战队采访——VIRTUSPRO
2019/08/22 DOTA
python调用Moxa PCOMM Lite通过串口Ymodem协议实现发送文件
2014/08/15 Python
python模糊图片过滤的方法
2018/12/14 Python
python版百度语音识别功能
2019/07/09 Python
Pytorch: 自定义网络层实例
2020/01/07 Python
win10安装tensorflow-gpu1.8.0详细完整步骤
2020/01/20 Python
用python介绍4种常用的单链表翻转的方法小结
2020/02/24 Python
Windows+Anaconda3+PyTorch+PyCharm的安装教程图文详解
2020/04/03 Python
全球酒店预订网站:Hotels.com
2016/08/10 全球购物
90后毕业生的求职信范文
2013/09/21 职场文书
生产车间主管岗位职责
2013/12/28 职场文书
学校安全工作制度
2014/01/19 职场文书
残疾人创业典型事迹
2014/02/01 职场文书
老公爱的承诺书
2014/03/31 职场文书
教师学习三严三实心得体会
2014/10/13 职场文书
党的群众路线教育实践活动个人批评与自我批评
2014/10/16 职场文书
大学生村官工作总结2015
2015/04/09 职场文书