对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python迭代用法实例教程
Sep 08 Python
python写xml文件的操作实例
Oct 05 Python
使用IronPython把Python脚本集成到.NET程序中的教程
Mar 31 Python
python对excel文档去重及求和的实例
Apr 18 Python
python XlsxWriter模块创建aexcel表格的实例讲解
May 03 Python
Python、 Pycharm、Django安装详细教程(图文)
Apr 12 Python
numpy concatenate数组拼接方法示例介绍
May 27 Python
Python 200行代码实现一个滑动验证码过程详解
Jul 11 Python
Python 硬币兑换问题
Jul 29 Python
解决Pycharm 包已经下载,但是运行代码提示找不到模块的问题
Aug 31 Python
Pycharm 设置默认解释器路径和编码格式的操作
Feb 05 Python
Python实现Hash算法
Mar 18 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
用 php 编写的日历
2006/10/09 PHP
删除html标签得到纯文本可处理嵌套的标签
2014/04/28 PHP
php实例分享之通过递归实现删除目录下的所有文件详解
2014/05/15 PHP
PHP中UNIX时间戳和日期间的转换与计算实例
2014/11/19 PHP
php模拟服务器实现autoindex效果的方法
2015/03/10 PHP
php操作xml并将其插入数据库的实现方法
2016/09/08 PHP
PHP数组常用函数实例小结
2018/08/20 PHP
php redis setnx分布式锁简单原理解析
2020/10/23 PHP
动态改变textbox的宽高的js
2006/10/26 Javascript
js中访问html中iframe的文档对象的代码[IE6,IE7,IE8,FF]
2011/01/08 Javascript
Chosen 基于jquery的选择框插件使用方法
2012/05/30 Javascript
js获取url中指定参数值的示例代码
2013/12/14 Javascript
jquery自定义函数的多种方法
2014/01/09 Javascript
javascript实现数独解法
2015/03/14 Javascript
深入理解Angularjs向指令传递数据双向绑定机制
2016/12/31 Javascript
原生js实现简单的链式操作
2017/07/04 Javascript
百度地图去掉marker覆盖物或者去掉maker的label文字方法
2018/01/26 Javascript
解决angularjs中同步执行http请求的方法
2018/08/13 Javascript
图文详解vue框架安装步骤
2019/02/12 Javascript
JS实现商城秒杀倒计时功能(动态设置秒杀时间)
2019/12/12 Javascript
python根据路径导入模块的方法
2014/09/30 Python
进一步探究Python的装饰器的运用
2015/05/05 Python
python2.7 mayavi 安装图文教程(推荐)
2017/06/22 Python
Python 逐行分割大txt文件的方法
2017/10/10 Python
OpenCV 轮廓检测的实现方法
2019/07/03 Python
Python 使用folium绘制leaflet地图的实现方法
2019/07/05 Python
Django中ORM找出内容不为空的数据实例
2020/05/20 Python
opencv 实现特定颜色线条提取与定位操作
2020/06/02 Python
对pytorch中x = x.view(x.size(0), -1) 的理解说明
2021/03/03 Python
美国婴儿用品及配件购买网站:Munchkin
2019/04/03 全球购物
中国一家综合的外贸B2C电子商务网站:DealeXtreme(DX)
2020/03/10 全球购物
若通过ObjectOutputStream向一个文件中多次以追加方式写入object,为什么用ObjectInputStream读取这些object时会产生StreamCorruptedException?
2016/10/17 面试题
最新英语专业学生求职信范文
2013/09/21 职场文书
市级优秀班主任事迹材料
2014/05/13 职场文书
读《皮囊》有感:理解是对他人的最大的善举
2019/11/14 职场文书
MySQL笔记 —SQL运算符
2022/01/18 MySQL