对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现读取目录所有文件的文件名并保存到txt文件代码
Nov 22 Python
利用Fn.py库在Python中进行函数式编程
Apr 22 Python
python简单实现旋转图片的方法
May 30 Python
基于Python实现一个简单的银行转账操作
Mar 06 Python
浅析Python3爬虫登录模拟
Feb 07 Python
Django + Uwsgi + Nginx 实现生产环境部署的方法
Jun 20 Python
如何利用python制作时间戳转换工具详解
Sep 12 Python
Python中应该使用%还是format来格式化字符串
Sep 25 Python
Python定时发送消息的脚本:每天跟你女朋友说晚安
Oct 21 Python
Python学习笔记之视频人脸检测识别实例教程
Mar 06 Python
python全栈知识点总结
Jul 01 Python
浅谈django 模型类使用save()方法的好处与注意事项
Mar 28 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
PHP常量使用的几个需要注意的地方(谨慎使用PHP中的常量)
2014/09/12 PHP
PHP的压缩函数实现:gzencode、gzdeflate和gzcompress的区别
2016/01/27 PHP
php简单实现批量上传图片的方法
2016/05/09 PHP
use jscript List Installed Software
2007/06/11 Javascript
根据对象的某一属性进行排序的js代码(如:name,age)
2010/08/10 Javascript
jquery实现弹出窗口效果的实例代码
2013/11/28 Javascript
jquery实现下拉菜单的二级联动利用json对象从DB取值显示联动
2014/03/27 Javascript
基于jquery实现的自动补全功能
2015/03/12 Javascript
每天一篇javascript学习小结(Function对象)
2015/11/16 Javascript
非常漂亮的相册集 使用jquery制作相册集
2016/04/28 Javascript
js ajaxfileupload.js上传报错的解决方法
2016/05/05 Javascript
基于JS实现密码框(password)中显示文字提示功能代码
2016/05/27 Javascript
浅谈JavaScript 中有关时间对象的方法
2016/08/15 Javascript
JS实现获取当前URL和来源URL的方法
2016/08/24 Javascript
JS实现图片延迟加载并淡入淡出效果的简单方法
2016/08/25 Javascript
利用jQuery实现打字机字幕效果实例代码
2016/09/02 Javascript
基于JavaScript实现的快速排序算法分析
2017/04/14 Javascript
Node.Js生成比特币地址代码解析
2018/04/21 Javascript
vue.js2.0 实现better-scroll的滚动效果实例详解
2018/08/13 Javascript
mpvue将vue项目转换为小程序
2018/09/30 Javascript
JS中的算法与数据结构之队列(Queue)实例详解
2019/08/20 Javascript
简单了解JavaScript arguement原理及作用
2020/05/28 Javascript
uni-app使用countdown插件实现倒计时
2020/11/01 Javascript
[05:20]2018DOTA2亚洲邀请赛主赛事第三日战况回顾 LGD率先挺进胜者组决赛
2018/04/06 DOTA
Python使用redis pool的一种单例实现方式
2016/04/16 Python
selenium2.0中常用的python函数汇总
2019/08/05 Python
美国知名运动产品零售商:Foot Locker
2016/07/23 全球购物
为奢侈时尚带来了慈善元素:Olivela
2018/09/29 全球购物
微信营销策划方案
2014/02/24 职场文书
教堂婚礼主持词
2014/03/14 职场文书
电子工程专业毕业生求职信
2014/03/14 职场文书
2015年科研工作总结范文
2015/05/13 职场文书
教师法制教育培训学习心得体会
2016/01/14 职场文书
《乌鸦喝水》教学反思
2016/02/19 职场文书
2016年“9.22”世界无车日活动小结
2016/04/05 职场文书
idea以任意顺序debug多线程程序的具体用法
2021/08/30 Java/Android