对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python判断操作系统类型代码分享
Nov 22 Python
python实现带错误处理功能的远程文件读取方法
Apr 29 Python
Python编写生成验证码的脚本的教程
May 04 Python
python中利用xml.dom模块解析xml的方法教程
May 24 Python
python 搭建简单的http server,可直接post文件的实例
Jan 03 Python
python通过配置文件共享全局变量的实例
Jan 11 Python
Python3 pip3 list 出现 DEPRECATION 警告的解决方法
Feb 16 Python
Python中的引用知识点总结
May 20 Python
Django 简单实现分页与搜索功能的示例代码
Nov 07 Python
python根据文本生成词云图代码实例
Nov 15 Python
Python排序函数的使用方法详解
Dec 11 Python
如何用 Python 制作 GitHub 消息助手
Feb 20 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
PHP+MYSQL开发工具及资源收藏
2007/01/02 PHP
PHP不用递归实现无限分级的例子分享
2014/04/18 PHP
php查找字符串出现次数的方法
2014/12/01 PHP
swoole和websocket简单聊天室开发
2017/11/18 PHP
详解php命令注入攻击
2019/04/06 PHP
编写js扩展方法判断一个数组中是否包含某个元素
2013/11/08 Javascript
悬浮数字的实现案例
2014/02/19 Javascript
jQuery中ajax的post()方法用法实例
2014/12/26 Javascript
AngularJs concepts详解及示例代码
2016/09/01 Javascript
JavaScript实现解析INI文件内容的方法
2016/11/17 Javascript
Bootstrap Modal对话框如何在关闭时触发事件
2016/12/02 Javascript
jQuery常见的选择器及用法介绍
2016/12/20 Javascript
Javascript 链式作用域详细介绍
2017/02/23 Javascript
深入浅出es6模板字符串
2017/08/26 Javascript
浅谈在vue项目中如何定义全局变量和全局函数
2017/10/24 Javascript
使用elementUI实现将图片上传到本地的示例
2018/09/04 Javascript
node中的session的具体使用
2018/09/14 Javascript
js+html+css实现手动轮播和自动轮播
2020/12/30 Javascript
python fabric实现远程操作和部署示例
2014/03/25 Python
Windows和Linux下使用Python访问SqlServer的方法介绍
2015/03/10 Python
浅谈python中copy和deepcopy中的区别
2017/10/23 Python
python实现定时自动备份文件到其他主机的实例代码
2018/02/23 Python
Django实现表单验证
2018/09/08 Python
详解Pandas之容易让人混淆的行选择和列选择
2019/07/10 Python
基于Python中isfile函数和isdir函数使用详解
2019/11/29 Python
python进程的状态、创建及使用方法详解
2019/12/06 Python
Python编程快速上手——strip()函数的正则表达式实现方法分析
2020/02/29 Python
部署Django到阿里云服务器教程示例
2020/06/03 Python
python 爬取百度文库并下载(免费文章限定)
2020/12/04 Python
websocket+sockjs+stompjs详解及实例代码
2018/11/30 HTML / CSS
联谊活动策划书
2014/01/26 职场文书
资源工程专业毕业生求职信
2014/02/27 职场文书
丧事答谢词
2015/01/05 职场文书
2016年小学圣诞节活动总结
2016/03/31 职场文书
Java 超详细讲解十大排序算法面试无忧
2022/04/08 Java/Android
HttpClient实现表单提交上传文件
2022/08/14 Java/Android