对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现可将字符转换成大写的tcp服务器实例
Apr 29 Python
Python多线程threading和multiprocessing模块实例解析
Jan 29 Python
Python基于递归实现电话号码映射功能示例
Apr 13 Python
mac下如何将python2.7改为python3
Jul 13 Python
pycharm运行和调试不显示结果的解决方法
Nov 30 Python
Python 使用Numpy对矩阵进行转置的方法
Jan 28 Python
python生成器用法实例详解
Nov 22 Python
Pytest参数化parametrize使用代码实例
Feb 22 Python
Python爬虫工具requests-html使用解析
Apr 29 Python
Python Unittest原理及基本使用方法
Nov 06 Python
利用python爬取有道词典的方法
Dec 08 Python
python如何读取.mtx文件
Apr 22 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
完美实现GIF动画缩略图的php代码
2011/01/02 PHP
利用PHP将部分内容用星号替换
2020/04/21 PHP
jquery获取div宽度的实现思路与代码
2013/01/13 Javascript
js 动态加载事件的几种方法总结
2013/12/25 Javascript
js星星评分效果
2014/07/24 Javascript
NodeJS中Buffer模块详解
2015/01/07 NodeJs
Node.js的Express框架使用上手指南
2016/03/12 Javascript
再谈javascript注入 黑客必备!
2016/09/14 Javascript
VS Code转换大小写、修改选中文字或代码颜色的方法
2017/12/15 Javascript
vue实现提示保存后退出的方法
2018/03/15 Javascript
JS实现的base64加密解密操作示例
2018/04/18 Javascript
微信小程序实现长按删除图片的示例
2018/05/18 Javascript
浅谈super-vuex使用体验
2018/06/25 Javascript
nuxt踩坑之Vuex状态树的模块方式使用详解
2019/09/06 Javascript
Vue 2.0双向绑定原理的实现方法
2019/10/23 Javascript
nuxt引入组件和公共样式的操作
2020/11/05 Javascript
python3使用tkinter实现ui界面简单实例
2014/01/10 Python
Python合并两个字典的常用方法与效率比较
2015/06/17 Python
Python爬虫框架Scrapy实例代码
2018/03/04 Python
Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)
2018/03/19 Python
Python实现针对给定单链表删除指定节点的方法
2018/04/12 Python
利用Python实现微信找房机器人实例教程
2019/03/10 Python
使用Python3内置文档高效学习以及官方中文文档
2019/05/19 Python
Python将主机名转换为IP地址的方法
2019/08/14 Python
能否解释一下XSS cookie盗窃是什么意思
2012/06/02 面试题
DELPHI面试题研发笔试试卷
2015/11/08 面试题
医学护理系毕业生求职信
2013/10/01 职场文书
档案检查欢迎词
2014/01/13 职场文书
模具毕业生推荐信
2014/02/15 职场文书
机械系毕业生求职信
2014/05/28 职场文书
管理工程专业求职信
2014/08/10 职场文书
2015年教师节新闻稿
2015/07/17 职场文书
2016年机关单位节能宣传周活动总结
2016/04/05 职场文书
您对思维方式了解多少?
2019/12/09 职场文书
利用Python实现Picgo图床工具
2021/11/23 Python
SQL Server表分区降低运维和维护成本
2022/04/08 SQL Server