对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python 随机数生成的代码的详细分析
May 15 Python
python常见数制转换实例分析
May 09 Python
Python实现简单过滤文本段的方法
May 24 Python
利用python3随机生成中文字符的实现方法
Nov 24 Python
解决sublime+python3无法输出中文的问题
Dec 12 Python
对pyqt5多线程正确的开启姿势详解
Jun 14 Python
pyQT5 实现窗体之间传值的示例
Jun 20 Python
tensorflow如何批量读取图片
Aug 29 Python
python之pymysql模块简单应用示例代码
Dec 16 Python
基于python实现文件加密功能
Jan 06 Python
Python类super()及私有属性原理解析
Jun 15 Python
Python读取图像并显示灰度图的实现
Dec 01 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
PHP UTF8编码内的繁简转换类
2009/07/20 PHP
php excel类 phpExcel使用方法介绍
2010/08/21 PHP
PDO防注入原理分析以及使用PDO的注意事项总结
2014/10/23 PHP
PHP判断访客是否手机端(移动端浏览器)访问的方法总结【4种方法】
2019/03/27 PHP
jquery 简单的进度条实现代码
2010/03/11 Javascript
客户端限制只能上传jpg格式图片的js代码
2010/12/09 Javascript
javascript 45种缓动效果 非常酷
2011/06/28 Javascript
document.documentElement和document.body区别介绍
2013/09/16 Javascript
jQuery - css() 方法示例详解
2014/01/16 Javascript
jquery实现漂亮的二级下拉菜单代码
2015/08/26 Javascript
JS中call/apply、arguments、undefined/null方法详解
2016/02/15 Javascript
为Jquery EasyUI 组件加上清除功能的方法(详解)
2017/04/13 jQuery
JS实现给json数组动态赋值的方法示例
2020/03/19 Javascript
BootStrap模态框和select2合用时input无法获取焦点的解决方法
2017/09/01 Javascript
JavaScript实现美化滑块效果
2019/05/17 Javascript
vue router 传参获取不到的解决方式
2019/11/13 Javascript
Vue-CLI与Vuex使用方法实例分析
2020/01/06 Javascript
微信小程序实现点击生成随机验证码
2020/09/09 Javascript
在js文件中引入(调用)另一个js文件的三种方法
2020/09/11 Javascript
[23:18]Spirit vs Liquid Supermajor小组赛A组 BO3 第二场 6.2
2018/06/03 DOTA
linux系统使用python监控apache服务器进程脚本分享
2014/01/15 Python
Python使用MONGODB入门实例
2015/05/11 Python
Python使用Srapy框架爬虫模拟登陆并抓取知乎内容
2016/07/02 Python
Django开发的简易留言板案例详解
2018/12/04 Python
python实现滑雪者小游戏
2020/02/22 Python
Python如何读写CSV文件
2020/08/13 Python
Django实现微信小程序支付的示例代码
2020/09/03 Python
The Hut德国站点:时装、家居用品、美容等
2016/09/23 全球购物
美国女性运动零售品牌:Lady Foot Locker
2017/05/12 全球购物
Miller Harris官网:英国小众香水品牌
2020/09/24 全球购物
大四自我鉴定
2014/02/08 职场文书
节约用水倡议书
2014/04/16 职场文书
因个人原因离职的辞职信范文
2015/05/12 职场文书
个人欠条范本
2015/07/03 职场文书
2016年社区“我们的节日·中秋节”活动总结
2016/04/05 职场文书
2019年思想汇报
2019/06/20 职场文书