对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python判断文件和文件夹是否存在的方法
May 21 Python
Python的Flask框架的简介和安装方法
Nov 13 Python
Python处理文本文件中控制字符的方法
Feb 07 Python
Odoo中如何生成唯一不重复的序列号详解
Feb 10 Python
python如何创建TCP服务端和客户端
Aug 26 Python
elasticsearch python 查询的两种方法
Aug 04 Python
Python 用turtle实现用正方形画圆的例子
Nov 21 Python
浅谈keras使用中val_acc和acc值不同步的思考
Jun 18 Python
django Model层常用验证器及自定义验证器详解
Jul 15 Python
python自动化测试三部曲之request+django实现接口测试
Oct 07 Python
通过python-pptx模块操作ppt文件的方法
Dec 26 Python
Django与数据库交互的实现
Jun 03 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
PHP操作MongoDB GridFS 存储文件的详解
2013/06/20 PHP
PHP传参之传值与传址的区别
2015/04/24 PHP
PHP命名空间和自动加载类
2016/04/03 PHP
php字符串过滤strip_tags()函数用法实例分析
2019/06/24 PHP
在JavaScript应用中实现延迟加载的方法
2015/06/25 Javascript
Js删除数组中某一项或几项的几种方法(推荐)
2016/07/27 Javascript
js实现浏览器倒计时跳转页面效果
2016/08/12 Javascript
Javascript中浏览器窗口的基本操作总结
2016/08/18 Javascript
JavaScript的变量声明提升问题浅析(Hoisting)
2016/11/30 Javascript
利用js来实现缩略语列表、文献来源链接和快捷键列表
2016/12/16 Javascript
jquery submit()不能提交表单的解决方法
2017/04/24 jQuery
ajax请求data遇到的问题分析
2018/01/18 Javascript
详解js获取video任意时间的画面截图
2019/04/17 Javascript
微信小程序实现圆形进度条动画
2020/11/18 Javascript
微信小程序 动态修改页面数据及参数传递过程详解
2019/09/27 Javascript
layer.alert自定义关闭回调事件的方法
2019/09/27 Javascript
element-ui 远程搜索组件el-select在项目中组件化的实现代码
2019/12/04 Javascript
jQuery操作元素追加内容示例
2020/01/10 jQuery
解决angular 使用原生拖拽页面卡顿及表单控件输入延迟问题
2020/04/21 Javascript
[00:02]DOTA2新版本使用PA至宝后暴击展示
2014/11/19 DOTA
Python模块搜索概念介绍及模块安装方法介绍
2015/06/03 Python
Python中函数的参数定义和可变参数用法实例分析
2015/06/04 Python
Python Socket实现简单TCP Server/client功能示例
2017/08/05 Python
解决Django模板无法使用perms变量问题的方法
2017/09/10 Python
flask框架中勾子函数的使用详解
2018/08/01 Python
python3实现逐字输出的方法
2019/01/23 Python
python 下 CMake 安装配置 OPENCV 4.1.1的方法
2019/09/30 Python
python 有效的括号的实现代码示例
2019/11/11 Python
python 删除excel表格重复行,数据预处理操作
2020/07/06 Python
Python pip 常用命令汇总
2020/10/19 Python
德国家具在线:Fashion For Home
2017/03/11 全球购物
西班牙手机之家:Phone House
2018/10/18 全球购物
大学生职业生涯规划书范文
2014/01/04 职场文书
教师个人鉴定材料
2014/02/08 职场文书
小学生作文评语集锦
2014/12/25 职场文书
2015年司法所工作总结
2015/04/27 职场文书