对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的数据对象持久化存储模块pickle的使用示例
Mar 03 Python
Python使用自带的ConfigParser模块读写ini配置文件
Jun 26 Python
深入理解Python装饰器
Jul 27 Python
python导入时小括号大作用
Jan 10 Python
python+pandas分析nginx日志的实例
Apr 28 Python
python实现LRU热点缓存及原理
Oct 29 Python
Python 中如何实现参数化测试的方法示例
Dec 10 Python
Python如何使用bokeh包和geojson数据绘制地图
Mar 21 Python
Python + selenium + crontab实现每日定时自动打卡功能
Mar 31 Python
python 已知平行四边形三个点,求第四个点的案例
Apr 12 Python
python线程池 ThreadPoolExecutor 的用法示例
Oct 10 Python
Python万能模板案例之matplotlib绘制甘特图
Apr 13 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
php+mysql数据库实现无限分类的方法
2014/12/12 PHP
如何离线执行php任务
2017/02/21 PHP
php判断文件上传图片格式的实例详解
2017/09/30 PHP
PHP 实现手机端APP支付宝支付功能
2018/06/07 PHP
PHP isset empty函数相关面试题及解析
2020/12/11 PHP
学习ExtJS accordion布局
2009/10/08 Javascript
读jQuery之四(优雅的迭代)
2011/06/20 Javascript
js关于精确计算和数值格式化以及直接引js文件
2014/01/28 Javascript
类似天猫商品详情随浏览器移动的示例代码
2014/02/27 Javascript
JQuery教学之性能优化
2014/05/14 Javascript
Node.js中的模块机制学习笔记
2014/11/04 Javascript
AngularJS入门教程之Hello World!
2014/12/06 Javascript
使用jQuery判断Div是否在可视区域的方法 判断div是否可见
2016/02/17 Javascript
Bootstrap3制作自己的导航栏
2016/05/12 Javascript
用nodejs的实现原理和搭建服务器(动态)
2016/08/10 NodeJs
AngularJS之ionic 框架下实现 Localstorage本地存储
2017/04/22 Javascript
ES6中Symbol、Set和Map用法详解
2019/08/20 Javascript
[03:08]迎霜节狂欢!2018年迎霜节珍藏Ⅰ一览
2018/12/25 DOTA
[54:15]DOTA2-DPC中国联赛 正赛 DLG vs Dragon BO3 第二场2月1日
2021/03/11 DOTA
Python对列表排序的方法实例分析
2015/05/16 Python
Python中MySQL数据迁移到MongoDB脚本的方法
2016/04/28 Python
Python实现将不规范的英文名字首字母大写
2016/11/15 Python
一个基于flask的web应用诞生 记录用户账户登录状态(6)
2017/04/11 Python
Python基于回溯法子集树模板解决马踏棋盘问题示例
2017/09/11 Python
python图像处理模块Pillow的学习详解
2019/10/09 Python
使用python的turtle函数绘制一个滑稽表情
2020/02/28 Python
Python 如何展开嵌套的序列
2020/08/01 Python
英国最好的温室之家:Greenhouses Direct
2019/07/13 全球购物
美国浴缸、水槽和水龙头购物网站:Vintage Tub & Bath
2019/11/05 全球购物
世界排名第一的运动鞋市场:Flight Club
2020/01/03 全球购物
新颖的化妆品活动方案
2014/08/21 职场文书
教师个人查摆剖析材料
2014/10/14 职场文书
青春雷锋观后感
2015/06/10 职场文书
工作简报格式范文
2015/07/21 职场文书
Go语言-为什么返回值为接口类型,却返回结构体
2021/04/24 Golang
MySQL之MyISAM存储引擎的非聚簇索引详解
2022/03/03 MySQL