对python sklearn one-hot编码详解


Posted in Python onJuly 10, 2018

one-hot编码的作用

使用one-hot编码,将离散特征的取值扩展到了欧式空间,离散特征的某个取值就对应欧式空间的某个点

将离散特征通过one-hot编码映射到欧式空间,是因为,在回归,分类,聚类等机器学习算法中,特征之间距离的计算或相似度的计算是非常重要的,而我们常用的距离或相似度的计算都是在欧式空间的相似度计算,计算余弦相似性,基于的就是欧式空间。

sklearn的一个例子

from sklearn import preprocessing

enc = preprocessing.OneHotEncoder()

enc.fit([[0, 0, 3], [1, 1, 0], [0, 2, 1], [1, 0, 2]])
print(enc.n_values_)//每个特征对应的最大位数

print(enc.transform([[0,1,3]]).toarray())

print(enc.transform([[0,1,1]]).toarray())

上面代码enc.fit()里有一个4行3列的矩阵

1、每一列对应于一个样本的特征序列,即一个样本有三个特征

2、4行表明传入了4个样本

3、观察每一列的值可以知道:第一个特征有两个取值0,1;第二个特征有三个取值0,1,2;第三个特征有4个取值0,1,2,3

4、所以第一个特征的one-hot编码是一个两位的01串,第二个特征是一个三位的01串,第三个特征是一个4位的01串

以上这篇对python sklearn one-hot编码详解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用httplib模块来制作Python下HTTP客户端的方法
Jun 19 Python
python使用PyCharm进行远程开发和调试
Nov 02 Python
Python pyinotify日志监控系统处理日志的方法
Mar 08 Python
Python中XlsxWriter模块简介与用法分析
Apr 24 Python
pandas 实现字典转换成DataFrame的方法
Jul 04 Python
ERLANG和PYTHON互通实现过程详解
Jul 05 Python
Pandas 重塑(stack)和轴向旋转(pivot)的实现
Jul 22 Python
基于python实现把图片转换成素描
Nov 13 Python
Django认证系统user对象实现过程解析
Mar 02 Python
django在开发中取消外键约束的实现
May 20 Python
使用python matploblib库绘制准确率,损失率折线图
Jun 16 Python
Python爬虫开发与项目实战
Dec 16 Python
python的scikit-learn将特征转成one-hot特征的方法
Jul 10 #Python
pandas使用get_dummies进行one-hot编码的方法
Jul 10 #Python
详解python中的装饰器
Jul 10 #Python
pandas值替换方法
Jul 10 #Python
Pandas 数据处理,数据清洗详解
Jul 10 #Python
python+pandas+时间、日期以及时间序列处理方法
Jul 10 #Python
使用Python的Dataframe取两列时间值相差一年的所有行方法
Jul 10 #Python
You might like
PHP截取中文字符串的问题
2006/07/12 PHP
php面向对象全攻略 (十四) php5接口技术
2009/09/30 PHP
分享php邮件管理器源码
2016/01/06 PHP
php支持断点续传、分块下载的类
2016/05/02 PHP
JavaScript入门之对象与JSON详解
2011/10/21 Javascript
运用jQuery定时器的原理实现banner图片切换
2014/10/22 Javascript
JS实现网页标题栏显示当前时间和日期的完整代码
2015/11/02 Javascript
Jquery插件easyUi实现表单验证示例
2015/12/15 Javascript
JavaScript位移运算符(无符号) >>> 三个大于号 的使用方法详解
2016/03/31 Javascript
Angular设置title信息解决SEO方面存在问题
2016/08/19 Javascript
利用纯Vue.js构建Bootstrap组件
2016/11/03 Javascript
jquery.tableSort.js表格排序插件使用方法详解
2020/08/12 Javascript
vue 检测用户上传图片宽高的方法
2020/02/06 Javascript
微信小程序自定义弹出层效果
2020/05/26 Javascript
Vue v-for中的 input 或 select的值发生改变时触发事件操作
2020/08/31 Javascript
python简单的函数定义和用法实例
2015/05/07 Python
TensorFlow安装及jupyter notebook配置方法
2017/09/08 Python
使用Eclipse如何开发python脚本
2018/04/11 Python
基于Django静态资源部署404的解决方法
2019/07/28 Python
selenium中get_cookies()和add_cookie()的用法详解
2020/01/06 Python
Python yield的用法实例分析
2020/03/06 Python
python正则表达式的懒惰匹配和贪婪匹配说明
2020/07/13 Python
Python过滤序列元素的方法
2020/07/31 Python
Flask处理Web表单的实现方法
2021/01/31 Python
美国高端婴童品牌:Hanna Andersson
2016/10/30 全球购物
英国女装网上商店:I Saw It First
2018/10/18 全球购物
求职信范文英文版
2014/01/05 职场文书
书法比赛获奖感言
2014/02/10 职场文书
春季防火方案
2014/05/10 职场文书
护士找工作求职信
2014/07/02 职场文书
四风查摆问题及整改措施
2014/10/10 职场文书
2014年食堂工作总结
2014/11/20 职场文书
2015年办公室工作总结范文
2015/03/31 职场文书
普通员工辞职信范文
2015/05/12 职场文书
JS Canvas接口和动画效果大全
2021/04/29 Javascript
uniapp引入支付宝原生扫码插件步骤详解
2022/07/23 Javascript