pandas:get_dummies()与pd.factorize()的用法及区别说明


Posted in Python onMay 21, 2021

1.get_dummies()

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, drop_first=False):Convert categorical variable into dummy/indicator variables

>>> import pandas as pd
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0

2.pd.factorize()

pandas.factorize(values, sort=False, order=None, na_sentinel=-1,size_hint=None):Encode input values as an enumerated type or categorical variable

Series.factorize(sort=False, na_sentinel=-1):Encode the object as an enumerated type or categorical variable

Pandas有一个方法叫做factorize(),它可以创建一些数字,来表示类别变量,对每一个类别映射一个ID,这种映射最后只生成一个特征,不像dummy那样生成多个特征。

Parameters:

sort : boolean, default False

Sort by values

na_sentinel: int, default -1

Value to mark “not found”

Returns:

labels : the indexer to the original array

uniques : the unique Index

labels:对应的编码array

uniques:需要编码的类型

补充:pandas.get_dummies 的使用及含义

get_dummies 是利用pandas实现one hot encode的方式

get_dummies参数如下:

pandas.get_dummies(data,prefix = None,prefix_sep ='_',dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )

data : array-like,Series或DataFrame

prefix :string,字符串列表或字符串dict,默认为None,

用于追加DataFrame列名的字符串。在DataFrame上调用get_dummies时,传递一个长度等于列数的列表。或者,前缀 可以是将列名称映射到前缀的字典。

prefix_sep : string,默认为'_'

如果附加前缀,分隔符/分隔符要使用。或者传递与前缀一样的列表或字典。

dummy_na : bool,默认为False

如果忽略False NaN,则添加一列以指示NaN。

columns : 类似列表,默认为无

要编码的DataFrame中的列名称。如果列是None,那么所有与列 对象或类别 D型细胞将被转换。

sparse : bool,默认为False

伪编码列是否应由SparseArray(True)或常规NumPy数组(False)支持。

drop_first : bool,默认为False

是否通过删除第一级别从k分类级别获得k-1个假人。

版本0.18.0中的新功能。

dtype: D型,默认np.uint8

新列的数据类型。只允许一个dtype。

版本0.23.0中的新功能。

实例

pandas:get_dummies()与pd.factorize()的用法及区别说明

prefix自定义前缀

pandas:get_dummies()与pd.factorize()的用法及区别说明

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python创建对称矩阵的方法示例【基于numpy模块】
Oct 12 Python
Python使用smtp和pop简单收发邮件完整实例
Jan 09 Python
python中利用h5py模块读取h5文件中的主键方法
Jun 05 Python
python os.path模块常用方法实例详解
Sep 16 Python
python批量获取html内body内容的实例
Jan 02 Python
pytorch:torch.mm()和torch.matmul()的使用
Dec 27 Python
Python socket处理client连接过程解析
Mar 18 Python
python3中sys.argv的实例用法
Apr 24 Python
为什么说python适合写爬虫
Jun 11 Python
Python第三方库安装缓慢的解决方法
Feb 06 Python
如何在pycharm中快捷安装pip命令(如pygame)
May 31 Python
Python+Tkinter制作专属图形化界面
Apr 01 Python
python spilt()分隔字符串的实现示例
教你用python实现一个无界面的小型图书管理系统
一篇文章带你搞懂Python类的相关知识
Python深度学习之Pytorch初步使用
我对PyTorch dataloader里的shuffle=True的理解
Python快速优雅的批量修改Word文档样式
Django migrate报错的解决方案
You might like
关于shopex同步ucenter的redirect问题,导致script不运行
2013/04/10 PHP
php获取YouTube视频信息的方法
2015/02/11 PHP
[原创]CI(CodeIgniter)简单统计访问人数实现方法
2016/01/19 PHP
jquery photoFrame 图片边框美化显示插件
2010/06/28 Javascript
jQuery(非HTML5)可编辑表格实现代码
2012/12/11 Javascript
js确认删除对话框适用于a标签及submit
2014/07/10 Javascript
jquery实现textarea 高度自适应
2015/03/11 Javascript
简单介绍JavaScript中字符串创建的基本方法
2015/07/07 Javascript
javascript特效实现——当前时间和倒计时效果的简单实例
2016/07/20 Javascript
浅析Javascript ES6新增值比较函数Object.is
2016/08/24 Javascript
基于JavaScript实现购物网站商品放大镜效果
2016/09/06 Javascript
微信+angularJS的SPA应用中用router进行页面跳转,jssdk校验失败问题解决
2016/09/09 Javascript
Reactjs实现通用分页组件的实例代码
2017/01/19 Javascript
JS检测window.open打开的窗口是否关闭
2017/06/25 Javascript
vue 2.0项目中如何引入element-ui详解
2017/09/06 Javascript
jQuery.Sumoselect插件实现下拉复选框效果
2017/11/09 jQuery
angularJs自定义过滤器实现手机号信息隐藏的方法
2018/10/08 Javascript
手淘flexible.js框架使用和源代码讲解小结
2018/10/15 Javascript
图文详解vue框架安装步骤
2019/02/12 Javascript
解决vue admin element noCache设置无效的问题
2019/11/12 Javascript
vue实现循环滚动列表
2020/06/30 Javascript
vue登录页实现使用cookie记住7天密码功能的方法
2021/02/18 Vue.js
利用Anaconda简单安装scrapy框架的方法
2018/06/13 Python
python: 自动安装缺失库文件的方法
2018/10/22 Python
Django组件cookie与session的具体使用
2019/06/05 Python
python2.7的flask框架之引用js&css等静态文件的实现方法
2019/08/22 Python
NEW LOOK官网:英国时装零售巨头之一,快时尚品牌
2017/01/11 全球购物
工作人员思想汇报
2014/01/09 职场文书
安全生产计划书
2014/05/04 职场文书
联片教研活动总结
2014/07/01 职场文书
企业消防安全责任书
2014/07/23 职场文书
明星邀请函
2015/02/02 职场文书
入党个人总结范文
2015/03/02 职场文书
篮球赛闭幕式主持词
2015/07/03 职场文书
Nginx开启Brotli压缩算法实现过程详解
2021/03/31 Servers
解决mysql模糊查询索引失效问题的几种方法
2021/06/18 MySQL