pandas:get_dummies()与pd.factorize()的用法及区别说明


Posted in Python onMay 21, 2021

1.get_dummies()

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None,sparse=False, drop_first=False):Convert categorical variable into dummy/indicator variables

>>> import pandas as pd
>>> s = pd.Series(list('abca'))
>>> pd.get_dummies(s)
   a  b  c
0  1  0  0
1  0  1  0
2  0  0  1
3  1  0  0

2.pd.factorize()

pandas.factorize(values, sort=False, order=None, na_sentinel=-1,size_hint=None):Encode input values as an enumerated type or categorical variable

Series.factorize(sort=False, na_sentinel=-1):Encode the object as an enumerated type or categorical variable

Pandas有一个方法叫做factorize(),它可以创建一些数字,来表示类别变量,对每一个类别映射一个ID,这种映射最后只生成一个特征,不像dummy那样生成多个特征。

Parameters:

sort : boolean, default False

Sort by values

na_sentinel: int, default -1

Value to mark “not found”

Returns:

labels : the indexer to the original array

uniques : the unique Index

labels:对应的编码array

uniques:需要编码的类型

补充:pandas.get_dummies 的使用及含义

get_dummies 是利用pandas实现one hot encode的方式

get_dummies参数如下:

pandas.get_dummies(data,prefix = None,prefix_sep ='_',dummy_na = False,columns = None,sparse = False,drop_first = False,dtype = None )

data : array-like,Series或DataFrame

prefix :string,字符串列表或字符串dict,默认为None,

用于追加DataFrame列名的字符串。在DataFrame上调用get_dummies时,传递一个长度等于列数的列表。或者,前缀 可以是将列名称映射到前缀的字典。

prefix_sep : string,默认为'_'

如果附加前缀,分隔符/分隔符要使用。或者传递与前缀一样的列表或字典。

dummy_na : bool,默认为False

如果忽略False NaN,则添加一列以指示NaN。

columns : 类似列表,默认为无

要编码的DataFrame中的列名称。如果列是None,那么所有与列 对象或类别 D型细胞将被转换。

sparse : bool,默认为False

伪编码列是否应由SparseArray(True)或常规NumPy数组(False)支持。

drop_first : bool,默认为False

是否通过删除第一级别从k分类级别获得k-1个假人。

版本0.18.0中的新功能。

dtype: D型,默认np.uint8

新列的数据类型。只允许一个dtype。

版本0.23.0中的新功能。

实例

pandas:get_dummies()与pd.factorize()的用法及区别说明

prefix自定义前缀

pandas:get_dummies()与pd.factorize()的用法及区别说明

以上为个人经验,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解Python中的静态方法与类成员方法
Feb 28 Python
详解python并发获取snmp信息及性能测试
Mar 27 Python
Python实现的栈(Stack)
Jan 26 Python
用Python3创建httpServer的简单方法
Jun 04 Python
在python中bool函数的取值方法
Nov 01 Python
详解【python】str与json类型转换
Apr 29 Python
pyqt 实现为长内容添加滑轮 scrollArea
Jun 19 Python
在OpenCV里使用特征匹配和单映射变换的代码详解
Oct 23 Python
PyTorch中topk函数的用法详解
Jan 02 Python
Python tkinter和exe打包的方法
Feb 05 Python
Python datetime 如何处理时区信息
Sep 02 Python
Python从文件中读取数据的方法步骤
Nov 18 Python
python spilt()分隔字符串的实现示例
教你用python实现一个无界面的小型图书管理系统
一篇文章带你搞懂Python类的相关知识
Python深度学习之Pytorch初步使用
我对PyTorch dataloader里的shuffle=True的理解
Python快速优雅的批量修改Word文档样式
Django migrate报错的解决方案
You might like
php强制下载类型的实现代码
2011/04/21 PHP
codeigniter教程之上传视频并使用ffmpeg转flv示例
2014/02/13 PHP
php实现按指定大小等比缩放生成上传图片缩略图的方法
2014/12/15 PHP
javascript数组与php数组的地址传递及值传递用法实例
2015/01/22 PHP
php生成酷炫的四个字符验证码
2016/04/22 PHP
php实现的数组转xml案例分析
2019/09/28 PHP
javascript 单例/单体模式(Singleton)
2011/04/07 Javascript
js中将URL中的参数提取出来作为对象的实现代码
2011/08/16 Javascript
jQuery实现长文字部分显示代码
2013/05/13 Javascript
关于Javascript作用域链的八点总结
2013/12/06 Javascript
JavaScript检查某个function是否是原生代码的方法
2014/08/20 Javascript
JQuery.Ajax()的data参数类型实例详解
2015/11/20 Javascript
ionic组件ion-tabs选项卡切换效果实例
2016/08/27 Javascript
Ajax异步获取html数据中包含js方法无效的解决方法
2017/02/20 Javascript
详解本地Node.js服务器作为api服务器的解决办法
2017/02/28 Javascript
Mongoose经常返回e11000 error的原因分析
2017/03/29 Javascript
你可能不知道的JSON.stringify()详解
2017/08/17 Javascript
nginx+vue.js实现前后端分离的示例代码
2018/02/12 Javascript
TypeScript开发Node.js程序的方法
2019/04/30 Javascript
回顾Javascript React基础
2019/06/15 Javascript
如何提升vue.js中大型数据的性能
2019/06/21 Javascript
js微信分享接口调用详解
2019/07/23 Javascript
vue实现权限控制路由(vue-router 动态添加路由)
2019/11/04 Javascript
Node使用koa2实现一个简单JWT鉴权的方法
2021/01/26 Javascript
[01:50]2014DOTA2西雅图邀请赛 专访欢乐周宝龙
2014/07/08 DOTA
python应用程序在windows下不出现cmd窗口的办法
2014/05/29 Python
Python实现的下载8000首儿歌的代码分享
2014/11/21 Python
Django自定义manage命令实例代码
2018/02/11 Python
python web基础之加载静态文件实例
2018/03/20 Python
解决pycharm运行出错,代码正确结果不显示的问题
2018/11/30 Python
Python批量获取并保存手机号归属地和运营商的示例
2020/10/09 Python
HTML5事件方法全部汇总
2016/05/12 HTML / CSS
TUMI马来西亚官方网站:国际领先的高品质商旅箱包品牌
2018/04/26 全球购物
Viking比利时:购买办公用品
2019/10/30 全球购物
世界环境日活动总结
2015/02/11 职场文书
读后感怎么写?书写读后感的基本技巧!
2019/12/10 职场文书