Python Pandas 如何shuffle(打乱)数据


Posted in Python onJuly 30, 2019

在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。

应用情景:

我们有下面以个DataFrame

Python Pandas 如何shuffle(打乱)数据

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:

Python Pandas 如何shuffle(打乱)数据

实现方法:

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)

这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3。

有时候,我们可能需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

-------------------------------------分割线--------------------------------------------------------------

其实,sklearn(机器学习的库)中也有shuffle的方法。

from sklearn.utils import shuffle
df = shuffle(df)

另外,numpy库中也有进行shuffle的方法(不建议)

df.iloc[np.random.permutation(len(df))]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python简单实现子网掩码转换的方法
Apr 13 Python
Python实现的计数排序算法示例
Nov 29 Python
Python简单生成随机姓名的方法示例
Dec 27 Python
Java及python正则表达式详解
Dec 27 Python
Python cookbook(数据结构与算法)找出序列中出现次数最多的元素算法示例
Mar 15 Python
python基础教程项目二之画幅好画
Apr 02 Python
python对常见数据类型的遍历解析
Aug 27 Python
PyTorch的torch.cat用法
Jun 28 Python
浅谈Django前端后端值传递问题
Jul 15 Python
Python 如何查找特定类型文件
Aug 17 Python
用Python制作音乐海报
Jan 26 Python
python链表类中获取元素实例方法
Feb 23 Python
python tkinter实现屏保程序
Jul 30 #Python
python pandas 时间日期的处理实现
Jul 30 #Python
Django 反向生成url实例详解
Jul 30 #Python
Python Pandas数据中对时间的操作
Jul 30 #Python
python tkinter实现彩球碰撞屏保
Jul 30 #Python
详解python pandas 分组统计的方法
Jul 30 #Python
python文档字符串(函数使用说明)使用详解
Jul 30 #Python
You might like
php&java(二)
2006/10/09 PHP
谈谈 PHP7新增功能
2015/12/16 PHP
PHP实现清除MySQL死连接的方法
2016/07/23 PHP
thinkphp中AJAX返回ajaxReturn()方法分析
2016/12/06 PHP
js监听输入框值的即时变化onpropertychange、oninput
2011/07/13 Javascript
网页加载时页面显示进度条加载完成之后显示网页内容
2012/12/23 Javascript
JS 加入收藏夹的代码(主流浏览器通用)
2013/05/13 Javascript
jQuery CSS()方法改变现有的CSS样式表
2014/09/09 Javascript
JavaScript验证Email(3种方法)
2015/09/21 Javascript
Node.js开发者必须了解的4个JS要点
2016/02/21 Javascript
jQuery实现的跨容器无缝拖动效果代码
2016/06/21 Javascript
JavaScript 事件对内存和性能的影响
2017/01/22 Javascript
JS实现针对给定时间的倒计时功能示例
2017/04/11 Javascript
详解vue2.6插槽更新v-slot用法总结
2019/03/09 Javascript
eslint 的三大通用规则详解
2019/05/16 Javascript
vant时间控件使用方法详解
2020/12/24 Javascript
[01:21]DOTA2周边文化主题展 神秘商店火热开售
2017/07/30 DOTA
在Python中使用SimpleParse模块进行解析的教程
2015/04/11 Python
python+matplotlib实现鼠标移动三角形高亮及索引显示
2018/01/15 Python
解决pycharm安装后代码区不能编辑的问题
2018/10/28 Python
Python实现针对json中某个关键字段进行排序操作示例
2018/12/25 Python
Python增强赋值和共享引用注意事项小结
2019/05/28 Python
Python绘制二维曲线的日常应用详解
2019/12/04 Python
python json load json 数据后出现乱序的解决方案
2020/02/27 Python
Python视频编辑库MoviePy的使用
2020/04/01 Python
Python Sqlalchemy如何实现select for update
2020/10/12 Python
详解css3 object-fit属性
2018/07/27 HTML / CSS
美国照明、家居装饰和家具购物网站:Bellacor
2017/09/20 全球购物
销售工作岗位职责
2013/12/24 职场文书
行政工作个人的自我评价
2014/02/13 职场文书
商超业务员岗位职责
2014/03/12 职场文书
“四风”问题整改措施和努力方向
2014/09/20 职场文书
2014年个人债务授权委托书范本
2014/09/22 职场文书
2014年合同管理工作总结
2014/12/02 职场文书
2016教师六五普法学习心得体会
2016/01/21 职场文书
用Python进行栅格数据的分区统计和批量提取
2021/05/27 Python