Python Pandas 如何shuffle(打乱)数据


Posted in Python onJuly 30, 2019

在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。

应用情景:

我们有下面以个DataFrame

Python Pandas 如何shuffle(打乱)数据

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:

Python Pandas 如何shuffle(打乱)数据

实现方法:

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)

这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3。

有时候,我们可能需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

-------------------------------------分割线--------------------------------------------------------------

其实,sklearn(机器学习的库)中也有shuffle的方法。

from sklearn.utils import shuffle
df = shuffle(df)

另外,numpy库中也有进行shuffle的方法(不建议)

df.iloc[np.random.permutation(len(df))]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python搭建Django应用程序步骤及版本冲突问题解决
Nov 19 Python
python实现数通设备端口监控示例
Apr 02 Python
12步教你理解Python装饰器
Feb 25 Python
Python中交换两个元素的实现方法
Jun 29 Python
selenium+python自动化测试之页面元素定位
Jan 23 Python
Django框架使用mysql视图操作示例
May 15 Python
[机器视觉]使用python自动识别验证码详解
May 16 Python
pyinstaller参数介绍以及总结详解
Jul 12 Python
Python实现打印实心和空心菱形
Nov 23 Python
python飞机大战pygame碰撞检测实现方法分析
Dec 17 Python
python中的split()函数和os.path.split()函数使用详解
Dec 21 Python
pytorch 实现模型不同层设置不同的学习率方式
Jan 06 Python
python tkinter实现屏保程序
Jul 30 #Python
python pandas 时间日期的处理实现
Jul 30 #Python
Django 反向生成url实例详解
Jul 30 #Python
Python Pandas数据中对时间的操作
Jul 30 #Python
python tkinter实现彩球碰撞屏保
Jul 30 #Python
详解python pandas 分组统计的方法
Jul 30 #Python
python文档字符串(函数使用说明)使用详解
Jul 30 #Python
You might like
mysql+php分页类(已测)
2008/03/31 PHP
destoon供应信息title调用出公司名称的方法
2014/08/22 PHP
php防止伪造数据从地址栏URL提交的方法
2014/08/24 PHP
浅谈php冒泡排序
2014/12/30 PHP
php blowfish加密解密算法
2016/07/02 PHP
PHP表单验证内容是否为空的实现代码
2016/11/14 PHP
PHP数组中头部和尾部添加元素的方法(array_unshift,array_push)
2017/04/10 PHP
php如何修改SESSION的生存存储时间的实例代码
2017/07/05 PHP
javascript 隐藏/显示指定的区域附HTML元素【legend】用法
2010/03/05 Javascript
javascript之典型高阶函数应用介绍
2013/01/10 Javascript
javascript生成随机大小写字母的方法
2014/02/20 Javascript
jquery显示隐藏input对象
2014/07/21 Javascript
jQuery通过ajax请求php遍历json数组到table中的代码(推荐)
2016/06/12 Javascript
AngularJS入门教程之ng-class 指令用法
2016/08/01 Javascript
使用Javascript监控前端相关数据的代码
2016/10/27 Javascript
解决使用Vue.js显示数据的时,页面闪现原始代码的问题
2018/02/11 Javascript
JavaScript 日期时间选择器一些小结
2018/04/02 Javascript
SSM+layUI 根据登录信息显示不同的页面方法
2019/09/20 Javascript
Layui选项卡制作历史浏览记录的方法
2019/09/28 Javascript
python和shell实现的校验IP地址合法性脚本分享
2014/10/23 Python
Python处理PDF及生成多层PDF实例代码
2017/04/24 Python
Python3使用pandas模块读写excel操作示例
2018/07/03 Python
Django在pycharm下修改默认启动端口的方法
2019/07/26 Python
django框架用户权限中的session缓存到redis中的方法
2019/08/06 Python
Python 处理文件的几种方式
2019/08/23 Python
Python 实现自动导入缺失的库
2019/10/29 Python
浅谈Django前端后端值传递问题
2020/07/15 Python
Python 高效编程技巧分享
2020/09/10 Python
基于HTML5陀螺仪实现ofo首页眼睛移动效果的示例
2017/07/31 HTML / CSS
在线实验室测试:HealthLabs.com
2020/05/03 全球购物
对于没有初始化的变量的初始值可以作怎样的假定
2014/10/12 面试题
教育局长自荐信范文
2013/12/22 职场文书
激励口号大全
2014/06/17 职场文书
幸福终点站观后感
2015/06/04 职场文书
nginx里的rewrite跳转的实现
2021/03/31 Servers
python实现自动化群控的步骤
2021/04/11 Python