Python Pandas 如何shuffle(打乱)数据


Posted in Python onJuly 30, 2019

在Python里面,使用Pandas里面的DataFrame来存放数据的时候想要把数据集进行shuffle会许多的方法,本文介绍两种比较常用而且简单的方法。

应用情景:

我们有下面以个DataFrame

Python Pandas 如何shuffle(打乱)数据

我们可以看到BuyInter的数值是按照0,-1,-1,2,2,2,3,3,3,3这样排列的,我们希望不保持这个次序,但是同时列属性又不能改变,即如下效果:

Python Pandas 如何shuffle(打乱)数据

实现方法:

最简单的方法就是采用pandas中自带的 sample这个方法。

假设df是这个DataFrame

df.sample(frac=1)

这样对可以对df进行shuffle。其中参数frac是要返回的比例,比如df中有10行数据,我只想返回其中的30%,那么frac=0.3。

有时候,我们可能需要打混后数据集的index(索引)还是按照正常的排序。我们只需要这样操作

df.sample(frac=1).reset_index(drop=True)

-------------------------------------分割线--------------------------------------------------------------

其实,sklearn(机器学习的库)中也有shuffle的方法。

from sklearn.utils import shuffle
df = shuffle(df)

另外,numpy库中也有进行shuffle的方法(不建议)

df.iloc[np.random.permutation(len(df))]

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Urllib库的基本使用教程
Apr 30 Python
Python创建xml文件示例
Mar 22 Python
python+selenium实现163邮箱自动登陆的方法
Dec 31 Python
python3中的md5加密实例
May 29 Python
python并发和异步编程实例
Nov 15 Python
python进行文件对比的方法
Dec 24 Python
Python分支语句与循环语句应用实例分析
May 07 Python
python爬虫 基于requests模块发起ajax的get请求实现解析
Aug 20 Python
使用python 将图片复制到系统剪贴中
Dec 13 Python
Python实现疫情通定时自动填写功能(附代码)
May 27 Python
解决pytorch 的state_dict()拷贝问题
Mar 03 Python
10个顶级Python实用库推荐
Mar 04 Python
python tkinter实现屏保程序
Jul 30 #Python
python pandas 时间日期的处理实现
Jul 30 #Python
Django 反向生成url实例详解
Jul 30 #Python
Python Pandas数据中对时间的操作
Jul 30 #Python
python tkinter实现彩球碰撞屏保
Jul 30 #Python
详解python pandas 分组统计的方法
Jul 30 #Python
python文档字符串(函数使用说明)使用详解
Jul 30 #Python
You might like
php中通过smtp发邮件的类,测试通过
2007/01/22 PHP
PHP文件操作详解
2016/12/30 PHP
利用 fsockopen() 函数开放端口扫描器的实例
2017/08/19 PHP
PHP实现普通hash分布式算法简单示例
2018/08/06 PHP
PHP date_default_timezone_set()设置时区操作实例分析
2020/05/16 PHP
取得传值的函数
2006/10/27 Javascript
一个js写的日历(代码部分网摘)
2009/09/20 Javascript
jquery easyui combox一些实用的小方法
2013/12/25 Javascript
Jquery插件分享之气泡形提示控件grumble.js
2014/05/20 Javascript
Lua表达式和控制结构学习笔记
2014/12/15 Javascript
JavaScript中计算网页中某个元素的位置
2015/06/10 Javascript
js实现兼容IE、Firefox的图片缩放代码
2015/12/08 Javascript
基于jQuery实现美观且实用的倒计时实例代码
2015/12/30 Javascript
JS中的eval 为什么加括号
2016/04/13 Javascript
JavaScript中的数组遍历forEach()与map()方法以及兼容写法介绍
2016/05/19 Javascript
js选项卡的制作方法
2017/01/23 Javascript
修改 bootstrap table 默认detailRow样式的实例代码
2017/07/21 Javascript
使用vue与jquery实时监听用户输入状态的操作代码
2017/09/19 jQuery
jquery实现垂直无限轮播的方法分析
2019/07/16 jQuery
vue 移动端记录页面浏览位置的方法
2020/03/11 Javascript
详解React 条件渲染
2020/07/08 Javascript
vue中使用vue-pdf的方法详解
2020/09/05 Javascript
[02:05]2014DOTA2西雅图邀请赛 老队长全明星大猜想谁不服就按进显示器
2014/07/08 DOTA
在Python下使用Txt2Html实现网页过滤代理的教程
2015/04/11 Python
python中Switch/Case实现的示例代码
2017/11/09 Python
python 获取当天凌晨零点的时间戳方法
2018/05/22 Python
python自动化测试无法启动谷歌浏览器问题
2019/10/10 Python
ubuntu16.04升级Python3.5到Python3.7的方法步骤
2020/08/20 Python
请说出这段代码执行后a和b的值分别是多少
2015/03/28 面试题
经典的班主任推荐信
2013/10/28 职场文书
数据员岗位职责
2013/11/19 职场文书
教书育人演讲稿
2014/09/11 职场文书
学校副校长四风对照检查材料整改措施
2014/09/25 职场文书
大学生个人年度总结范文
2015/02/15 职场文书
百年孤独读书笔记
2015/06/29 职场文书
【海涛dota解说】海涛小满开黑4v5被破两路翻盘潮汐第一视角解说
2022/04/01 DOTA