python Pandas如何对数据集随机抽样


Posted in Python onJuly 29, 2019

摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。

应用场景:

python Pandas如何对数据集随机抽样

我有10W行数据,每一行都11列的属性。

现在,我们只需要随机抽取其中的2W行。

实现方法很简单:

利用Pandas库中的sample。

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

n是要抽取的行数。(例如n=20000时,抽取其中的2W行)

frac是抽取的比列。(有一些时候,我们并对具体抽取的行数不关系,我们想抽取其中的百分比,这个时候就可以选择使用frac,例如frac=0.8,就是抽取其中80%)

replace:是否为有放回抽样,取replace=True时为有放回抽样。

weights这个是每个样本的权重,具体可以看官方文档说明。

random_state这个在之前的文章已经介绍过了。

axis是选择抽取数据的行还是列。axis=0的时是抽取行,axis=1时是抽取列(也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行)

具体用法:

假设DataFrame为df

import pandas as pd
df.sample(n=20000)

python Pandas如何对数据集随机抽样

另外,介绍一种不是Pandas中的方法。如果想用Numpy这个库进行也可以。

import numpy as np
np.random.sample(Your_index)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用python调用浏览器并打开一个网址的例子
Jun 05 Python
Windows下安装python MySQLdb遇到的问题及解决方法
Mar 16 Python
关于python的bottle框架跨域请求报错问题的处理方法
Mar 19 Python
Python3实现转换Image图片格式
Jun 21 Python
用python实现k近邻算法的示例代码
Sep 06 Python
浅谈解除装饰器作用(python3新增)
Oct 15 Python
python如何获取当前文件夹下所有文件名详解
Jan 25 Python
pytorch numpy list类型之间的相互转换实例
Aug 18 Python
python判断链表是否有环的实例代码
Jan 31 Python
python网络编程socket实现服务端、客户端操作详解
Mar 24 Python
Python 制作查询商品历史价格的小工具
Oct 20 Python
使用python tkinter开发一个爬取B站直播弹幕工具的实现代码
Feb 07 Python
python Django 创建应用过程图示详解
Jul 29 #Python
使用Pandas对数据进行筛选和排序的实现
Jul 29 #Python
Python+Pyqt实现简单GUI电子时钟
Feb 22 #Python
pycharm修改文件的默认打开方式的步骤
Jul 29 #Python
Python Django Vue 项目创建过程详解
Jul 29 #Python
python cumsum函数的具体使用
Jul 29 #Python
python利用re,bs4,requests模块获取股票数据
Jul 29 #Python
You might like
分享常见的几种页面静态化的方法
2015/01/08 PHP
微信支付开发发货通知实例
2016/07/12 PHP
PHP设计模式(一)工厂模式Factory实例详解【创建型】
2020/05/02 PHP
Javascript remove 自定义数组删除方法
2009/10/20 Javascript
JS与框架页的操作代码
2010/01/17 Javascript
JQuery学习笔录 简单的JQuery
2012/04/09 Javascript
jquery mobile实现拨打电话功能的几种方法
2013/08/05 Javascript
给ListBox添加双击事件示例代码
2013/12/02 Javascript
JavaScript fontcolor方法入门实例(按照指定的颜色来显示字符串)
2014/10/17 Javascript
js获取UserControl内容为拼html时提供方便
2014/11/02 Javascript
DOM 事件流详解
2015/01/20 Javascript
JQuery中绑定事件(bind())和移除事件(unbind())
2015/02/27 Javascript
jQuery实现两款有动画功能的导航菜单代码
2015/09/16 Javascript
js+flash实现的5图变换效果广告代码(附演示与demo源码下载)
2016/04/01 Javascript
window.open不被拦截的简单实现代码(推荐)
2016/08/04 Javascript
js在ie下打开对话窗口的方法小结
2016/10/24 Javascript
Bootstrap 3浏览器兼容性问题及解决方案
2017/04/11 Javascript
微信小程序中hidden不生效原因的解决办法
2017/04/26 Javascript
详解Nuxt内导航栏的两种实现方式
2020/04/16 Javascript
JavaScript使用prototype属性实现继承操作示例
2020/05/22 Javascript
详解JavaScript中的Object.is()与"==="运算符总结
2020/06/17 Javascript
OpenLayers3加载常用控件使用方法详解
2020/09/25 Javascript
在vs code 中如何创建一个自己的 Vue 模板代码
2020/11/10 Javascript
Python实现Linux下守护进程的编写方法
2014/08/22 Python
对python 匹配字符串开头和结尾的方法详解
2018/10/27 Python
实例详解Matlab 与 Python 的区别
2019/04/26 Python
python实现远程控制电脑
2019/05/23 Python
Python3.7 新特性之dataclass装饰器
2019/05/27 Python
python爬虫 基于requests模块的get请求实现详解
2019/08/20 Python
python实现贪吃蛇双人大战
2020/04/18 Python
世界上最大的街头服饰网站:Karmaloop
2017/02/04 全球购物
如何写一个Java类既可以用作applet也可以用作java应用
2016/01/18 面试题
仓库门卫岗位职责
2013/12/22 职场文书
2014年幼儿园国庆主题活动方案
2014/09/16 职场文书
自习课吵闹检讨书范文
2014/09/26 职场文书
怎么禁用Win11输入法 最新Win11输入法关闭教程
2022/08/05 数码科技