python Pandas如何对数据集随机抽样


Posted in Python onJuly 29, 2019

摘要:有时候我们只需要数据集中的一部分,并不需要全部的数据。这个时候我们就要对数据集进行随机的抽样。pandas中自带有抽样的方法。

应用场景:

python Pandas如何对数据集随机抽样

我有10W行数据,每一行都11列的属性。

现在,我们只需要随机抽取其中的2W行。

实现方法很简单:

利用Pandas库中的sample。

DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

n是要抽取的行数。(例如n=20000时,抽取其中的2W行)

frac是抽取的比列。(有一些时候,我们并对具体抽取的行数不关系,我们想抽取其中的百分比,这个时候就可以选择使用frac,例如frac=0.8,就是抽取其中80%)

replace:是否为有放回抽样,取replace=True时为有放回抽样。

weights这个是每个样本的权重,具体可以看官方文档说明。

random_state这个在之前的文章已经介绍过了。

axis是选择抽取数据的行还是列。axis=0的时是抽取行,axis=1时是抽取列(也就是说axis=1时,在列中随机抽取n列,在axis=0时,在行中随机抽取n行)

具体用法:

假设DataFrame为df

import pandas as pd
df.sample(n=20000)

python Pandas如何对数据集随机抽样

另外,介绍一种不是Pandas中的方法。如果想用Numpy这个库进行也可以。

import numpy as np
np.random.sample(Your_index)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python基础教程之lambda表达式使用方法
Feb 12 Python
Python中的二叉树查找算法模块使用指南
Jul 04 Python
Python使用百度API上传文件到百度网盘代码分享
Nov 08 Python
举例讲解Python程序与系统shell交互的方式
Apr 09 Python
python中reload(module)的用法示例详解
Sep 15 Python
python使用tensorflow保存、加载和使用模型的方法
Jan 31 Python
详解Python计算机视觉 图像扭曲(仿射扭曲)
Mar 27 Python
Python当中的array数组对象实例详解
Jun 12 Python
简单了解Python生成器是什么
Jul 02 Python
基于Python执行dos命令并获取输出的结果
Dec 30 Python
Python常用数据分析模块原理解析
Jul 20 Python
Python办公自动化PPT批量转换操作
Sep 15 Python
python Django 创建应用过程图示详解
Jul 29 #Python
使用Pandas对数据进行筛选和排序的实现
Jul 29 #Python
Python+Pyqt实现简单GUI电子时钟
Feb 22 #Python
pycharm修改文件的默认打开方式的步骤
Jul 29 #Python
Python Django Vue 项目创建过程详解
Jul 29 #Python
python cumsum函数的具体使用
Jul 29 #Python
python利用re,bs4,requests模块获取股票数据
Jul 29 #Python
You might like
Windows2003 下 MySQL 数据库每天自动备份
2006/12/21 PHP
ubuntu12.04使用c编写php扩展模块教程分享
2013/12/25 PHP
php冒泡排序、快速排序、快速查找、二维数组去重实例分享
2014/04/24 PHP
Smarty模板学习笔记之Smarty简介
2014/05/20 PHP
PHP curl CURLOPT_RETURNTRANSFER参数的作用使用实例
2015/02/07 PHP
php计算整个mysql数据库大小的方法
2015/06/19 PHP
PHP工厂模式的日常使用
2019/03/20 PHP
PHPUnit + Laravel单元测试常用技能
2019/11/06 PHP
javascritp实现input输入框相关限制用法
2007/06/29 Javascript
JavaScript 常用函数库详解
2009/10/21 Javascript
Three.js源码阅读笔记(光照部分)
2012/12/27 Javascript
javascript中的onkeyup和onkeydown区别介绍
2013/04/28 Javascript
a标签的href和onclick 的事件的区别介绍
2013/07/26 Javascript
js生成随机数之random函数随机示例
2013/12/20 Javascript
jQuery$命名冲突怎么办如何解决
2014/01/16 Javascript
Extjs Label的 fieldLabel和html属性值对齐的方法
2014/06/15 Javascript
javascript文本模板用法实例
2015/07/31 Javascript
三个js循环的关键字示例(for与while)
2016/02/16 Javascript
JavaScript 2048 游戏实例代码(简单易懂)
2016/03/25 Javascript
JS简单编号生成器实现方法(附demo源码下载)
2016/04/05 Javascript
微信小程序  生命周期详解
2016/10/27 Javascript
JavaScript实现兼容IE6的收起折叠与展开效果实例
2017/09/20 Javascript
浅析Vue自定义组件的v-model
2017/11/26 Javascript
vuejs实现标签选项卡动态更改css样式的方法
2018/05/31 Javascript
vue axios 简单封装以及思考
2018/10/09 Javascript
layui 实现二级弹窗弹出之后 关闭一级弹窗的方法
2019/09/18 Javascript
vue动态渲染svg、添加点击事件的实现
2020/03/13 Javascript
vue+element-ui表格封装tag标签使用插槽
2020/06/18 Javascript
VUE 实现element upload上传图片到阿里云
2020/08/12 Javascript
vue中如何添加百度统计代码
2020/12/19 Vue.js
Python最基本的数据类型以及对元组的介绍
2015/04/14 Python
python中星号变量的几种特殊用法
2016/09/07 Python
Python标准库sched模块使用指南
2017/07/06 Python
python装饰器练习题及答案
2019/11/01 Python
Python使用socket_TCP实现小文件下载功能
2020/10/09 Python
十八大感想感言
2014/02/10 职场文书