Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
详解设计模式中的工厂方法模式在Python程序中的运用
Mar 02 Python
python和ruby,我选谁?
Sep 13 Python
python 编码规范整理
May 05 Python
python 对dataframe下面的值进行大规模赋值方法
Jun 09 Python
使用Python的toolz库开始函数式编程的方法
Nov 15 Python
在Python中调用Ping命令,批量IP的方法
Jan 26 Python
基于Python实现用户管理系统
Feb 26 Python
Python3批量移动指定文件到指定文件夹方法示例
Sep 02 Python
python名片管理系统开发
Jun 18 Python
windows支持哪个版本的python
Jul 03 Python
Python基于locals返回作用域字典
Oct 17 Python
详解Python内置模块Collections
Mar 22 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
Windows 下的 PHP-PEAR 安装方法
2010/11/20 PHP
ThinkPHP中ajax使用实例教程
2014/08/22 PHP
php+mysql数据库实现无限分类的方法
2014/12/12 PHP
PHP中的闭包(匿名函数)浅析
2015/02/07 PHP
Aster vs KG BO3 第三场2.19
2021/03/10 DOTA
基于mootools 1.3框架下的图片滑动效果代码
2011/04/22 Javascript
jquery操作select详解(取值,设置选中)
2014/02/07 Javascript
Chrome扩展页面动态绑定JS事件提示错误
2014/02/11 Javascript
js获取页面传来参数的方法
2014/09/06 Javascript
jQuery中unwrap()方法用法实例
2015/01/16 Javascript
jQuery使用before()和after()在元素前后添加内容的方法
2015/03/26 Javascript
js实现同一页面多个运动效果的方法
2015/04/10 Javascript
Javascript闭包与函数柯里化浅析
2016/06/22 Javascript
jQuery制作图片旋转效果
2017/02/02 Javascript
教你快速搭建Node.Js服务器的方法教程
2017/03/30 Javascript
完美实现js拖拽效果 return false用法详解
2017/07/28 Javascript
用Vue.extend构建消息提示组件的方法实例
2017/08/08 Javascript
微信小程序实现文字跑马灯效果
2020/05/26 Javascript
vue click.stop阻止点击事件继续传播的方法
2018/09/04 Javascript
bootstrapValidator表单校验、更改状态、新增、移除校验字段的实例代码
2020/05/19 Javascript
vue项目接口域名动态获取操作
2020/08/13 Javascript
JavaScript 实现轮播图特效的示例
2020/11/05 Javascript
python导包的几种方法(自定义包的生成以及导入详解)
2019/07/15 Python
Python实现把多维数组展开成DataFrame
2019/11/30 Python
使用Python打造一款间谍程序的流程分析
2020/02/21 Python
浅谈css3中的渐进增强和优雅降级
2017/12/01 HTML / CSS
Vince官网:全球著名设计师品牌,休闲而优雅的服饰
2017/01/15 全球购物
澳大利亚制造的羊皮靴:Original UGG Boots
2017/11/13 全球购物
struct与class的区别
2014/02/03 面试题
Java中有几种类型的流?JDK为每种类型的流提供了一些抽象类以供继承,请说出他们分别是哪些类?
2012/05/30 面试题
销售助理岗位职责
2014/02/21 职场文书
公司活动方案范文
2014/03/06 职场文书
国庆庆典邀请函
2015/02/02 职场文书
2015年教学副校长工作总结
2015/07/22 职场文书
汉语拼音教学反思
2016/02/22 职场文书
小程序实现筛子抽奖
2021/05/26 Javascript