Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用map函数来完成Python并行任务的简单示例
Apr 02 Python
Python实现简单拆分PDF文件的方法
Jul 30 Python
python中使用序列的方法
Aug 03 Python
Python检测生僻字的实现方法
Oct 23 Python
python分布式环境下的限流器的示例
Oct 26 Python
Python subprocess模块常见用法分析
Jun 12 Python
浅谈利用numpy对矩阵进行归一化处理的方法
Jul 11 Python
python 重命名轴索引的方法
Nov 10 Python
计算Python Numpy向量之间的欧氏距离实例
May 22 Python
python程序如何进行保存
Jul 03 Python
python反扒机制的5种解决方法
Feb 06 Python
django如何自定义manage.py管理命令
Apr 27 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
《雄兵连》《烈阳天道》真的来了
2020/07/13 国漫
PHP下通过系统信号量加锁方式获取递增序列ID
2009/09/25 PHP
一个漂亮的php验证码类(分享)
2013/08/06 PHP
理解PHP中的stdClass类
2014/04/18 PHP
php验证码实现代码(3种)
2015/09/07 PHP
jQuery+Ajax+PHP“喜欢”评级功能实现代码
2015/10/08 PHP
php微信开发之批量生成带参数的二维码
2016/06/26 PHP
php二维数组按某个键值排序的实例讲解
2019/02/15 PHP
Yii框架通过请求组件处理get,post请求的方法分析
2019/09/03 PHP
利用JS重写Cognos右键菜单的实现代码
2010/04/11 Javascript
js分解url参数(面向对象-极简主义法应用)
2012/08/09 Javascript
javaScript复制功能调用实现方案
2012/12/13 Javascript
Javascript this 关键字 详解
2014/10/22 Javascript
javascript数组排序汇总
2015/07/07 Javascript
JS实现新浪博客左侧的Blog管理菜单效果代码
2015/10/22 Javascript
jQuery限制图片大小的方法
2016/05/25 Javascript
js基于cookie方式记住返回页面用法示例
2016/05/27 Javascript
解析Vue 2.5的Diff算法
2017/11/28 Javascript
vue 路由页面之间实现用手指进行滑动的方法
2018/02/23 Javascript
js异步上传多张图片插件的使用方法
2018/10/22 Javascript
jQuery实现朋友圈查看图片
2020/09/11 jQuery
[43:14]Liquid vs Optic 2018国际邀请赛淘汰赛BO3 第二场 8.21
2018/08/22 DOTA
Python 读取图片文件为矩阵和保存矩阵为图片的方法
2018/04/27 Python
django解决跨域请求的问题详解
2019/01/20 Python
python使用SQLAlchemy操作MySQL
2020/01/02 Python
解决Python spyder显示不全df列和行的问题
2020/04/20 Python
利用pipenv和pyenv管理多个相互独立的Python虚拟开发环境
2020/11/01 Python
selenium框架中driver.close()和driver.quit()关闭浏览器
2020/12/08 Python
怎样客观的做好自我评价
2013/12/28 职场文书
主题婚礼策划方案
2014/02/10 职场文书
歌颂党的演讲稿
2014/09/10 职场文书
学校运动会开幕词
2016/03/03 职场文书
MySQL 重写查询语句的三种策略
2021/05/10 MySQL
Jupyter Notebook内使用argparse报错的解决方案
2021/06/03 Python
MySQL分区表实现按月份归类
2021/11/01 MySQL
MySQL视图概念以及相关应用
2022/04/19 MySQL