Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python正则表达式的使用范例详解
Aug 08 Python
python中关于for循环的碎碎念
Jun 30 Python
Python模拟鼠标点击实现方法(将通过实例自动化模拟在360浏览器中自动搜索python)
Aug 23 Python
cmd运行python文件时对结果进行保存的方法
May 16 Python
解决Python运行文件出现out of memory框的问题
Dec 03 Python
python模拟菜刀反弹shell绕过限制【推荐】
Jun 25 Python
pandas 缺失值与空值处理的实现方法
Oct 12 Python
基于Python中的yield表达式介绍
Nov 19 Python
python filecmp.dircmp实现递归比对两个目录的方法
May 22 Python
python 爬取B站原视频的实例代码
Sep 09 Python
Django Auth用户认证组件实现代码
Oct 13 Python
Python天气语音播报小助手
Sep 25 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
PHP生成等比缩略图类和自定义函数分享
2014/06/25 PHP
ThinkPHP中处理表单中的注意事项
2014/11/22 PHP
Laravel 5框架学习之Eloquent 关系
2015/04/09 PHP
PHP中的print_r 与 var_dump 输出数组
2016/06/13 PHP
PHP 断点续传实例详解
2017/11/11 PHP
suggestion开发小结以及对键盘事件的总结(针对中文输入法状态)
2011/12/20 Javascript
jquery垂直公告滚动实现代码
2013/12/08 Javascript
js拖拽一些常见的思路方法整理
2014/03/19 Javascript
JS实现局部选择打印和局部不选择打印
2014/04/03 Javascript
JavaScript实现班级随机点名小应用需求的具体分析
2014/05/12 Javascript
jquery图片倾斜层叠切换特效代码分享
2015/08/27 Javascript
jquery制作图片时钟特效
2020/03/30 Javascript
微信小程序前端源码逻辑和工作流
2016/09/25 Javascript
网站发布后Bootstrap框架引用woff字体无法正常显示的解决方法
2016/11/24 Javascript
jQuery实现动态添加tr到table的方法
2016/12/26 Javascript
纯JS实现简单的日历
2017/06/26 Javascript
详解基于node的前端项目编译时内存溢出问题
2017/08/01 Javascript
Vue源码解析之数组变异的实现
2018/12/04 Javascript
微信小程序实现的3d轮播图效果示例【基于swiper组件】
2018/12/11 Javascript
基于vue通用表单解决方案的思考与分析
2019/03/16 Javascript
微信小程序基于ColorUI构建皮皮虾短视频去水印组件
2020/11/04 Javascript
使用AutoJs实现微信抢红包的代码
2020/12/31 Javascript
[02:39]我与DAC之Newbee.Moogy:从论坛到TI
2018/03/26 DOTA
[01:16:37]【全国守擂赛】第三周决赛 Dark Knight vs. 一个弱队
2020/05/04 DOTA
Python模拟百度登录实例详解
2016/01/20 Python
python实现单线程多任务非阻塞TCP服务端
2017/06/13 Python
解决pycharm remote deployment 配置的问题
2019/06/27 Python
python输出数组中指定元素的所有索引示例
2019/12/06 Python
分享一个python的aes加密代码
2020/12/22 Python
详解html5 canvas常用api总结(二)--绘图API
2016/12/14 HTML / CSS
荷兰的时尚市场:To Be Dressed
2019/05/06 全球购物
PHP如何调用MYSQL存储过程
2014/05/30 面试题
经典c++面试题二
2015/08/14 面试题
铁路安全事故反思
2014/04/26 职场文书
会议通知
2015/04/15 职场文书
CKAD认证中部署k8s并配置Calico插件
2022/03/31 Servers