Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python函数中定义参数的四种方式
Nov 30 Python
Python实现约瑟夫环问题的方法
May 03 Python
Python实现将Excel转换成为image的方法
Oct 23 Python
Python判断一个list中是否包含另一个list全部元素的方法分析
Dec 24 Python
Python子类继承父类构造函数详解
Feb 19 Python
selenium获取当前页面的url、源码、title的方法
Jun 12 Python
自定义django admin model表单提交的例子
Aug 23 Python
pytorch forward两个参数实例
Jan 17 Python
如何将PySpark导入Python的放实现(2种)
Apr 26 Python
python super()函数的基本使用
Sep 10 Python
Python实现网络聊天室的示例代码(支持多人聊天与私聊)
Jan 27 Python
深入理解python多线程编程
Apr 18 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
解析coreseek for sphinx的使用
2013/06/21 PHP
PHP文件去掉PHP注释空格的函数分析(PHP代码压缩)
2013/07/02 PHP
PHP中数组的分组排序实例
2014/06/01 PHP
php获取客户端电脑屏幕参数的方法
2015/01/09 PHP
PHP生成树的方法
2015/07/28 PHP
lnmp安装多版本PHP共存的方法详解
2018/08/02 PHP
PHP微信网页授权的配置文件操作分析
2019/05/29 PHP
TP5(thinkPHP5)框架使用ajax实现与后台数据交互的方法小结
2020/02/10 PHP
javascript innerHTML使用分析
2010/12/03 Javascript
jquery实现全选和全不选功能效果的实现代码【推荐】
2016/05/05 Javascript
原生js编写2048小游戏
2017/03/17 Javascript
Jquery获取radio选中的值
2017/05/05 jQuery
JavaScript算法教程之sku(库存量单位)详解
2017/06/29 Javascript
JS实现的ajax和同源策略(实例讲解)
2017/12/01 Javascript
vue实现登录后页面跳转到之前页面
2018/01/07 Javascript
小程序实现列表删除功能
2018/10/30 Javascript
antd Upload 文件上传的示例代码
2018/12/14 Javascript
JavaScript判断浏览器运行环境的详细方法
2019/06/30 Javascript
[42:25]EG vs Spirit Supermajor 败者组 BO3 第二场 6.4
2018/06/05 DOTA
Python学习笔记_数据排序方法
2014/05/22 Python
python 容器总结整理
2017/04/04 Python
Python编程之Re模块下的函数介绍
2017/10/28 Python
Python cookbook(数据结构与算法)实现优先级队列的方法示例
2018/02/18 Python
Python Pandas 如何shuffle(打乱)数据
2019/07/30 Python
pytorch使用tensorboardX进行loss可视化实例
2020/02/24 Python
python通过cython加密代码
2020/12/11 Python
CSS3教程(2):网页边框半径和网页圆角
2009/04/02 HTML / CSS
速卖通欧盟:Aliexpress EU
2020/08/19 全球购物
水务局局长岗位职责
2013/11/28 职场文书
期末学生评语大全
2014/04/24 职场文书
社团活动总结报告
2014/06/27 职场文书
2015年污水处理厂工作总结
2015/05/26 职场文书
2016新年感言
2015/08/03 职场文书
素质教育学习心得体会
2016/01/19 职场文书
应用最多的公文《通知》如何写?
2019/04/02 职场文书
关于Vue Router的10条高级技巧总结
2021/05/06 Vue.js