Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python文件与目录操作实例详解
Feb 22 Python
详解Python的Flask框架中生成SECRET_KEY密钥的方法
Jun 07 Python
分析Python读取文件时的路径问题
Feb 11 Python
python和flask中返回JSON数据的方法
Mar 26 Python
python+PyQT实现系统桌面时钟
Jun 16 Python
详解Ubuntu16.04安装Python3.7及其pip3并切换为默认版本
Feb 25 Python
python通过http下载文件的方法详解
Jul 26 Python
通过python3实现投票功能代码实例
Sep 26 Python
python pycharm的安装及其使用
Oct 11 Python
python使用pandas抽样训练数据中某个类别实例
Feb 28 Python
基于Python爬取股票数据过程详解
Oct 21 Python
Python万能模板案例之matplotlib绘制直方图的基本配置
Apr 13 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
ThinkPHP CURD方法之where方法详解
2014/06/18 PHP
PHP防止注入攻击实例分析
2014/11/03 PHP
WordPress中设置Post Type自定义文章类型的实例教程
2016/05/10 PHP
JavaScript中出现乱码的处理心得
2009/12/24 Javascript
Jquery中$.get(),$.post(),$.ajax(),$.getJSON()的用法总结
2013/11/14 Javascript
json的定义、标准格式及json字符串检验
2014/05/11 Javascript
超级简单的jquery操作表格方法
2014/12/15 Javascript
javascript实现依次输入input自动定焦
2014/12/23 Javascript
Angularjs实现多个页面共享数据的方式
2016/03/29 Javascript
JavaScript中的toString()和toLocaleString()方法的区别
2017/02/15 Javascript
详解js中Array的方法及技巧
2018/09/12 Javascript
微信小程序中如何使用flyio封装网络请求
2019/07/03 Javascript
跨平台python异步回调机制实现和使用方法
2013/11/26 Python
Python的socket模块源码中的一些实现要点分析
2016/06/06 Python
对python字典元素的添加与修改方法详解
2018/07/06 Python
python环形单链表的约瑟夫问题详解
2018/09/27 Python
python 动态生成变量名以及动态获取变量的变量名方法
2019/01/20 Python
django框架实现一次性上传多个文件功能示例【批量上传】
2019/06/19 Python
python编写简单端口扫描器
2019/09/04 Python
python模块如何查看
2020/06/16 Python
python 制作网站筛选工具(附源码)
2021/01/21 Python
详解使用canvas保存网页为pdf文件支持跨域
2018/11/23 HTML / CSS
彪马土耳其官网:PUMA土耳其
2019/07/14 全球购物
DBA的职责都有哪些
2012/05/16 面试题
XMLHttpRequest对象在IE和Firefox中创建方式有没有不同
2016/03/23 面试题
电气工程及其自动化自我评价四篇
2013/09/24 职场文书
大学毕业生简单自荐信
2013/11/05 职场文书
关于旷工的检讨书
2014/02/02 职场文书
关于奉献的演讲稿
2014/05/21 职场文书
党员自我评议对照检查材料
2014/09/27 职场文书
安全保证书格式
2015/02/28 职场文书
门卫管理制度范本
2015/08/05 职场文书
九年级语文教学反思
2016/03/03 职场文书
Python Socket编程详解
2021/04/25 Python
go mod 安装依赖 unkown revision问题的解决方案
2021/05/06 Golang
详解Oracle数据库中自带的所有表结构(sql代码)
2021/11/20 Oracle