Python 实现训练集、测试集随机划分


Posted in Python onJanuary 08, 2020

随机从列表中取出元素:

import random
dataSet = [[0], [1], [2], [3], [4], [5], [6], [7], [8], [9], [10]]
trainDataSet = random.sample(dataSet, 3)

Python 实现训练集、测试集随机划分

以下函数,使用于我最近的一个机器学习的项目,将数据集数据按照比例随机划分成训练集数据和测试集数据:

import csv
import random
def getDataSet(proportion):
  """
    :exception
      获取训练集和测试集(将数据按比例随机划分)
    :parameter
      proportion - 测试集/数据集
    :return
      trainDataSet - 训练集
      testDataSet - 测试集
    author
      肖政宇
    modify
      2019年5月10日
  """
  dataSet = open('数据集.csv')
  dataSetReader = csv.reader(dataSet)
  """
    :exception
      将数据保存到数组
  """
  dataSet = []
  next(dataSetReader, 'none') # 跳过表头
  data = next(dataSetReader, 'none')
  while (data != 'none'):
    dataSet.append(data)
    data = next(dataSetReader, 'none')
  """
    :exception
      按照比例随机划分出训练集和测试集
  """
  dataNumber = dataSet.__len__() # 数据集数据条数
  testNumber = int(dataNumber * proportion) # 测试集数据条数
  testDataSet = [] # 测试数据集
  trainDataSet = [] # 训练数据集
 
  testDataSet = random.sample(dataSet, testNumber) # 测试集
  for testData in testDataSet: # 将已经选定的测试集数据从数据集中删除
    dataSet.remove(testData)
  trainDataSet = dataSet # 训练集
 
  return trainDataSet, testDataSet

以上这篇Python 实现训练集、测试集随机划分就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python的Django框架安装全攻略
Jul 15 Python
Python AES加密模块用法分析
May 22 Python
python利用urllib和urllib2访问http的GET/POST详解
Sep 27 Python
Python数据分析之双色球统计单个红和蓝球哪个比例高的方法
Feb 03 Python
创建pycharm的自定义python模板方法
May 23 Python
Python访问MongoDB,并且转换成Dataframe的方法
Oct 15 Python
OpenCV-Python 摄像头实时检测人脸代码实例
Apr 30 Python
Python 3 实现定义跨模块的全局变量和使用教程
Jul 07 Python
Python基础教程之输入输出和运算符
Jul 26 Python
next在python中返回迭代器的实例方法
Dec 15 Python
Linux系统下升级pip的完整步骤
Jan 31 Python
用Python将库打包发布到pypi
Apr 13 Python
Pyecharts绘制全球流向图的示例代码
Jan 08 #Python
PyTorch 解决Dataset和Dataloader遇到的问题
Jan 08 #Python
使用PyTorch将文件夹下的图片分为训练集和验证集实例
Jan 08 #Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
Jan 08 #Python
Pycharm 2020最新永久激活码(附最新激活码和插件)
Sep 17 #Python
将matplotlib绘图嵌入pyqt的方法示例
Jan 08 #Python
pyinstaller还原python代码过程图解
Jan 08 #Python
You might like
把从SQL中取出的数据转化成XMl格式
2006/10/09 PHP
javascript 清除输入框中的数据
2009/04/13 Javascript
javascript 折半查找字符在数组中的位置(有序列表)
2010/12/09 Javascript
Webkit的跨域安全问题说明
2011/09/13 Javascript
javascript中Date对象的getDay方法使用指南
2014/12/22 Javascript
纯js实现仿QQ邮箱弹出确认框
2015/04/29 Javascript
JavaScript 实现的 zip 压缩和解压缩工具包Zip.js使用详解
2015/12/14 Javascript
Bootstrap CSS组件之分页(pagination)和翻页(pager)
2016/12/17 Javascript
babel基本使用详解
2017/02/17 Javascript
详解AngularJS通过ocLazyLoad实现动态(懒)加载模块和依赖
2017/03/01 Javascript
JavaScript之underscore_动力节点Java学院整理
2017/07/03 Javascript
Angular 4.X开发实践中的踩坑小结
2017/07/04 Javascript
Django+Vue.js搭建前后端分离项目的示例
2017/08/07 Javascript
React Native 图片查看组件的方法
2018/03/01 Javascript
vue 根据选择条件显示指定参数的例子
2019/11/09 Javascript
Vue如何使用混合Mixins和插件开发详解
2020/02/05 Javascript
django简单的前后端分离的数据传输实例 axios
2020/05/18 Javascript
node使用async_hooks模块进行请求追踪
2021/01/28 Javascript
[03:41]DOTA2上海特锦赛小组赛第三日recap精彩回顾
2016/02/28 DOTA
详解python的数字类型变量与其方法
2016/11/20 Python
django框架模型层功能、组成与用法分析
2019/07/30 Python
Python 多线程搜索txt文件的内容,并写入搜到的内容(Lock)方法
2019/08/23 Python
Python中six模块基础用法
2019/12/08 Python
django实现后台显示媒体文件
2020/04/07 Python
使用keras实现孪生网络中的权值共享教程
2020/06/11 Python
Python之字典对象的几种创建方法
2020/09/30 Python
Python爬虫爬取微博热搜保存为 Markdown 文件的源码
2021/02/22 Python
使用CSS3的appearance属性改变任何元素的浏览器默认风格
2012/12/24 HTML / CSS
如何使用amaze ui的分页样式封装一个通用的JS分页控件
2020/08/21 HTML / CSS
阿迪达斯中国官网:Adidas中国
2020/12/14 全球购物
私营公司诉讼代理委托书范本
2014/09/13 职场文书
民主生活会汇报材料
2014/12/15 职场文书
幼儿园小班工作总结2015
2015/04/25 职场文书
用Python爬取各大高校并可视化帮弟弟选大学,弟弟直呼牛X
2021/06/11 Python
Java移除无效括号的方法实现
2021/08/07 Java/Android
企业版Windows 11有哪些新功能? Win11适用于企业的功能介绍
2021/11/21 数码科技