python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
使用Python编写爬虫的基本模块及框架使用指南
Jan 20 Python
Python爬虫爬取美剧网站的实现代码
Sep 03 Python
Python用zip函数同时遍历多个迭代器示例详解
Nov 14 Python
解决Python 爬虫URL中存在中文或特殊符号无法请求的问题
May 11 Python
pycharm创建scrapy项目教程及遇到的坑解析
Aug 15 Python
python微信公众号开发简单流程实现
Mar 09 Python
python开发实例之python使用Websocket库开发简单聊天工具实例详解(python+Websocket+JS)
Mar 18 Python
使用PyQt的QLabel组件实现选定目标框功能的方法示例
May 19 Python
基于python实现可视化生成二维码工具
Jul 08 Python
python实现企业微信定时发送文本消息的实例代码
Nov 25 Python
Python OpenCV超详细讲解基本功能
Apr 02 Python
Elasticsearch 索引操作和增删改查
Apr 19 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
PHP编程与应用
2006/10/09 PHP
phpMyAdmin下载、安装和使用入门教程
2007/05/31 PHP
php数据库操作model类(使用__call方法)
2016/11/16 PHP
php实现大文件断点续传下载实例代码
2019/10/01 PHP
laravel 实现登陆后返回登陆前的页面方法
2019/10/03 PHP
不用写JS也能使用EXTJS视频演示
2008/12/29 Javascript
基于jquery的仿百度的鼠标移入图片抖动效果
2010/09/17 Javascript
JS等比例缩小图片尺寸的实例
2013/02/27 Javascript
javascript函数中参数传递问题示例探讨
2014/07/31 Javascript
jQuery中offset()方法用法实例
2015/01/16 Javascript
jquery+php随机生成红包金额数量代码分享
2015/08/27 Javascript
js实现input密码框提示信息的方法(附html5实现方法)
2016/01/14 Javascript
javascript中call,apply,bind函数用法示例
2016/12/19 Javascript
js基于myFocus实现轮播图效果
2017/02/14 Javascript
javascript中mouseenter与mouseover的异同
2017/06/06 Javascript
EasyUI的TreeGrid的过滤功能的解决思路
2017/08/08 Javascript
动态统计当前输入内容的字节、字符数的实例详解
2017/10/27 Javascript
js嵌套的数组扁平化:将多维数组变成一维数组以及push()与concat()区别的讲解
2019/01/19 Javascript
vue.js多页面开发环境搭建过程
2019/04/24 Javascript
教你搭建按需加载的Vue组件库(小结)
2019/07/29 Javascript
浅谈vue中get请求解决传输数据是数组格式的问题
2020/08/03 Javascript
[03:27]最受玩家喜爱奖提名:PZH_Element 致玩家寄语
2016/12/20 DOTA
Python基于回溯法子集树模板解决m着色问题示例
2017/09/07 Python
python3.0 模拟用户登录,三次错误锁定的实例
2017/11/02 Python
python实现机器人行走效果
2018/01/29 Python
django 修改server端口号的方法
2018/05/14 Python
pandas每次多Sheet写入文件的方法
2018/12/10 Python
Python三元运算与lambda表达式实例解析
2019/11/30 Python
将数据集制作成VOC数据集格式的实例
2020/02/17 Python
CSS3旋转——彩色扇子兼容firefox浏览器
2013/06/04 HTML / CSS
斯凯奇美国官网:SKECHERS美国
2016/08/20 全球购物
爱心捐助活动总结
2015/05/09 职场文书
幼儿园班级管理心得体会
2016/01/07 职场文书
2016年小学植树节活动总结
2016/03/16 职场文书
2019年年中工作总结讲话稿模板
2019/03/25 职场文书
国际最新研究在陨石中发现DNA主要成分 或由陨石带来地球
2022/04/29 数码科技