python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作摄像头截图实现远程监控的例子
Mar 25 Python
python进阶教程之文本文件的读取和写入
Aug 29 Python
Linux下使用python自动修改本机网关代码分享
May 21 Python
十个Python程序员易犯的错误
Dec 15 Python
Caffe均值文件mean.binaryproto转mean.npy的方法
Jul 09 Python
Django CBV与FBV原理及实例详解
Aug 12 Python
VSCode中自动为Python文件添加头部注释
Nov 14 Python
python学生信息管理系统实现代码
Dec 17 Python
Python super()函数使用及多重继承
May 06 Python
Django微信小程序后台开发教程的实现
Jun 03 Python
python实现简易版学生成绩管理系统
Jun 22 Python
浅谈对python中if、elif、else的误解
Aug 20 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
四种php中webservice实现的简单架构方法及实例
2015/02/03 PHP
php短址转换实现方法
2015/02/25 PHP
WordPress中用于更新伪静态规则的PHP代码实例讲解
2015/12/18 PHP
php实现简单加入购物车功能
2017/03/07 PHP
YII中Ueditor富文本编辑器文件和图片上传的配置图文教程
2017/03/15 PHP
thinkphp查询,3.X 5.0方法(亲试可行)
2017/06/17 PHP
源码分析 Laravel 重复执行同一个队列任务的原因
2017/12/25 PHP
PHP PDOStatement::getColumnMeta讲解
2019/02/01 PHP
php设计模式之策略模式实例分析【星际争霸游戏案例】
2020/03/26 PHP
页面加载完成后再执行JS的jquery写法以及区别说明
2014/02/22 Javascript
PHP开发者必须掌握的6个关键字
2014/04/14 Javascript
jquery学习总结(超级详细)
2014/09/04 Javascript
TinyMCE提交AjaxForm获取不到数据的解决方法
2015/03/05 Javascript
JavaScript中的splice()方法使用详解
2015/06/09 Javascript
Bootstrapvalidator校验、校验清除重置的实现代码(推荐)
2016/09/28 Javascript
JavaScript中全选、全不选、反选、无刷新删除、批量删除、即点即改入库(在yii框架中操作)的代码分享
2016/11/01 Javascript
用react-redux实现react组件之间数据共享的方法
2018/06/08 Javascript
详解小程序原生使用ES7 async/await语法
2018/08/06 Javascript
Node.js使用MongoDB的ObjectId作为查询条件的方法
2019/09/10 Javascript
Node.js web 应用如何封装到Docker容器中
2020/09/01 Javascript
简单介绍Python中的RSS处理
2015/04/13 Python
Python中的getopt函数使用详解
2015/07/28 Python
Python利用公共键如何对字典列表进行排序详解
2018/05/19 Python
Flask Web开发入门之文件上传(八)
2018/08/17 Python
python实现自动登录后台管理系统
2018/10/18 Python
windows python3安装Jupyter Notebooks教程
2020/04/13 Python
python中return不返回值的问题解析
2020/07/22 Python
python 代码运行时间获取方式详解
2020/09/18 Python
python 用struct模块解决黏包问题
2020/11/07 Python
python中的插入排序的简单用法
2021/01/19 Python
Django+Django-Celery+Celery的整合实战
2021/01/20 Python
高三自我评价
2014/02/01 职场文书
道路运输企业安全生产责任书
2014/07/28 职场文书
英语导游词
2015/02/13 职场文书
利用python进行数据加载
2021/06/20 Python
面试被问select......for update会锁表还是锁行
2021/11/11 MySQL