python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中的闭包总结
Sep 18 Python
Python中类的定义、继承及使用对象实例详解
Apr 30 Python
Python优化技巧之利用ctypes提高执行速度
Sep 11 Python
django站点管理详解
Dec 12 Python
Python格式化字符串f-string概览(小结)
Jun 18 Python
Pycharm新建模板默认添加个人信息的实例
Jul 15 Python
Python+Tensorflow+CNN实现车牌识别的示例代码
Oct 11 Python
wxpython自定义下拉列表框过程图解
Feb 14 Python
pytorch实现MNIST手写体识别
Feb 14 Python
Python HTMLTestRunner如何下载生成报告
Sep 04 Python
OpenCV读取与写入图片的实现
Oct 13 Python
python实现一个简单RPC框架的示例
Oct 28 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
php你的验证码安全码?
2007/01/02 PHP
PHP 变量的定义方法
2010/01/26 PHP
php检测apache mod_rewrite模块是否安装的方法
2015/03/14 PHP
PHP输入流php://input实例讲解
2015/12/22 PHP
一个简单的php MVC留言本实例代码(必看篇)
2016/09/22 PHP
php-fpm开启状态统计的方法详解
2017/06/23 PHP
YII2.0框架行为(Behavior)深入详解
2019/07/26 PHP
70+漂亮且极具亲和力的导航菜单设计国外网站推荐
2011/09/20 Javascript
NodeJS学习笔记之Connect中间件模块(一)
2015/01/27 NodeJs
BootStrap Table对前台页面表格的支持实例讲解
2016/12/22 Javascript
利用jquery实现实时更新歌词的方法
2017/01/06 Javascript
微信小程序 css使用技巧总结
2017/01/09 Javascript
将input框中输入内容显示在相应的div中【三种方法可选】
2017/05/08 Javascript
JS实现HTML页面中动态显示当前时间完整示例
2018/07/30 Javascript
vue axios请求频繁时取消上一次请求的方法
2018/11/10 Javascript
微信小程序 腾讯地图SDK 获取当前地址实现解析
2019/08/12 Javascript
JS document文档的简单操作完整示例
2020/01/13 Javascript
js实现验证码功能
2020/07/24 Javascript
解决antd 表单设置默认值initialValue后验证失效的问题
2020/11/02 Javascript
Python 高级专用类方法的实例详解
2017/09/11 Python
Python Tkinter模块实现时钟功能应用示例
2018/07/23 Python
使用Python的toolz库开始函数式编程的方法
2018/11/15 Python
详解用python实现基本的学生管理系统(文件存储版)(python3)
2019/04/25 Python
Python3批量生成带logo的二维码方法
2019/06/24 Python
Python音频操作工具PyAudio上手教程详解
2019/06/26 Python
python各类经纬度转换的实例代码
2019/08/08 Python
Python GUI库PyQt5样式QSS子控件介绍
2020/02/25 Python
CSS3模拟IOS滑动开关效果
2016/09/28 HTML / CSS
HTML5 与 XHTML2
2008/10/17 HTML / CSS
如何减少垃圾回收让内存更加有效使用
2013/10/18 面试题
Linux不知道文件后缀名怎么判断文件类型
2012/04/26 面试题
支行行长岗位职责
2015/02/15 职场文书
教师工作能力自我评价
2015/03/04 职场文书
《妈妈别哭,有我在》读后感3篇
2020/01/13 职场文书
MySql数据库 查询时间序列间隔
2022/05/11 MySQL
javascript中Set、Map、WeakSet、WeakMap区别
2022/12/24 Javascript