python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python使用递归解决全排列数字示例
Feb 11 Python
python文件操作整理汇总
Oct 21 Python
深入Python解释器理解Python中的字节码
Apr 01 Python
python使用multiprocessing模块实现带回调函数的异步调用方法
Apr 18 Python
python实现简单的socket server实例
Apr 29 Python
用Python编写一个每天都在系统下新建一个文件夹的脚本
May 04 Python
python的pip安装以及使用教程
Sep 18 Python
python字符串替换re.sub()方法解析
Sep 18 Python
解决Python列表字符不区分大小写的问题
Dec 19 Python
使用jupyter notebook运行python和R的步骤
Aug 13 Python
Manjaro、pip、conda更换国内源的方法
Nov 17 Python
python解包概念及实例
Feb 17 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
Optimizer与Debugger兼容性问题的解决方法
2008/12/01 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(一)
2014/06/23 PHP
PHP实现简单爬虫的方法
2015/07/29 PHP
php实现的简单中文验证码功能示例
2017/01/03 PHP
js 居中漂浮广告
2010/03/21 Javascript
jquery内置验证(validate)使用方法示例(表单验证)
2013/12/04 Javascript
jQuery之字体大小的设置方法
2014/02/27 Javascript
超链接的禁用属性Disabled使用示例
2014/07/31 Javascript
设计模式中的组合模式在JavaScript程序构建中的使用
2016/05/18 Javascript
canvas快速绘制圆形、三角形、矩形、多边形方法介绍
2016/12/29 Javascript
jQuery插件FusionCharts绘制的3D环饼图效果示例【附demo源码】
2017/04/02 jQuery
手把手教你搭建ES6的开发运行环境
2017/07/11 Javascript
利用JS做网页特效_大图轮播(实例讲解)
2017/08/09 Javascript
vue项目查看vue版本及cli版本的实现方式
2020/10/24 Javascript
vue3.0搭配.net core实现文件上传组件
2020/10/29 Javascript
Vue常用API、高级API的相关总结
2021/02/02 Vue.js
[02:44]DOTA2英雄基础教程 克林克兹
2014/01/15 DOTA
[01:39]2014DOTA2国际邀请赛 Newbee经理CU专访队伍火力全开
2014/07/15 DOTA
Python和C/C++交互的几种方法总结
2017/05/11 Python
python的mysqldb安装步骤详解
2017/08/14 Python
python实现百万答题自动百度搜索答案
2018/01/16 Python
浅谈Python小波分析库Pywavelets的一点使用心得
2019/07/09 Python
基于Python实现ComicReaper漫画自动爬取脚本过程解析
2019/11/11 Python
python中的函数递归和迭代原理解析
2019/11/14 Python
Python qrcode 生成一个二维码的实例详解
2020/02/12 Python
django xadmin中form_layout添加字段显示方式
2020/03/30 Python
Tensorflow中k.gradients()和tf.stop_gradient()用法说明
2020/06/10 Python
win10安装python3.6的常见问题
2020/07/01 Python
大二学生职业生涯规划书
2014/02/05 职场文书
知识竞赛拉拉队口号
2014/06/16 职场文书
2014班子“三严三实”对照检查材料思想汇报
2014/09/18 职场文书
任命书怎么写
2015/03/02 职场文书
2015年人民调解工作总结
2015/05/18 职场文书
2016大学军训心得体会
2016/01/11 职场文书
tensorflow+k-means聚类简单实现猫狗图像分类的方法
2021/04/28 Python
css常用字体属性与背景属性介绍
2022/02/28 HTML / CSS