python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python冒泡排序算法的实现代码
Nov 21 Python
python图像处理之镜像实现方法
May 30 Python
详解python之简单主机批量管理工具
Jan 27 Python
python中模块的__all__属性详解
Oct 26 Python
对django中render()与render_to_response()的区别详解
Oct 16 Python
python实现图片转字符小工具
Apr 30 Python
python栈的基本定义与使用方法示例【初始化、赋值、入栈、出栈等】
Oct 24 Python
基于python中__add__函数的用法
Nov 25 Python
弄清Pytorch显存的分配机制
Dec 10 Python
Python利用folium实现地图可视化
May 23 Python
详解python网络进程
Jun 15 Python
Python中的程序流程控制语句
Feb 24 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
PHP中实现进程间通讯
2006/10/09 PHP
php 连接mysql连接被重置的解决方法
2011/02/15 PHP
PHP采集利器 Snoopy 试用心得
2011/07/03 PHP
基于MySQL分区性能的详细介绍
2013/05/02 PHP
PHP使用Alexa API获取网站的Alexa排名例子
2014/06/12 PHP
ThinkPHP实现支付宝接口功能实例
2014/12/02 PHP
php从数组中随机选择若干不重复元素的方法
2015/03/14 PHP
Yii2学习笔记之汉化yii设置表单的描述(属性标签attributeLabels)
2017/02/07 PHP
动态样式类封装JS代码
2009/09/02 Javascript
JS编程小常识很有用
2012/11/26 Javascript
jQuery实现的原图对比窗帘效果
2014/06/15 Javascript
js中实现多态采用和继承类似的方法
2014/08/22 Javascript
jQuery实现自定义checkbox和radio样式
2015/07/13 Javascript
javascript自动切换焦点控制效果完整实例
2016/02/02 Javascript
使用three.js 画渐变的直线
2016/06/05 Javascript
JavaScript浮点数及运算精度调整详解
2016/10/21 Javascript
bootstrap侧边栏圆点导航
2017/01/11 Javascript
js实现简单的选项卡效果
2017/02/23 Javascript
基于jquery日历价格、库存等设置插件
2020/07/05 jQuery
Node.JS 循环递归复制文件夹目录及其子文件夹下的所有文件
2017/09/18 Javascript
JS设计模式之单例模式(一)
2017/09/29 Javascript
简单了解Ajax表单序列化的实现方法
2019/06/14 Javascript
Python中的rfind()方法使用详解
2015/05/19 Python
numpy排序与集合运算用法示例
2017/12/15 Python
PyQt5实现拖放功能
2018/04/25 Python
python 去除txt文本中的空格、数字、特定字母等方法
2018/07/24 Python
django2.2安装错误最全的解决方案(小结)
2019/09/24 Python
matplotlib实现显示伪彩色图像及色度条
2019/12/07 Python
在Keras中CNN联合LSTM进行分类实例
2020/06/29 Python
使用spring mvc+localResizeIMG实现HTML5端图片压缩上传的功能
2016/12/16 HTML / CSS
十佳大学生村官事迹
2014/01/09 职场文书
二年级评语大全
2014/04/23 职场文书
最新离婚协议书范本
2014/08/19 职场文书
工作态度怎么写
2015/06/25 职场文书
董事长新年致辞
2015/07/29 职场文书
PyMongo 查询数据的实现
2021/06/28 Python