python中如何实现将数据分成训练集与测试集的方法


Posted in Python onSeptember 13, 2019

接下来,直接给出大家响应的代码,并对每一行进行标注,希望能够帮到大家。

需要用到的是库是。numpy 、sklearn。

#导入相应的库(对数据库进行切分需要用到的库是sklearn.model_selection 中的 train_test_split)
import numpy as np
from sklearn.model_selection import train_test_split
 #首先,读取.CSV文件成矩阵的形式。
my_matrix = np.loadtxt(open("xxxxxx.csv"),delimiter=",",skiprows=0)
 #对于矩阵而言,将矩阵倒数第一列之前的数值给了X(输入数据),将矩阵大最后一列的数值给了y(标签)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
 #利用train_test_split方法,将X,y随机划分问,训练集(X_train),训练集标签(X_test),测试卷(y_train),
 测试集标签(y_test),安训练集:测试集=7:3的
 概率划分,到此步骤,可以直接对数据进行处理
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
 #此步骤,是为了将训练集与数据集的数据分别保存为CSV文件
 #np.column_stack将两个矩阵进行组合连接
train= np.column_stack((X_train,y_train))
 #numpy.savetxt 将txt文件保存为。csv结尾的文件
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

完整没解释的代码部分为

import numpy as np
from sklearn.model_selection import train_test_split
my_matrix = np.loadtxt(open("xxxxx.csv"),delimiter=",",skiprows=0)
X, y = my_matrix[:,:-1],my_matrix[:,-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
train= np.column_stack((X_train,y_train))
numpy.savetxt('train_usual.csv',train, delimiter = ',')
test = np.column_stack((X_test, y_test))
numpy.savetxt('test_usual.csv', test, delimiter = ',')

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
linux系统使用python监测网络接口获取网络的输入输出
Jan 15 Python
Python实现的基数排序算法原理与用法实例分析
Nov 23 Python
Python+matplotlib实现计算两个信号的交叉谱密度实例
Jan 08 Python
在Windows中设置Python环境变量的实例讲解
Apr 28 Python
详解Django+Uwsgi+Nginx 实现生产环境部署
Nov 06 Python
python版本五子棋的实现代码
Dec 11 Python
详解Python可视化神器Yellowbrick使用
Nov 11 Python
Python实现进度条和时间预估的示例代码
Jun 02 Python
pycharm 的Structure界面设置操作
Feb 05 Python
matplotlib bar()实现百分比堆积柱状图
Feb 24 Python
详解分布式系统中如何用python实现Paxos
May 18 Python
Python中Matplotlib的点、线形状、颜色以及绘制散点图
Apr 07 Python
Python函数中的可变长参数详解
Sep 12 #Python
python爬虫-模拟微博登录功能
Sep 12 #Python
python设置随机种子实例讲解
Sep 12 #Python
pytest中文文档之编写断言
Sep 12 #Python
python中调试或排错的五种方法示例
Sep 12 #Python
详解Python 中sys.stdin.readline()的用法
Sep 12 #Python
Python3将数据保存为txt文件的方法
Sep 12 #Python
You might like
PHP4实际应用经验篇(1)
2006/10/09 PHP
php pack与unpack 摸板字符字符含义
2009/10/29 PHP
php is_file()和is_dir()用于遍历目录时用法注意事项
2010/03/02 PHP
PHP框架Laravel学习心得体会
2015/10/28 PHP
详解WordPress中用于合成数组的wp_parse_args()函数
2015/12/18 PHP
在Mac OS的PHP环境下安装配置MemCache的全过程解析
2016/02/15 PHP
php 二维数组快速排序算法的实现代码
2017/10/17 PHP
JQuery 小练习(实例代码)
2009/08/07 Javascript
JavaScript CSS修改学习第二章 样式
2010/02/19 Javascript
javascript自定义的addClass()方法
2014/05/28 Javascript
学习使用bootstrap基本控件(table、form、button)
2016/04/12 Javascript
jquery.serialize() 函数语法及简单实例
2016/07/08 Javascript
JS表格组件BootstrapTable行内编辑解决方案x-editable
2016/09/01 Javascript
javascript表达式和运算符详解
2017/02/07 Javascript
jQuery实现可拖动进度条实例代码
2017/06/21 jQuery
微信小程序实现图片上传、删除和预览功能的方法
2017/12/18 Javascript
使用RN Animated做一个“添加购物车”动画的方法
2018/09/12 Javascript
详解vue-template-admin三级路由无法缓存的解决方案
2020/03/10 Javascript
[01:32]DOTA2次级联赛——首支职业女子战队选拔赛全记录
2014/10/23 DOTA
[02:45]2016年中国刀塔全程回顾,完美“圣”典即将上演
2016/12/15 DOTA
[01:07:53]RNG vs VG 2019国际邀请赛小组赛 BO2 第一场 8.15
2019/08/17 DOTA
[37:21]完美世界DOTA2联赛PWL S2 Inki vs Magma 第二场 11.22
2020/11/24 DOTA
Django中的CACHE_BACKEND参数和站点级Cache设置
2015/07/23 Python
简介Django中内置的一些中间件
2015/07/24 Python
基于Python的文件类型和字符串详解
2017/12/21 Python
Appium+Python自动化测试之运行App程序示例
2019/01/23 Python
对django中foreignkey的简单使用详解
2019/07/28 Python
python requests证书问题解决
2019/09/05 Python
NFL墨西哥官方商店:Tienda NFL
2017/11/28 全球购物
小学生保护环境倡议书
2014/05/15 职场文书
2014教师研修学习体会
2014/07/08 职场文书
竞聘自述材料
2014/08/25 职场文书
2014年班级工作总结
2014/11/14 职场文书
2019年公司快递收发管理制度模板
2019/11/20 职场文书
导游词之绍兴柯岩古镇
2020/01/09 职场文书
postman中form-data、x-www-form-urlencoded、raw、binary的区别介绍
2022/01/18 HTML / CSS