python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现telnet客户端的方法
Apr 15 Python
python登录pop3邮件服务器接收邮件的方法
Apr 30 Python
python实现名片管理系统
Nov 29 Python
解决python写入带有中文的字符到文件错误的问题
Jan 31 Python
pyqt5、qtdesigner安装和环境设置教程
Sep 25 Python
python 读取二进制 显示图片案例
Apr 24 Python
python dict乱码如何解决
Jun 07 Python
Python多分支if语句的使用
Sep 03 Python
GitHub上值得推荐的8个python 项目
Oct 30 Python
Python爬虫之用Xpath获取关键标签实现自动评论盖楼抽奖(二)
Jun 07 Python
Python turtle实现贪吃蛇游戏
Jun 18 Python
python中对列表的删除和添加方法详解
Feb 24 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
php pki加密技术(openssl)详解
2013/07/01 PHP
利用WebBrowser彻底解决Web打印问题(包括后台打印)
2009/06/22 Javascript
Javascript Global对象
2009/08/13 Javascript
读jQuery之四(优雅的迭代)
2011/06/20 Javascript
Jquery 的扩展方法总结
2011/10/01 Javascript
使用jquery实现简单的ajax
2013/07/08 Javascript
javascript的内存管理详解
2013/08/07 Javascript
nodejs中使用monk访问mongodb
2014/07/06 NodeJs
javascript用函数实现对象的方法
2015/05/14 Javascript
js将滚动条滚动到指定位置的简单实现方法
2016/06/25 Javascript
D3.js封装文本实现自动换行和旋转平移等功能
2016/10/14 Javascript
Html5+jQuery+CSS制作相册小记录
2016/12/30 Javascript
js排序与重组的实例讲解
2017/08/28 Javascript
详解组件库的webpack构建速度优化
2018/06/18 Javascript
详解Vue取消eslint语法限制
2018/08/04 Javascript
微信小程序自定义toast组件的方法详解【含动画】
2019/05/11 Javascript
layui switch 开关监听 弹出确定状态转换的例子
2019/09/21 Javascript
Openlayers实现地图全屏显示
2020/09/28 Javascript
keep-alive保持组件状态的方法
2020/12/02 Javascript
python使用邻接矩阵构造图代码示例
2017/11/10 Python
PyCharm鼠标右键不显示Run unittest的解决方法
2018/11/30 Python
Python 200行代码实现一个滑动验证码过程详解
2019/07/11 Python
django基础学习之send_mail功能
2019/08/07 Python
python文字和unicode/ascll相互转换函数及简单加密解密实现代码
2019/08/12 Python
python django 原生sql 获取数据的例子
2019/08/14 Python
django 读取图片到页面实例
2020/03/27 Python
HTML5 Canvas 起步(1) - 基本概念
2009/05/12 HTML / CSS
size?法国官网:英国伦敦的球鞋精品店
2020/03/15 全球购物
UDP协议功能
2013/01/06 面试题
大学应届生求职简历的自我评价
2013/10/08 职场文书
工地门卫岗位职责
2013/12/30 职场文书
优秀员工表扬信
2014/01/17 职场文书
人力资源总监工作说明
2014/03/03 职场文书
网站美工岗位职责
2014/04/02 职场文书
电教室标语
2014/06/20 职场文书
2014年行政助理工作总结
2014/11/19 职场文书