python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
在Python编程过程中用单元测试法调试代码的介绍
Apr 02 Python
详解Python中的变量及其命名和打印
Mar 11 Python
Python while 循环使用的简单实例
Jun 08 Python
利用python生成一个导出数据库的bat脚本文件的方法
Dec 30 Python
深入理解Python单元测试unittest的使用示例
Nov 18 Python
分享vim python缩进等一些配置
Jul 02 Python
python实现接口并发测试脚本
Jun 25 Python
python快速排序的实现及运行时间比较
Nov 22 Python
python lambda函数及三个常用的高阶函数
Feb 05 Python
python实现126邮箱发送邮件
May 20 Python
PyTorch 中的傅里叶卷积实现示例
Dec 11 Python
Python爬虫实战之爬取京东商品数据并实实现数据可视化
Jun 07 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
PHP最常用的2种设计模式工厂模式和单例模式介绍
2012/08/14 PHP
解析PHP中如何将数组变量写入文件
2013/06/06 PHP
qq登录,新浪微博登录接口申请过程中遇到的问题
2014/07/22 PHP
php使用数组填充下拉列表框的方法
2015/03/31 PHP
javascript开发随笔二 动态加载js和文件
2011/11/25 Javascript
jQuery实现单行文字间歇向上滚动源代码
2013/06/02 Javascript
解析ScrollPic在ie8下只滚动一遍,然后变为空白 ie6,ie7,chrome,firefox正常
2013/06/26 Javascript
js复制到剪切板的实例方法
2013/06/28 Javascript
jquery实现手风琴效果实例代码
2013/11/15 Javascript
禁止iframe页面的所有js脚本如alert及弹出窗口等
2014/09/03 Javascript
jQuery中closest()函数用法实例
2015/01/07 Javascript
JavaScript实现类似淘宝的购物车效果
2017/03/16 Javascript
微信小程序 request接口的封装实例代码
2017/04/26 Javascript
微信小程序之数据双向绑定与数据操作
2017/05/12 Javascript
关于在mongoose中填充外键的方法详解
2017/08/14 Javascript
jQuery实现可兼容IE6的遮罩功能详解
2017/09/19 jQuery
jQuery easyui datagird编辑行删除行功能的实现代码
2018/09/20 jQuery
Vue注册组件命名时不能用大写的原因浅析
2019/04/25 Javascript
three.js 实现露珠滴落动画效果的示例代码
2021/03/01 Javascript
[02:07]2017国际邀请赛中国区预选赛直邀战队前瞻
2017/06/23 DOTA
python dict.get()和dict['key']的区别详解
2016/06/30 Python
使用Python写一个贪吃蛇游戏实例代码
2017/08/21 Python
python实现Windows电脑定时关机
2018/06/20 Python
python对离散变量的one-hot编码方法
2018/07/11 Python
对python当中不在本路径的py文件的引用详解
2018/12/15 Python
Python发送手机动态验证码代码实例
2020/02/28 Python
Python greenlet和gevent使用代码示例解析
2020/04/01 Python
联想中国官方商城:Lenovo China
2017/10/18 全球购物
小米旗下精品生活电商平台:小米有品
2018/12/18 全球购物
美国职棒大联盟的官方手套、球和头盔:Rawlings
2020/02/15 全球购物
犹他州最古老的体育用品公司:Al’s
2020/12/18 全球购物
党员承诺书内容
2014/03/26 职场文书
安全标语大全
2014/06/10 职场文书
公司领导班子民主生活会对照检查材料
2014/10/02 职场文书
走群众路线剖析材料
2014/10/09 职场文书
道路交通事故人身损害赔偿协议书
2014/11/19 职场文书