python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 字典(Dictionary)操作详解
Mar 11 Python
Python入门篇之对象类型
Oct 17 Python
Python中urllib2模块的8个使用细节分享
Jan 01 Python
python中黄金分割法实现方法
May 06 Python
python gensim使用word2vec词向量处理中文语料的方法
Jul 05 Python
对python中的float除法和整除法的实例详解
Jul 20 Python
django数据库自动重连的方法实例
Jul 21 Python
Python 日期区间处理 (本周本月上周上月...)
Aug 08 Python
如何真正的了解python装饰器
Aug 14 Python
python中的split、rsplit、splitlines用法说明
Oct 23 Python
python中@property的作用和getter setter的解释
Dec 22 Python
详解Python中的GIL(全局解释器锁)详解及解决GIL的几种方案
Jan 29 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
Thinkphp使用mongodb数据库实现多条件查询方法
2014/06/26 PHP
CI框架中通过hook的方式实现简单的权限控制
2015/01/07 PHP
PHP设置头信息及取得返回头信息的方法
2016/01/25 PHP
PHP共享内存用法实例分析
2016/02/12 PHP
php JWT在web端中的使用方法教程
2018/09/06 PHP
Google AJAX 搜索 API实现代码
2010/11/17 Javascript
JavaScript高级程序设计 阅读笔记(十四) js继承机制的实现
2012/08/14 Javascript
javascript基础知识大全 便于大家学习,也便于我自己查看
2012/08/17 Javascript
jQuery让控件左右移动的三种实现方法
2013/09/08 Javascript
jquery判断类型是不是number类型的实例代码
2016/10/07 Javascript
微信小程序加载更多 点击查看更多
2016/11/29 Javascript
纯javaScript、jQuery实现个性化图片轮播【推荐】
2017/01/08 Javascript
原生js实现下拉框功能(支持键盘事件)
2017/01/13 Javascript
javascript使用正则实现去掉字符串前面的所有0
2018/07/23 Javascript
Vue常用的几个指令附完整案例
2018/11/06 Javascript
微信小程序使用for循环动态渲染页面操作示例
2018/12/25 Javascript
Node.js API详解之 querystring用法实例分析
2020/04/29 Javascript
vue+element_ui上传文件,并传递额外参数操作
2020/12/05 Vue.js
python双向链表实现实例代码
2013/11/21 Python
Python中利用函数装饰器实现备忘功能
2015/03/30 Python
Python文本相似性计算之编辑距离详解
2016/11/28 Python
python版本坑:md5例子(python2与python3中md5区别)
2017/06/20 Python
Python使用MD5加密算法对字符串进行加密操作示例
2018/03/30 Python
python3.6使用pickle序列化class的方法
2018/10/22 Python
解决Python下json.loads()中文字符出错的问题
2018/12/19 Python
详解Python中namedtuple的使用
2020/04/27 Python
CSS3实现闪烁动画效果的方法
2015/02/09 HTML / CSS
CSS3属性 line-clamp控制文本行数的使用
2020/03/19 HTML / CSS
viagogo意大利票务平台:演唱会、体育比赛、戏剧门票
2018/01/26 全球购物
幼师自荐信范文
2013/10/06 职场文书
单位门卫岗位职责
2013/12/20 职场文书
中秋节礼品促销方案
2014/02/02 职场文书
销售代理协议书
2014/09/30 职场文书
市委召开党的群众路线教育实践活动总结大会报告
2014/10/21 职场文书
2014年初级职称工作总结
2014/12/08 职场文书
入党转正申请自我鉴定
2019/06/25 职场文书