python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python通过poll实现异步IO的方法
Jun 04 Python
python实现随机梯度下降(SGD)
Mar 24 Python
利用Opencv中Houghline方法实现直线检测
Feb 11 Python
python 接口返回的json字符串实例
Mar 27 Python
详解Python3的TFTP文件传输
Jun 26 Python
Python中几种属性访问的区别与用法详解
Oct 10 Python
简单了解django orm中介模型
Jul 30 Python
详解用python生成随机数的几种方法
Aug 04 Python
pytorch下使用LSTM神经网络写诗实例
Jan 14 Python
深入浅析python变量加逗号,的含义
Feb 22 Python
解决Jupyter Notebook使用parser.parse_args出现错误问题
Apr 20 Python
python之json文件转xml文件案例讲解
Aug 07 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
PHP读MYSQL中文乱码的解决方法
2006/12/17 PHP
深入解析PHP的引用计数机制
2013/06/14 PHP
php通过rmdir删除目录的简单用法
2015/03/18 PHP
Smarty变量用法详解
2016/05/11 PHP
PHP使用SMTP邮件服务器发送邮件示例
2018/08/28 PHP
PHP实现的多进程控制demo示例
2019/07/22 PHP
javascript 匿名函数的理解(透彻版)
2010/01/28 Javascript
JS控件的生命周期介绍
2012/10/22 Javascript
JSON为什么那样红为什么要用json(另有洞天)
2012/12/26 Javascript
JS 获取滚动条高度示例代码
2013/10/24 Javascript
jquery实现弹出层遮罩效果的简单实例
2014/03/03 Javascript
Google 地图控件集详解及实例代码
2016/08/06 Javascript
Angular中使用ui router实现系统权限控制及开发遇到问题
2016/09/23 Javascript
原生js实现键盘控制div移动且解决停顿问题
2016/12/05 Javascript
Node.js通过身份证号验证年龄、出生日期与性别方法示例
2017/03/09 Javascript
Vue底层实现原理总结
2018/02/17 Javascript
浅析vue-router原理
2018/10/19 Javascript
微信小程序的开发范式BeautyWe.js入门详解
2019/07/10 Javascript
Vue element-ui父组件控制子组件的表单校验操作
2020/07/17 Javascript
微信小程序实现音乐播放页面布局
2020/12/11 Javascript
k8s node节点重新加入master集群的实现
2021/02/22 Javascript
Python实现复杂对象转JSON的方法示例
2017/06/22 Python
Python实现将Excel转换为json的方法示例
2017/08/05 Python
Python3学习笔记之列表方法示例详解
2017/10/06 Python
mac下给python3安装requests库和scrapy库的实例
2018/06/13 Python
python递归实现快速排序
2018/08/18 Python
windows10下安装TensorFlow Object Detection API的步骤
2019/06/13 Python
Python之Django自动实现html代码(下拉框,数据选择)
2020/03/13 Python
Python如何将将模块分割成多个文件
2020/08/04 Python
bareMinerals官网:矿物质化妆品和护肤品
2018/02/04 全球购物
介绍Ibatis的核心类
2013/11/18 面试题
参赛口号
2014/06/16 职场文书
离职证明范本(5篇)
2014/09/19 职场文书
2014年公务员工作总结
2014/11/18 职场文书
神州牡丹园的导游词
2019/11/20 职场文书
vue-cli3.0修改打包后的文件名和文件地址,打包后本地运行报错解决
2022/04/06 Vue.js