python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中使用dom模块生成XML文件示例
Apr 05 Python
在Python中使用poplib模块收取邮件的教程
Apr 29 Python
详解在Python中处理异常的教程
May 24 Python
Python排序搜索基本算法之选择排序实例分析
Dec 09 Python
Python使用matplotlib实现绘制自定义图形功能示例
Jan 18 Python
python脚本作为Windows服务启动代码详解
Feb 11 Python
shell命令行,一键创建 python 模板文件脚本方法
Mar 20 Python
python3+PyQt5使用数据库表视图
Apr 24 Python
python 删除非空文件夹的实例
Apr 26 Python
Selenium的使用详解
Oct 19 Python
python使用thrift教程的方法示例
Mar 21 Python
python并发编程多进程 模拟抢票实现过程
Aug 20 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
分享常见的几种页面静态化的方法
2015/01/08 PHP
form表单传递数组数据、php脚本接收的实例
2017/02/09 PHP
某页码显示的helper 少量调整,另附js版
2010/09/12 Javascript
jquery Moblie入门—hello world的示例代码学习
2013/01/08 Javascript
JavaScript限定复选框的选择个数示例代码
2013/08/25 Javascript
javascript实现yield的方法
2013/11/06 Javascript
JQUERY 设置SELECT选中项代码
2014/02/07 Javascript
jquery组件使用中遇到的问题整理及解决
2014/02/21 Javascript
jQuery仿gmail实现fixed布局的方法
2015/05/27 Javascript
jQuery页面弹出框实现文件上传
2017/02/09 Javascript
Vue.js教程之axios与网络传输的学习实践
2017/04/29 Javascript
mui框架 页面无法滚动的解决方法(推荐)
2018/01/25 Javascript
JavaScript 2018 中即将迎来的新功能
2018/09/21 Javascript
Vue使用Proxy监听所有接口状态的方法实现
2019/06/07 Javascript
JavaScript常用进制转换及位运算实例解析
2020/10/14 Javascript
Python入门篇之正则表达式
2014/10/20 Python
简单的Apache+FastCGI+Django配置指南
2015/07/22 Python
python实现简易版计算器
2020/06/22 Python
python实现图片识别汽车功能
2018/11/30 Python
Python Flask 搭建微信小程序后台详解
2019/05/06 Python
python几种常用功能实现代码实例
2019/12/25 Python
python 5个顶级异步框架推荐
2020/09/09 Python
Python解析微信dat文件的方法
2020/11/30 Python
HTML5移动端开发中的Viewport标签及相关CSS用法解析
2016/04/15 HTML / CSS
HTML5实现桌面通知 提示功能
2017/10/11 HTML / CSS
适合各种场合的美食礼品:Harry & David
2016/08/03 全球购物
初中三年学生的学习自我评价
2013/11/13 职场文书
大学本科生的个人自我评价
2013/12/09 职场文书
道德模范先进事迹
2014/02/14 职场文书
2014年班主任自我评价范文
2014/04/23 职场文书
节能环保标语
2014/06/12 职场文书
观看《周恩来的四个昼夜》思想汇报
2014/09/12 职场文书
2014年电信员工工作总结
2014/12/19 职场文书
食堂管理制度范本
2015/08/04 职场文书
保外就医申请书范文
2015/08/06 职场文书
中国梦宣传标语口号
2015/12/26 职场文书