python 划分数据集为训练集和测试集的方法


Posted in Python onDecember 11, 2018

sklearn的cross_validation包中含有将数据集按照一定的比例,随机划分为训练集和测试集的函数train_test_split

from sklearn.cross_validation import train_test_split
#x为数据集的feature熟悉,y为label.
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.3)

得到的x_train,y_train(x_test,y_test)的index对应的是x,y中被抽取到的序号。

若train_test_split传入的是带有label的数据,则如下代码:

from sklearn.cross_validation import train_test_split
#dat为数据集,含有feature和label.
train, test = train_test_split(dat, test_size = 0.3)

train,test含有feature和label的。

自己写了一个函数:

#X:含label的数据集:分割成训练集和测试集
#test_size:测试集占整个数据集的比例
def trainTestSplit(X,test_size=0.3):
 X_num=X.shape[0]
 train_index=range(X_num)
 test_index=[]
 test_num=int(X_num*test_size)
 for i in range(test_num):
  randomIndex=int(np.random.uniform(0,len(train_index)))
  test_index.append(train_index[randomIndex])
  del train_index[randomIndex]
 #train,test的index是抽取的数据集X的序号
 train=X.ix[train_index] 
 test=X.ix[test_index]
 return train,test

以上这篇python 划分数据集为训练集和测试集的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
跟老齐学Python之集成开发环境(IDE)
Sep 12 Python
Django中login_required装饰器的深入介绍
Nov 24 Python
机器学习10大经典算法详解
Dec 07 Python
Python设计模式之装饰模式实例详解
Jan 21 Python
对python多线程SSH登录并发脚本详解
Feb 14 Python
Pandas读取并修改excel的示例代码
Feb 17 Python
python绘制双Y轴折线图以及单Y轴双变量柱状图的实例
Jul 08 Python
使用python模拟命令行终端的示例
Aug 13 Python
WxPython实现无边框界面
Nov 18 Python
tensorflow ckpt模型和pb模型获取节点名称,及ckpt转pb模型实例
Jan 21 Python
Django如何批量创建Model
Sep 01 Python
python基于OpenCV模板匹配识别图片中的数字
Mar 31 Python
Python sklearn KFold 生成交叉验证数据集的方法
Dec 11 #Python
想学python 这5本书籍你必看!
Dec 11 #Python
对python中数据集划分函数StratifiedShuffleSplit的使用详解
Dec 11 #Python
Python3爬虫学习入门教程
Dec 11 #Python
Python3实现爬取简书首页文章标题和文章链接的方法【测试可用】
Dec 11 #Python
python绘制散点图并标记序号的方法
Dec 11 #Python
pandas分别写入excel的不同sheet方法
Dec 11 #Python
You might like
snoopy PHP版的网络客户端提供本地下载
2008/04/15 PHP
php产生随机数的两种方法实例代码 输出随机IP
2011/04/08 PHP
Ping服务的php实现方法,让网站快速被收录
2012/02/04 PHP
ThinkPHP 3.2.3实现加减乘除图片验证码
2018/12/05 PHP
Yii框架中使用PHPExcel的方法分析
2019/07/25 PHP
JavaScript库 开发规则
2009/01/31 Javascript
网站页面自动跳转实现方法PHP、JSP(下)
2010/08/01 Javascript
Javascript控制页面链接在新窗口打开具体方法
2013/08/16 Javascript
ext前台接收action传过来的json数据示例
2014/06/17 Javascript
jQuery插件slicebox实现3D动画图片轮播切换特效
2015/04/12 Javascript
Javascript实现计算个人所得税
2015/05/10 Javascript
用JavaScript判断CSS浏览器类型前缀的两种方法
2015/10/08 Javascript
Bootstrap每天必学之下拉菜单
2015/11/25 Javascript
快速掌握WordPress中加载JavaScript脚本的方法
2015/12/17 Javascript
基于RequireJS和JQuery的模块化编程——常见问题全面解析
2016/04/14 Javascript
JavaScript模仿Pinterest实现图片预加载功能
2016/10/25 Javascript
Angular通过指令动态添加组件问题
2018/07/09 Javascript
微信小程序如何实现在线客服功能
2019/10/16 Javascript
javascript canvas检测小球碰撞
2020/04/17 Javascript
Python的ORM框架SQLAlchemy入门教程
2014/04/28 Python
Python里隐藏的“禅”
2014/06/16 Python
在Python中编写数据库模块的教程
2015/04/29 Python
Python实现求最大公约数及判断素数的方法
2015/05/26 Python
python调用摄像头拍摄数据集
2019/06/01 Python
keras CNN卷积核可视化,热度图教程
2020/06/22 Python
豪华床上用品 :Jennifer Adams
2019/09/15 全球购物
法国滑雪假期的专家:Ski Planet
2019/11/02 全球购物
大学生自我鉴定范文模板
2014/01/21 职场文书
放飞中国梦演讲稿
2014/04/23 职场文书
运动会口号16字
2014/06/07 职场文书
文化产业实施方案
2014/06/07 职场文书
研究生求职自荐书
2014/06/23 职场文书
意外伤害赔偿协议书范文
2014/09/23 职场文书
继承公证书格式
2015/01/26 职场文书
2016继续教育研修日志
2015/11/13 职场文书
用python画城市轮播地图
2021/05/28 Python