对sklearn的使用之数据集的拆分与训练详解(python3.6)


Posted in Python onDecember 14, 2018

研修课上讲了两个例子,融合一下。

主要演示大致的过程:

导入->拆分->训练->模型报告

以及几个重要问题:

①标签二值化

②网格搜索法调参

③k折交叉验证

④增加噪声特征(之前涉及)

from sklearn import datasets
#从cross_validation导入会出现warning,说已弃用
from sklearn.model_selection import train-test_split
from sklearn.grid_search import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.svm import SVC
import sklearn.exceptioins
#导入鸢尾花数据集
iris = datasets.load_iris()
#将数据集拆分为训练集和测试集各一半
#其中X为数据特征(花萼、花瓣的高度宽度),为150*4的矩阵
#Y为鸢尾花种类(0, 1, 2三种),为150*1矩阵
#如果使用标签二值化, 将0, 1, 2表示为100 010 001
#使用y.label_binarize(y, classes[0, 1, 2]),变为150*3矩阵
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.5, random_state=0)
#set the parameters by cross_validation
turn_parameters = [{'kernel' : ['rbf', 'gamma' : [1e-3, 1e - 4, 'C':[1,10,100,1000]}, 
{'kernel':['linear'], 'C':[1,10,100,1000]}
]
#clf分离器
#使用网格搜索法调超参数
#训练集做5折交叉验证
clf = GridSearchCV(SVC(C=1), turned_parameters, cv=5, scoring='%s_weighted' % score)
#用前一半train数据再做5折交叉验证
#因为之前的train_test_split已经分割为2份了
#fit-拟合
clf.fit(X_train, y_train)
#超参数
print(clf.best_params_)
#得分
for params, mean_score, scores in clf.gird_scores_:
 print("%.3f (+/-%.0.03f) for %r" % (mean_score, scores.std()*1.96,params))
#分类报告
y_true, y_pred = y_test, clf.predict(X_test)
print(classification_report(y_true, y_pred))

以上这篇对sklearn的使用之数据集的拆分与训练详解(python3.6)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python常见文件操作的函数示例代码
Nov 15 Python
使用Python的Zato发送AMQP消息的教程
Apr 16 Python
python网络编程之数据传输UDP实例分析
May 20 Python
win与linux系统中python requests 安装
Dec 04 Python
浅谈Python traceback的优雅处理
Aug 31 Python
Python类的继承用法示例
Jan 31 Python
python3.7将代码打包成exe程序并添加图标的方法
Oct 11 Python
通过python检测字符串的字母
Feb 18 Python
Python中and和or如何使用
May 28 Python
浅谈Django前端后端值传递问题
Jul 15 Python
vue.js刷新当前页面的实例讲解
Dec 29 Python
python中Array和DataFrame相互转换的实例讲解
Feb 03 Python
python列表list保留顺序去重的实例
Dec 14 #Python
Python机器学习之scikit-learn库中KNN算法的封装与使用方法
Dec 14 #Python
Python面向对象之类的内置attr属性示例
Dec 14 #Python
python模糊图片过滤的方法
Dec 14 #Python
python 随机打乱 图片和对应的标签方法
Dec 14 #Python
对python打乱数据集中X,y标签对的方法详解
Dec 14 #Python
Python实现带参数的用户验证功能装饰器示例
Dec 14 #Python
You might like
php批量删除cookie的简单实现方法
2015/01/26 PHP
PHP简单实现二维数组的矩阵转置操作示例
2017/11/24 PHP
用JavaScript和注册表脚本实现右键收藏Web页选中文本
2007/01/28 Javascript
js模拟滚动条(横向竖向)
2013/02/22 Javascript
Nodejs实现的一个静态服务器实例
2014/12/06 NodeJs
javascript实现youku的视频代码自适应宽度
2015/05/25 Javascript
Jquery和JS获取ul中li标签的实现方法
2016/06/02 Javascript
JS实现复制内容到剪贴板功能兼容所有浏览器(推荐)
2016/06/17 Javascript
EasyUI学习之DataGird分页显示数据
2016/12/29 Javascript
JS点击缩略图整屏居中放大图片效果
2017/07/04 Javascript
javascript function(函数类型)使用与注意事项小结
2019/06/10 Javascript
vue 解决异步数据更新问题
2019/10/29 Javascript
通过angular CDK实现页面元素拖放的步骤详解
2020/07/01 Javascript
js实现金山打字通小游戏
2020/07/24 Javascript
探索node之事件循环的实现
2020/10/30 Javascript
[04:44]DOTA2 2017全国高校联赛视频回顾
2017/08/21 DOTA
从零学Python之入门(四)运算
2014/05/27 Python
Python中的__new__与__init__魔术方法理解笔记
2014/11/08 Python
Python使用Scrapy爬取妹子图
2015/05/28 Python
基于python实现简单日历
2018/07/28 Python
windows下python 3.6.4安装配置图文教程
2018/08/21 Python
pandas.read_csv参数详解(小结)
2019/06/21 Python
树莓派动作捕捉抓拍存储图像脚本
2019/06/22 Python
python调用并链接MATLAB脚本详解
2019/07/05 Python
python求最大值,不使用内置函数的实现方法
2019/07/09 Python
python编写简单端口扫描器
2019/09/04 Python
Django 实现将图片转为Base64,然后使用json传输
2020/03/27 Python
Python并发请求下限制QPS(每秒查询率)的实现代码
2020/06/05 Python
香港礼品网站:GiftU eshop
2017/09/01 全球购物
新西兰最大的在线设计师眼镜店:SmartBuyGlasses新西兰
2017/10/20 全球购物
加拿大休闲和工业服装和鞋类零售商:L’Équipeur
2018/01/12 全球购物
AJAX检测用户名是否存在的方法
2021/03/24 Javascript
计划生育证明格式范本
2014/09/12 职场文书
长江三峡导游词
2015/01/31 职场文书
幼儿园端午节活动总结
2015/05/05 职场文书
2015年秋季校长开学典礼致辞
2015/07/29 职场文书