对sklearn的使用之数据集的拆分与训练详解(python3.6)


Posted in Python onDecember 14, 2018

研修课上讲了两个例子,融合一下。

主要演示大致的过程:

导入->拆分->训练->模型报告

以及几个重要问题:

①标签二值化

②网格搜索法调参

③k折交叉验证

④增加噪声特征(之前涉及)

from sklearn import datasets
#从cross_validation导入会出现warning,说已弃用
from sklearn.model_selection import train-test_split
from sklearn.grid_search import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.svm import SVC
import sklearn.exceptioins
#导入鸢尾花数据集
iris = datasets.load_iris()
#将数据集拆分为训练集和测试集各一半
#其中X为数据特征(花萼、花瓣的高度宽度),为150*4的矩阵
#Y为鸢尾花种类(0, 1, 2三种),为150*1矩阵
#如果使用标签二值化, 将0, 1, 2表示为100 010 001
#使用y.label_binarize(y, classes[0, 1, 2]),变为150*3矩阵
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.5, random_state=0)
#set the parameters by cross_validation
turn_parameters = [{'kernel' : ['rbf', 'gamma' : [1e-3, 1e - 4, 'C':[1,10,100,1000]}, 
{'kernel':['linear'], 'C':[1,10,100,1000]}
]
#clf分离器
#使用网格搜索法调超参数
#训练集做5折交叉验证
clf = GridSearchCV(SVC(C=1), turned_parameters, cv=5, scoring='%s_weighted' % score)
#用前一半train数据再做5折交叉验证
#因为之前的train_test_split已经分割为2份了
#fit-拟合
clf.fit(X_train, y_train)
#超参数
print(clf.best_params_)
#得分
for params, mean_score, scores in clf.gird_scores_:
 print("%.3f (+/-%.0.03f) for %r" % (mean_score, scores.std()*1.96,params))
#分类报告
y_true, y_pred = y_test, clf.predict(X_test)
print(classification_report(y_true, y_pred))

以上这篇对sklearn的使用之数据集的拆分与训练详解(python3.6)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python字符串加密解密的三种方法分享(base64 win32com)
Jan 19 Python
Python3使用PyQt5制作简单的画板/手写板实例
Oct 19 Python
Django实现快速分页的方法实例
Oct 22 Python
将Python文件打包成.EXE可执行文件的方法
Aug 11 Python
python进程的状态、创建及使用方法详解
Dec 06 Python
django框架中间件原理与用法详解
Dec 10 Python
python数据分析:关键字提取方式
Feb 24 Python
Python sorted排序方法如何实现
Mar 31 Python
Python利用for循环打印星号三角形的案例
Apr 12 Python
python中的垃圾回收(GC)机制
Sep 21 Python
python import 上级目录的导入
Nov 03 Python
python3代码输出嵌套式对象实例详解
Dec 03 Python
python列表list保留顺序去重的实例
Dec 14 #Python
Python机器学习之scikit-learn库中KNN算法的封装与使用方法
Dec 14 #Python
Python面向对象之类的内置attr属性示例
Dec 14 #Python
python模糊图片过滤的方法
Dec 14 #Python
python 随机打乱 图片和对应的标签方法
Dec 14 #Python
对python打乱数据集中X,y标签对的方法详解
Dec 14 #Python
Python实现带参数的用户验证功能装饰器示例
Dec 14 #Python
You might like
php时间不正确的解决方法
2008/04/09 PHP
PHP高级对象构建 工厂模式的使用
2012/02/05 PHP
redis 队列操作的例子(php)
2012/04/12 PHP
php实现httpclient类示例
2014/04/08 PHP
php获取图片信息的方法详解
2015/12/10 PHP
什么是OneThink oneThink后台添加插件步骤
2016/04/13 PHP
PHP实现上传多图即时显示与即时删除的方法
2017/05/09 PHP
PHP获取redis里不存在的6位随机数应用示例【设置24小时过时】
2017/06/07 PHP
php获取目录下所有文件及目录(多种方法)(推荐)
2019/05/14 PHP
jquery加载页面的方法(页面加载完成就执行)
2011/06/21 Javascript
基于jQuery的图片剪切插件
2011/08/03 Javascript
如何在JavaScript中实现私有属性的写类方式(一)
2013/12/04 Javascript
table行随鼠标移动变色示例
2014/05/07 Javascript
js使用for循环及if语句判断多个一样的name
2014/09/09 Javascript
js实现头像图片切割缩放及无刷新上传图片的方法
2015/07/17 Javascript
jQuery简单实现彩色云标签效果示例
2016/08/01 Javascript
jQuery+HTML5实现弹出创意搜索框层
2016/12/29 Javascript
JavaScript BASE64算法实现(完美解决中文乱码)
2017/01/10 Javascript
Angular1.x复杂指令实例详解
2017/03/01 Javascript
animate.css在vue项目中的使用教程
2018/08/05 Javascript
JS实现的贪吃蛇游戏完整实例
2019/01/18 Javascript
React 全自动数据表格组件——BodeGrid的实现思路
2019/06/12 Javascript
ElementUI之Message功能拓展详解
2019/10/18 Javascript
Python模块结构与布局操作方法实例分析
2017/07/24 Python
python cx_Oracle的基础使用方法(连接和增删改查)
2017/11/19 Python
python2.7无法使用pip的解决方法(安装easy_install)
2018/04/03 Python
解决pycharm回车之后不能换行或不能缩进的问题
2019/01/16 Python
更新修改后的Python模块方法
2019/03/03 Python
Python3 filecmp模块测试比较文件原理解析
2020/03/23 Python
Python操作Excel的学习笔记
2021/02/18 Python
英国护肤品购物网站:Beauty Expert
2016/08/19 全球购物
销售心得体会
2014/01/02 职场文书
护理目标管理责任书
2014/07/25 职场文书
公司清洁工岗位职责
2015/04/15 职场文书
2015年文秘个人工作总结
2015/10/14 职场文书
导游词之湖州-太湖
2019/10/11 职场文书