对sklearn的使用之数据集的拆分与训练详解(python3.6)


Posted in Python onDecember 14, 2018

研修课上讲了两个例子,融合一下。

主要演示大致的过程:

导入->拆分->训练->模型报告

以及几个重要问题:

①标签二值化

②网格搜索法调参

③k折交叉验证

④增加噪声特征(之前涉及)

from sklearn import datasets
#从cross_validation导入会出现warning,说已弃用
from sklearn.model_selection import train-test_split
from sklearn.grid_search import GridSearchCV
from sklearn.metrics import classification_report
from sklearn.svm import SVC
import sklearn.exceptioins
#导入鸢尾花数据集
iris = datasets.load_iris()
#将数据集拆分为训练集和测试集各一半
#其中X为数据特征(花萼、花瓣的高度宽度),为150*4的矩阵
#Y为鸢尾花种类(0, 1, 2三种),为150*1矩阵
#如果使用标签二值化, 将0, 1, 2表示为100 010 001
#使用y.label_binarize(y, classes[0, 1, 2]),变为150*3矩阵
X_train, X_test, y_train, y_test = train_test_split(
iris.data, iris.target, test_size=0.5, random_state=0)
#set the parameters by cross_validation
turn_parameters = [{'kernel' : ['rbf', 'gamma' : [1e-3, 1e - 4, 'C':[1,10,100,1000]}, 
{'kernel':['linear'], 'C':[1,10,100,1000]}
]
#clf分离器
#使用网格搜索法调超参数
#训练集做5折交叉验证
clf = GridSearchCV(SVC(C=1), turned_parameters, cv=5, scoring='%s_weighted' % score)
#用前一半train数据再做5折交叉验证
#因为之前的train_test_split已经分割为2份了
#fit-拟合
clf.fit(X_train, y_train)
#超参数
print(clf.best_params_)
#得分
for params, mean_score, scores in clf.gird_scores_:
 print("%.3f (+/-%.0.03f) for %r" % (mean_score, scores.std()*1.96,params))
#分类报告
y_true, y_pred = y_test, clf.predict(X_test)
print(classification_report(y_true, y_pred))

以上这篇对sklearn的使用之数据集的拆分与训练详解(python3.6)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现计算倒数的方法
Jul 11 Python
简要讲解Python编程中线程的创建与锁的使用
Feb 28 Python
Python OpenCV实现图片上输出中文
Jan 22 Python
浅谈python可视化包Bokeh
Feb 07 Python
解决python3 Pycharm上连接数据库时报错的问题
Dec 03 Python
python pytest进阶之conftest.py详解
Jun 27 Python
python创建子类的方法分析
Nov 28 Python
基于python实现操作git过程代码解析
Jul 27 Python
Python如何在bool函数中取值
Sep 21 Python
Python爬虫之Selenium鼠标事件的实现
Dec 04 Python
Python 实现集合Set的示例
Dec 21 Python
Python基础之Socket通信原理
Apr 22 Python
python列表list保留顺序去重的实例
Dec 14 #Python
Python机器学习之scikit-learn库中KNN算法的封装与使用方法
Dec 14 #Python
Python面向对象之类的内置attr属性示例
Dec 14 #Python
python模糊图片过滤的方法
Dec 14 #Python
python 随机打乱 图片和对应的标签方法
Dec 14 #Python
对python打乱数据集中X,y标签对的方法详解
Dec 14 #Python
Python实现带参数的用户验证功能装饰器示例
Dec 14 #Python
You might like
PHP中防止直接访问或查看或下载config.php文件的方法
2012/07/07 PHP
destoon实现不同会员组公司名称显示不同的颜色的方法
2014/08/22 PHP
php版微信公众平台回复中文出现乱码问题的解决方法
2016/09/22 PHP
PHP获取星期几的常用方法小结
2018/12/18 PHP
Yii框架模拟组件调用注入示例
2019/11/11 PHP
基于jquery的图片懒加载js
2010/06/30 Javascript
jquery.validate使用攻略 第一部
2010/07/01 Javascript
Chosen 基于jquery的选择框插件使用方法
2012/05/30 Javascript
JavaScript使用indexOf获得子字符串在字符串中位置的方法
2015/04/06 Javascript
js实现点击链接后延迟3秒再跳转的方法
2015/06/05 Javascript
js密码强度实时检测代码
2016/03/02 Javascript
jQuery实现表格行和列的动态添加与删除方法【测试可用】
2016/08/01 Javascript
简单实现jquery焦点图
2016/12/12 Javascript
Bootstrap源码解读按钮(5)
2016/12/23 Javascript
Angular中的$watch方法详解
2017/09/18 Javascript
js处理包含中文的字符串实例
2017/10/11 Javascript
vue select组件的使用与禁用实现代码
2018/04/10 Javascript
vue.js 2.*项目环境搭建、运行、打包发布的详细步骤
2019/05/01 Javascript
详解vue 2.6 中 slot 的新用法
2019/07/09 Javascript
解决Vue 移动端点击出现300毫秒延迟的问题
2020/07/21 Javascript
[33:39]DOTA2上海特级锦标赛C组小组赛#2 LGD VS Newbee第二局
2016/02/27 DOTA
使用Python简单的实现树莓派的WEB控制
2016/02/18 Python
详解Python中表达式i += x与i = i + x是否等价
2017/02/08 Python
Python正则抓取网易新闻的方法示例
2017/04/21 Python
Python基于递归算法实现的汉诺塔与Fibonacci数列示例
2018/04/18 Python
python+selenium+chromedriver实现爬虫示例代码
2020/04/10 Python
python re的findall和finditer的区别详解
2020/11/15 Python
国外平面设计第一市场:99designs
2016/10/25 全球购物
美国隐形眼镜销售网站:ContactsDirect
2017/10/28 全球购物
英国女装网上商店:I Saw It First
2018/10/18 全球购物
台湾家适得:Homeget
2019/02/11 全球购物
英国奢侈品牌时尚购物平台:Farfetch(支持中文)
2020/02/18 全球购物
岗位说明书范文
2014/05/07 职场文书
物理教育专业求职信
2014/06/25 职场文书
教师党的群众路线教育实践活动学习心得体会
2014/10/30 职场文书
财务整改报告范文
2014/11/05 职场文书