python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
Python中线程的MQ消息队列实现以及消息队列的优点解析
Jun 29 Python
python微信公众号之关注公众号自动回复
Oct 25 Python
python 实现在一张图中绘制一个小的子图方法
Jul 07 Python
Python字典推导式将cookie字符串转化为字典解析
Aug 10 Python
python实现生成Word、docx文件的方法分析
Aug 30 Python
Python基本语法之运算符功能与用法详解
Oct 22 Python
python多线程案例之多任务copy文件完整实例
Oct 29 Python
在PyCharm中遇到pip安装 失败问题及解决方案(pip失效时的解决方案)
Mar 10 Python
关于tf.matmul() 和tf.multiply() 的区别说明
Jun 18 Python
python正则表达式的懒惰匹配和贪婪匹配说明
Jul 13 Python
Python 多线程之threading 模块的使用
Apr 14 Python
能让Python提速超40倍的神器Cython详解
Jun 24 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
php时间戳转换代码详解
2019/08/04 PHP
javascript 动态设置已知select的option的value值的代码
2009/12/16 Javascript
return false;和e.preventDefault();的区别
2010/07/11 Javascript
JavaScript 注册事件代码
2011/01/27 Javascript
基于jQuery的遍历同id元素 并响应事件的代码
2012/06/14 Javascript
详解Javascript动态操作CSS
2014/12/08 Javascript
js window对象属性和方法相关资料整理
2015/11/11 Javascript
JavaScript中有关一个数组中最大值和最小值及它们的下表的输出的解决办法
2016/07/01 Javascript
简单理解js的prototype属性及使用
2016/12/07 Javascript
从零开始学习Node.js系列教程二:文本提交与显示方法
2017/04/13 Javascript
详解webpack解惑:require的五种用法
2017/06/09 Javascript
JavaScript实现的搜索及高亮显示功能示例
2017/08/14 Javascript
浅谈Express异步进化史
2017/09/09 Javascript
jQuery中图片展示插件highslide.js的简单dom
2018/04/22 jQuery
js实现购物车功能
2018/06/12 Javascript
JS实现点击拉拽轮播图pc端移动端适配
2018/09/05 Javascript
NVM安装nodejs的方法实用步骤
2019/01/16 NodeJs
node获取客户端ip功能简单示例
2019/08/24 Javascript
解决node终端下运行js文件不支持ES6语法
2020/04/04 Javascript
基于Vue中的父子传值问题解决
2020/07/27 Javascript
在vue中使用回调函数,this调用无效的解决
2020/08/11 Javascript
[05:53]完美世界携手游戏风云打造 卡尔工作室观战系统篇
2013/04/22 DOTA
[00:59]DOTA2英雄背景故事——上古巨神
2020/06/28 DOTA
[06:45]DOTA2-DPC中国联赛 正赛 Magma vs LBZS 选手采访
2021/03/11 DOTA
python实现读取命令行参数的方法
2015/05/22 Python
Opencv+Python实现图像运动模糊和高斯模糊的示例
2019/04/11 Python
HTML5 Web 存储详解
2016/09/16 HTML / CSS
Banana Republic欧盟:美国都市简约风格的代表品牌
2018/05/09 全球购物
毕业生就业推荐信范文
2013/12/01 职场文书
中专生毕业个人鉴定
2014/02/26 职场文书
批评与自我批评发言稿
2014/10/15 职场文书
2014年团工作总结
2014/11/27 职场文书
2014年劳动部工作总结
2014/12/11 职场文书
2016年党员学习廉政准则心得体会
2016/01/20 职场文书
三八红旗手先进事迹材料(2016推荐版)
2016/02/25 职场文书
Spring Cache和EhCache实现缓存管理方式
2021/06/15 Java/Android