python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
Python代码调试的几种方法总结
Apr 15 Python
python Django框架实现自定义表单提交
Mar 25 Python
Python中第三方库Requests库的高级用法详解
Mar 12 Python
Python3学习urllib的使用方法示例
Nov 29 Python
利用python解决mysql视图导入导出依赖的问题
Dec 17 Python
Python 带有参数的装饰器实例代码详解
Dec 06 Python
Python实现Selenium自动化Page模式
Jul 14 Python
使用python telnetlib批量备份交换机配置的方法
Jul 25 Python
Django上线部署之IIS的配置方法
Aug 22 Python
Windows系统下pycharm中的pip换源
Feb 23 Python
python音频处理的示例详解
Dec 23 Python
python脚本使用阿里云slb对恶意攻击进行封堵的实现
Feb 04 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
php smarty模版引擎中变量操作符及使用方法
2009/12/11 PHP
php header示例代码(推荐)
2010/09/08 PHP
微信支付之JSAPI公众号支付详解
2019/05/15 PHP
PHP基于swoole多进程操作示例
2019/08/12 PHP
jquery 获取json数据实现代码
2009/04/27 Javascript
JavaScript高级程序设计 读书笔记之十 本地对象Date日期
2012/02/27 Javascript
S2SH整合JQuery+Ajax实现登录验证功能实现代码
2013/01/30 Javascript
Javascript中克隆一个数组的实现代码
2013/12/06 Javascript
基于jquery实现的自动补全功能
2015/03/12 Javascript
JavaScript实现图片DIV竖向滑动的方法
2015/04/25 Javascript
js实现上一页下一页的效果【附代码】
2016/03/10 Javascript
深入理解nodejs搭建静态服务器(实现命令行)
2019/02/05 NodeJs
js设置鼠标悬停改变背景色实现详解
2019/06/26 Javascript
Vue自定义render统一项目组弹框功能
2020/06/07 Javascript
js+audio实现音乐播放器
2020/09/13 Javascript
[38:21]2014 DOTA2国际邀请赛中国区预选赛5.21 TongFu VS LGD-CDEC
2014/05/22 DOTA
理解python中生成器用法
2017/12/20 Python
利用Python如何批量更新服务器文件
2018/07/29 Python
python pandas读取csv后,获取列标签的方法
2018/11/12 Python
python中比较两个列表的实例方法
2019/07/04 Python
python3 图片 4通道转成3通道 1通道转成3通道 图片压缩实例
2019/12/03 Python
python小项目之五子棋游戏
2019/12/26 Python
Python函数的迭代器与生成器的示例代码
2020/06/18 Python
html5 canvas 实现光线沿不规则路径运动
2020/04/20 HTML / CSS
俄罗斯品牌服装和鞋子在线商店:BRIONITY
2020/03/26 全球购物
英国马莎百货印度官网:Marks & Spencer印度
2020/10/08 全球购物
Java里面StringBuilder和StringBuffer有什么区别
2016/06/06 面试题
工程造价与财务管理专业应届生求职信
2013/10/06 职场文书
高三体育教学反思
2014/01/29 职场文书
计划生育标语
2014/06/23 职场文书
毕业生找工作求职信
2014/08/05 职场文书
2015届本科毕业生自我鉴定
2014/09/27 职场文书
个人党性分析材料
2014/12/19 职场文书
2016年法制宣传月活动总结
2016/04/01 职场文书
少儿励志名言(80句)
2019/08/14 职场文书
MySQL库表名大小写的选择
2021/06/05 MySQL