python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
使用 Python 获取 Linux 系统信息的代码
Jul 13 Python
django用户注册、登录、注销和用户扩展的示例
Mar 19 Python
Python实现聊天机器人的示例代码
Jul 09 Python
Sanic框架安装与简单入门示例
Jul 16 Python
python 3.3 下载固定链接文件并保存的方法
Dec 18 Python
python递归法解决棋盘分割问题
Jul 17 Python
Django Rest framework频率原理与限制
Jul 26 Python
wxPython色环电阻计算器
Nov 18 Python
Python 函数绘图及函数图像微分与积分
Nov 20 Python
如何利用Python写个坦克大战
Nov 18 Python
Selenium Webdriver元素定位的八种常用方式(小结)
Jan 13 Python
python中pyqtgraph知识点总结
Jan 26 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
PHP 常用函数库和一些实用小技巧
2009/01/01 PHP
PHP+Mysql+Ajax+JS实现省市区三级联动
2014/05/23 PHP
phpmyadmin提示The mbstring extension is missing的解决方法
2014/12/17 PHP
PHPExcel读取EXCEL中的图片并保存到本地的方法
2015/02/14 PHP
Javascript 获取LI里的内容
2008/12/17 Javascript
Javascript Jquery 遍历Json的实现代码
2010/03/31 Javascript
在多个页面使用同一个HTML片段的代码
2011/03/04 Javascript
jcrop基本参数一览
2013/07/16 Javascript
javascript实现简单的分页特效
2015/08/12 Javascript
详解微信小程序 wx.uploadFile 的编码坑
2017/01/23 Javascript
解决vue-cli中stylus无法使用的问题方法
2017/06/19 Javascript
浅谈express 中间件机制及实现原理
2017/08/31 Javascript
Windows安装Node.js报错:2503、2502的解决方法
2017/10/25 Javascript
js与jQuery实现的用户注册协议倒计时功能实例【三种方法】
2017/11/09 jQuery
微信小程序实现图片上传放大预览删除代码
2020/06/28 Javascript
JS实现普通轮播图特效
2020/01/01 Javascript
[28:57]EG vs VGJ.T 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/16 DOTA
python使用装饰器和线程限制函数执行时间的方法
2015/04/18 Python
python交互式图形编程实例(三)
2017/11/17 Python
python学生信息管理系统
2018/03/13 Python
python3.x实现发送邮件功能
2018/05/22 Python
10分钟教你用Python实现微信自动回复功能
2018/11/28 Python
pybind11和numpy进行交互的方法
2019/07/04 Python
Python笔试面试题小结
2019/09/07 Python
用Python在Excel里画出蒙娜丽莎的方法示例
2020/04/28 Python
DKNY品牌官网:纽约大都会时尚风格
2016/10/20 全球购物
大学生求职中的自我评价
2013/10/01 职场文书
采购员岗位职责
2013/11/15 职场文书
实习老师离校感言
2014/02/03 职场文书
小学运动会入场式解说词
2014/02/18 职场文书
2014年教研活动总结范文
2014/04/26 职场文书
党小组意见范文
2015/06/08 职场文书
小学生教师节广播稿
2015/08/19 职场文书
2020优秀员工演讲稿(三篇)
2019/10/17 职场文书
go使用Gin框架利用阿里云实现短信验证码功能
2021/08/04 Golang
Win11如何设置右键单击显示所有选项?Win11右键单击显示所有选项设置教程
2022/04/08 数码科技