python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
Python编程中time模块的一些关键用法解析
Jan 19 Python
分享一个可以生成各种进制格式IP的小工具实例代码
Jul 28 Python
python中is与双等于号“==”的区别示例详解
Nov 21 Python
TensorFlow实现iris数据集线性回归
Sep 07 Python
python微元法计算函数曲线长度的方法
Nov 08 Python
python实现最大子序和(分治+动态规划)
Jul 05 Python
Python学习笔记之Break和Continue用法分析
Aug 14 Python
python中sort和sorted排序的实例方法
Aug 26 Python
使用python脚本自动创建pip.ini配置文件代码实例
Sep 20 Python
浅谈Python3多线程之间的执行顺序问题
May 02 Python
Python 用__new__方法实现单例的操作
Dec 11 Python
Python Django 后台管理之后台模型属性详解
Apr 25 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
PHP 查找字符串常用函数介绍
2012/06/07 PHP
php管理nginx虚拟主机shell脚本实例
2014/11/19 PHP
php最简单的删除目录与文件实现方法
2014/11/28 PHP
PHP程序员必须清楚的问题汇总
2014/12/18 PHP
php使用cookie保存用户登录的用户名实例
2015/01/26 PHP
Laravel模板引擎Blade中section的一些标签的区别介绍
2015/02/10 PHP
PHP制作用户注册系统
2015/10/23 PHP
自己整理的一个javascript日期处理函数
2010/10/16 Javascript
js中confirm实现执行操作前弹出确认框的方法
2014/11/01 Javascript
JavaScript html5 canvas绘制时钟效果
2016/03/01 Javascript
bootstrap-table组合表头的实现方法
2017/09/07 Javascript
vue-cli与webpack处理静态资源的方法及webpack打包的坑
2018/05/15 Javascript
vue-cli 构建骨架屏的方法示例
2018/11/08 Javascript
小程序双头slider选择器的实现示例
2020/03/31 Javascript
CentOS 8.2服务器上安装最新版Node.js的方法
2020/12/16 Javascript
[20:57]Ti4主赛事第三天开幕式
2014/07/21 DOTA
[03:26]《DAC最前线》之EG经理自述DOTA2经历
2015/02/02 DOTA
[02:53]DOTA2亚洲邀请赛 NewBee战队巡礼
2015/02/03 DOTA
Python编写检测数据库SA用户的方法
2014/07/11 Python
利用Python中的mock库对Python代码进行模拟测试
2015/04/16 Python
python+selenium实现QQ邮箱自动发送功能
2019/01/23 Python
Python3.5面向对象程序设计之类的继承和多态详解
2019/04/24 Python
Python3监控疫情的完整代码
2020/02/20 Python
python图片验证码识别最新模块muggle_ocr的示例代码
2020/07/03 Python
canvas 实现 github404动态效果的示例代码
2017/11/15 HTML / CSS
澳大利亚快时尚鞋类市场:Billini
2018/05/20 全球购物
斯图尔特·韦茨曼鞋加拿大官网:Stuart Weitzman加拿大
2019/10/13 全球购物
Urban Decay官方网站:美国化妆品品牌
2020/06/04 全球购物
会议开场欢迎词
2014/01/15 职场文书
给面试官的感谢信
2014/02/01 职场文书
工会优秀工作者事迹
2014/08/17 职场文书
2014年综合治理工作总结
2014/11/20 职场文书
5.12护士节活动总结
2015/02/10 职场文书
大学生党课心得体会
2016/01/07 职场文书
2019垃圾分类宣传口号汇总
2019/08/16 职场文书
java Nio使用NioSocket客户端与服务端交互实现方式
2021/06/15 Java/Android