python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
将图片文件嵌入到wxpython代码中的实现方法
Aug 11 Python
Python EOL while scanning string literal问题解决方法
Sep 18 Python
Python读写配置文件的方法
Jun 03 Python
Python搭建APNS苹果推送通知推送服务的相关模块使用指南
Jun 02 Python
Python实现的爬虫功能代码
Jun 24 Python
Sublime开发python程序的示例代码
Jan 24 Python
python3.5 tkinter实现页面跳转
Jan 30 Python
opencv python 傅里叶变换的使用
Jul 21 Python
pandas去重复行并分类汇总的实现方法
Jan 29 Python
详解pytorch 0.4.0迁移指南
Jun 16 Python
Python通过VGG16模型实现图像风格转换操作详解
Jan 16 Python
Pytorch 如何加速Dataloader提升数据读取速度
May 28 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
PHP的几个常用数字判断函数代码
2012/04/24 PHP
zf框架的校验器使用使用示例(自定义校验器和校验器链)
2014/03/13 PHP
网站404页面3秒后跳到首页的实例代码
2013/08/16 Javascript
jquery ajax对特殊字符进行转义防止js注入使用示例
2013/11/21 Javascript
qq悬浮代码(兼容各个浏览器)
2014/01/29 Javascript
javascript中的循环语句for语句深入理解
2014/04/04 Javascript
jQuery简单实现仿京东商城的左侧菜单效果代码
2015/09/09 Javascript
Bootstrap打造一个左侧折叠菜单的系统模板(一)
2016/05/17 Javascript
vue刷新页面时去闪烁提升用户体验效果的实现方法
2018/12/10 Javascript
vue单文件组件lint error自动fix与styleLint报错自动fix详解
2019/01/08 Javascript
vue插槽slot的理解和使用方法
2019/04/03 Javascript
浅析Vue中拆分视图层代码的5点建议
2019/08/15 Javascript
基于layui的table插件进行复选框联动功能的实现方法
2019/09/19 Javascript
微信内置浏览器图片查看器的代码实例
2019/10/08 Javascript
Vue组件间的通信pubsub-js实现步骤解析
2020/03/11 Javascript
react项目从新建到部署的实现示例
2021/02/19 Javascript
[01:01:04]2018DOTA2亚洲邀请赛 4.5 淘汰赛 OpTic vs TNC 第一场
2018/04/06 DOTA
Python使用正则匹配实现抓图代码分享
2015/04/02 Python
python实现基本进制转换的方法
2015/07/11 Python
Python引用计数操作示例
2018/08/23 Python
python实现在函数图像上添加文字和标注的方法
2019/07/08 Python
jupyter notebook 添加kernel permission denied的操作
2020/04/21 Python
Pycharm如何导入python文件及解决报错问题
2020/05/10 Python
利用python绘制中国地图(含省界、河流等)
2020/09/21 Python
详解基于python的全局与局部序列比对的实现(DNA)
2020/10/07 Python
python基于pexpect库自动获取日志信息
2021/02/01 Python
华润集团网上药店:健一网
2016/09/19 全球购物
Perricone MD裴礼康美国官网:抗衰老护肤品
2016/09/26 全球购物
Elemental Herbology官网:英国美容品牌
2019/04/27 全球购物
sort命令的作用和用法
2013/08/25 面试题
市场营销计划书范文
2015/01/16 职场文书
同学毕业留言寄语
2015/02/27 职场文书
在人间读书笔记
2015/06/30 职场文书
关于运动会的广播稿
2015/08/19 职场文书
承诺书的签字人,需不需要承担相应的责任?
2019/07/09 职场文书
JavaScript中的LHS和RHS分析详情
2022/04/06 Javascript