python数据挖掘需要学的内容


Posted in Python onJune 23, 2019

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

Python 相关文章推荐
python基础入门详解(文件输入/输出 内建类型 字典操作使用方法)
Dec 08 Python
python里对list中的整数求平均并排序
Sep 12 Python
介绍Python的@property装饰器的用法
Apr 28 Python
Python编程中运用闭包时所需要注意的一些地方
May 02 Python
Python读取指定目录下指定后缀文件并保存为docx
Apr 23 Python
python 3利用Dlib 19.7实现摄像头人脸检测特征点标定
Feb 26 Python
Python OpenCV处理图像之图像直方图和反向投影
Jul 10 Python
python实现nao机器人身体躯干和腿部动作操作
Apr 29 Python
Python使用PyQt5/PySide2编写一个极简的音乐播放器功能
Feb 07 Python
Python内置函数property()如何使用
Sep 01 Python
PyQt5多线程防卡死和多窗口用法的实现
Sep 15 Python
jupyter notebook远程访问不了的问题解决方法
Jan 11 Python
python中字符串数组逆序排列方法总结
Jun 23 #Python
一篇文章弄懂Python中所有数组数据类型
Jun 23 #Python
python程序快速缩进多行代码方法总结
Jun 23 #Python
python函数与方法的区别总结
Jun 23 #Python
python中的单引号双引号区别知识点总结
Jun 23 #Python
Python中的pathlib.Path为什么不继承str详解
Jun 23 #Python
Python中判断子串存在的性能比较及分析总结
Jun 23 #Python
You might like
剧场版动画《PSYCHO-PASS 3 FIRST INSPECTOR》3月27日日本上映!
2020/03/06 日漫
图解上海144收音机
2021/03/02 无线电
php URL编码解码函数代码
2009/03/10 PHP
兼容ie6浏览器的php下载文件代码分享
2014/07/14 PHP
php中实现可以返回多个值的函数实例
2015/03/21 PHP
分析PHP中单双引号的误区和双引号小隐患
2016/07/19 PHP
Thinkphp 框架基础之入口文件功能、定义与用法分析
2020/04/27 PHP
输入密码检测大写是否锁定js实现代码
2012/12/03 Javascript
jquery iframe操作详细解析
2013/11/20 Javascript
浅析JavaScript中的常用算法与函数
2013/11/21 Javascript
js中匿名函数的创建与调用方法分析
2014/12/19 Javascript
判断浏览器的内核及版本号方法汇总
2015/01/05 Javascript
jQuery实现仿Alipay支付宝首页全屏焦点图切换特效
2015/05/04 Javascript
JS+CSS实现的简单折叠展开多级菜单效果
2015/09/12 Javascript
jQuery给div,Span, a ,button, radio 赋值与取值
2016/06/24 Javascript
Bootstrap幻灯片轮播图支持触屏左右手势滑动的实现方法
2016/10/13 Javascript
JS实现隔行换色的表格排序
2017/03/27 Javascript
Angular 4.x 路由快速入门学习
2017/05/03 Javascript
webpack处理 css\less\sass 样式的方法
2017/08/21 Javascript
JS基于正则表达式实现的密码强度验证功能示例
2017/09/21 Javascript
纯JS实现的读取excel文件内容功能示例【支持所有浏览器】
2018/06/23 Javascript
vue+ElementUI 关闭对话框清空验证,清除form表单的操作
2020/08/06 Javascript
在Python中使用mechanize模块模拟浏览器功能
2015/05/05 Python
Android应用开发中Action bar编写的入门教程
2016/02/26 Python
详解python中的 is 操作符
2017/12/26 Python
Python编程求解二叉树中和为某一值的路径代码示例
2018/01/04 Python
浅谈Python中重载isinstance继承关系的问题
2018/05/04 Python
自适应线性神经网络Adaline的python实现详解
2019/09/30 Python
基于Python共轭梯度法与最速下降法之间的对比
2020/04/02 Python
CSS3 Backgrounds属性相关介绍
2011/05/11 HTML / CSS
Ibatis中如何提高SQL Map的性能
2013/05/11 面试题
医学检验专业个人求职信范文
2013/12/04 职场文书
家居装修公司创业计划书范文
2014/03/20 职场文书
国际贸易实务实训报告
2014/11/05 职场文书
婚内分居协议书范文
2014/11/26 职场文书
导游词之京东大峡谷旅游区
2019/10/29 职场文书