PyCharm搭建Spark开发环境的实现步骤


Posted in Python onSeptember 05, 2019

1.安装好JDK

下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量:

  • 新建系统变量JAVA_HOME,值为Java安装路径
  • 新建系统变量CLASSPATH,值为 .;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;(注意最前面的圆点)
  • 配置系统变量PATH,添加 %JAVA_HOME%bin;%JAVA_HOME%jrebin

在CMD中输入:java或者java -version,不显示不是内部命令等,说明安装成功。

2.安装Hadoop,并配置环境变量

下载hadoop:https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

PyCharm搭建Spark开发环境的实现步骤

  • 解压hadoop-2.7.7.tar.gz特定路径,如:D:\adasoftware\hadoop
  • 添加系统变量HADOOP_HOME:D:\adasoftware\hadoop
  • 在系统变量PATH中添加:D:\adasoftware\hadoop\bin
  • 安装组件winutils:将winutils中对应的hadoop版本中的bin替换自己hadoop安装目录下的bin

3.Spark环境变量配置

spark是基于hadoop之上的,运行过程中会调用相关hadoop库,如果没配置相关hadoop运行环境,会提示相关出错信息,虽然也不影响运行。

  • 下载对应hadoop版本的spark:http://spark.apache.org/downloads.html
  • 解压文件到:D:\adasoftware\spark-2.4.3-bin-hadoop2.7
  • 添加PATH值:D:\adasoftware\spark-2.4.3-bin-hadoop2.7\bin;
  • 新建系统变量SPARK_HOME:D:\adasoftware\spark-2.4.3-bin-hadoop2.7;

4.下载安装anaconda

anaconda集成了python解释器和大多数python库,安装anaconda 后不用再安装python和pandas numpy等这些组件了。下载地址。最后将python加到path环境变量中。

5.在CMD中运行pyspark,出现类似下图说明安装配置正常:

PyCharm搭建Spark开发环境的实现步骤

出现这种warning是因为JDK版本为12,太高了,但是不影响运行。没有影响。

6.在pycharm中配置spark

打开PyCharm,创建一个Project。然后选择“Run” ->“Edit Configurations”?>点击+创建新的python Configurations

PyCharm搭建Spark开发环境的实现步骤

选择 “Environment variables” 增加SPARK_HOME目录与PYTHONPATH目录。

  • SPARK_HOME:Spark安装目录
  • PYTHONPATH:Spark安装目录下的Python目录

PyCharm搭建Spark开发环境的实现步骤

选择 File->setting->你的project->project structure

右上角Add content root添加:py4j-some-version.zip和pyspark.zip的路径(这两个文件都在Spark中的python文件夹下)

保存即可

7.测试是否配置成功,程序代码如下,创建一个python程序放进去就可以:

import os
import sys

# Path for spark source folder
os.environ['SPARK_HOME'] = "D:\adasoftware\spark"

# Append pyspark to Python Path
sys.path.append("D:\adasoftware\spark\python")

try:
 from pyspark import SparkContext
 from pyspark import SparkConf

 print("Successfully imported Spark Modules")
except ImportError as e:
 print("Can not import Spark Modules", e)
 sys.exit(1)

若程序正常输出: "Successfully imported Spark Modules"就说明环境已经可以正常执行。

PyCharm搭建Spark开发环境的实现步骤

 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python创建声明性迷你语言的教程
Apr 13 Python
Python 提取dict转换为xml/json/table并输出的实现代码
Aug 28 Python
Python连接PostgreSQL数据库的方法
Nov 28 Python
python数据结构之链表的实例讲解
Jul 25 Python
python遍历序列enumerate函数浅析
Oct 17 Python
50行Python代码实现人脸检测功能
Jan 23 Python
Python下使用Scrapy爬取网页内容的实例
May 21 Python
在numpy矩阵中令小于0的元素改为0的实例
Jan 26 Python
python调用接口的4种方式代码实例
Nov 19 Python
使用Python的Turtle库绘制森林的实例
Dec 18 Python
使用python-pptx包批量修改ppt格式的实现
Feb 14 Python
30行Python代码实现高分辨率图像导航的方法
May 22 Python
浅谈Python_Openpyxl使用(最全总结)
Sep 05 #Python
python实现人工智能Ai抠图功能
Sep 05 #Python
深入了解Python在HDA中的应用
Sep 05 #Python
python urllib爬虫模块使用解析
Sep 05 #Python
详解Python3 pandas.merge用法
Sep 05 #Python
python爬虫 猫眼电影和电影天堂数据csv和mysql存储过程解析
Sep 05 #Python
python爬取Ajax动态加载网页过程解析
Sep 05 #Python
You might like
destoon供应信息title调用出公司名称的方法
2014/08/22 PHP
详解PHP对象的串行化与反串行化
2016/01/24 PHP
PHP文字转图片功能原理与实现方法分析
2017/08/31 PHP
Yii2框架数据验证操作实例详解
2018/05/02 PHP
详解laravel安装使用Passport(Api认证)
2018/07/27 PHP
永不消失的title提示代码
2007/02/15 Javascript
jQuery实现的经典竖向伸缩菜单效果代码
2015/09/24 Javascript
JavaScript创建对象的方式小结(4种方式)
2015/12/17 Javascript
javascript ASCII和Hex互转的实现方法
2016/12/27 Javascript
jQuery Password Validation密码验证
2016/12/30 Javascript
Bootstrap Scrollspy源码学习
2017/03/02 Javascript
vue超时计算的组件实例代码
2018/07/09 Javascript
基于AngularJs select绑定数字类型的问题
2018/10/08 Javascript
微信小程序页面滚动到指定位置代码实例
2019/09/07 Javascript
layui-select动态选中值的例子
2019/09/23 Javascript
Vue分页插件的前后端配置与使用
2019/10/09 Javascript
小程序实现长按保存图片的方法
2019/12/31 Javascript
js实现单元格拖拽效果
2020/02/10 Javascript
vue利用全局导航守卫作登录后跳转到未登录前指定页面的实例代码
2020/05/19 Javascript
vue修改Element的el-table样式的4种方法
2020/09/17 Javascript
python用来获得图片exif信息的库实例分析
2015/03/16 Python
python通过post提交数据的方法
2015/05/06 Python
使用TensorFlow实现简单线性回归模型
2019/07/19 Python
Python实现自动装机功能案例分析
2020/10/22 Python
CSS3等相关属性制作分页导航实现代码
2012/12/24 HTML / CSS
CSS3中background-clip和background-origin的区别示例介绍
2014/03/10 HTML / CSS
HTML5混合开发二维码扫描以及调用本地摄像头
2017/12/27 HTML / CSS
施华洛世奇加拿大官网:SWAROVSKI加拿大
2018/06/03 全球购物
团员个人的自我评价
2013/12/02 职场文书
回门宴新郎答谢词
2014/01/12 职场文书
书法比赛获奖感言
2014/02/10 职场文书
创建文明城市标语
2014/06/16 职场文书
股东出资证明书(正规版)
2014/09/24 职场文书
2014年班长个人工作总结
2014/11/14 职场文书
分享python函数常见关键字
2022/04/26 Python
Spring中的@Transactional的工作原理
2022/06/05 Java/Android