PyCharm搭建Spark开发环境的实现步骤


Posted in Python onSeptember 05, 2019

1.安装好JDK

下载并安装好jdk-12.0.1_windows-x64_bin.exe,配置环境变量:

  • 新建系统变量JAVA_HOME,值为Java安装路径
  • 新建系统变量CLASSPATH,值为 .;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar;(注意最前面的圆点)
  • 配置系统变量PATH,添加 %JAVA_HOME%bin;%JAVA_HOME%jrebin

在CMD中输入:java或者java -version,不显示不是内部命令等,说明安装成功。

2.安装Hadoop,并配置环境变量

下载hadoop:https://www.apache.org/dyn/closer.cgi/hadoop/common/hadoop-2.7.7/hadoop-2.7.7.tar.gz

PyCharm搭建Spark开发环境的实现步骤

  • 解压hadoop-2.7.7.tar.gz特定路径,如:D:\adasoftware\hadoop
  • 添加系统变量HADOOP_HOME:D:\adasoftware\hadoop
  • 在系统变量PATH中添加:D:\adasoftware\hadoop\bin
  • 安装组件winutils:将winutils中对应的hadoop版本中的bin替换自己hadoop安装目录下的bin

3.Spark环境变量配置

spark是基于hadoop之上的,运行过程中会调用相关hadoop库,如果没配置相关hadoop运行环境,会提示相关出错信息,虽然也不影响运行。

  • 下载对应hadoop版本的spark:http://spark.apache.org/downloads.html
  • 解压文件到:D:\adasoftware\spark-2.4.3-bin-hadoop2.7
  • 添加PATH值:D:\adasoftware\spark-2.4.3-bin-hadoop2.7\bin;
  • 新建系统变量SPARK_HOME:D:\adasoftware\spark-2.4.3-bin-hadoop2.7;

4.下载安装anaconda

anaconda集成了python解释器和大多数python库,安装anaconda 后不用再安装python和pandas numpy等这些组件了。下载地址。最后将python加到path环境变量中。

5.在CMD中运行pyspark,出现类似下图说明安装配置正常:

PyCharm搭建Spark开发环境的实现步骤

出现这种warning是因为JDK版本为12,太高了,但是不影响运行。没有影响。

6.在pycharm中配置spark

打开PyCharm,创建一个Project。然后选择“Run” ->“Edit Configurations”?>点击+创建新的python Configurations

PyCharm搭建Spark开发环境的实现步骤

选择 “Environment variables” 增加SPARK_HOME目录与PYTHONPATH目录。

  • SPARK_HOME:Spark安装目录
  • PYTHONPATH:Spark安装目录下的Python目录

PyCharm搭建Spark开发环境的实现步骤

选择 File->setting->你的project->project structure

右上角Add content root添加:py4j-some-version.zip和pyspark.zip的路径(这两个文件都在Spark中的python文件夹下)

保存即可

7.测试是否配置成功,程序代码如下,创建一个python程序放进去就可以:

import os
import sys

# Path for spark source folder
os.environ['SPARK_HOME'] = "D:\adasoftware\spark"

# Append pyspark to Python Path
sys.path.append("D:\adasoftware\spark\python")

try:
 from pyspark import SparkContext
 from pyspark import SparkConf

 print("Successfully imported Spark Modules")
except ImportError as e:
 print("Can not import Spark Modules", e)
 sys.exit(1)

若程序正常输出: "Successfully imported Spark Modules"就说明环境已经可以正常执行。

PyCharm搭建Spark开发环境的实现步骤

 以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python加pyGame实现的简单拼图游戏实例
May 15 Python
浅谈Python爬取网页的编码处理
Nov 04 Python
Python跨文件全局变量的实现方法示例
Dec 10 Python
详解Python nose单元测试框架的安装与使用
Dec 20 Python
Window 64位下python3.6.2环境搭建图文教程
Sep 19 Python
对python for 文件指定行读写操作详解
Dec 29 Python
Python 中包/模块的 `import` 操作代码
Apr 22 Python
Django学习之文件上传与下载
Oct 06 Python
Django框架序列化与反序列化操作详解
Nov 01 Python
新手学python应该下哪个版本
Jun 11 Python
python blinker 信号库
May 04 Python
Python使用plt.boxplot()函数绘制箱图、常用方法以及含义详解
Aug 14 Python
浅谈Python_Openpyxl使用(最全总结)
Sep 05 #Python
python实现人工智能Ai抠图功能
Sep 05 #Python
深入了解Python在HDA中的应用
Sep 05 #Python
python urllib爬虫模块使用解析
Sep 05 #Python
详解Python3 pandas.merge用法
Sep 05 #Python
python爬虫 猫眼电影和电影天堂数据csv和mysql存储过程解析
Sep 05 #Python
python爬取Ajax动态加载网页过程解析
Sep 05 #Python
You might like
Protoss兵种对照表
2020/03/14 星际争霸
Yii2.0表关联查询实例分析
2016/07/18 PHP
PHP中new static()与new self()的比较
2016/08/19 PHP
javascript+iframe 实现无刷新载入整页的代码
2010/03/17 Javascript
Javascript执行效率全面总结
2013/11/04 Javascript
js动态修改表格行colspan列跨度的方法
2015/03/30 Javascript
jQuery表单验证功能实例
2015/08/28 Javascript
去除字符串左右两边的空格(实现代码)
2016/05/12 Javascript
基于JavaScript实现在新的tab页打开url
2016/08/04 Javascript
JS Select下拉框(支持输入模糊查询)
2017/02/04 Javascript
canvas红包照片实例分享
2017/02/28 Javascript
vue中七牛插件使用的实例代码
2017/07/28 Javascript
JavaScript实现的数字与字符串转换功能示例
2017/08/23 Javascript
element-ui 限制日期选择的方法(datepicker)
2018/05/16 Javascript
微信小程序wepy框架笔记小结
2018/08/08 Javascript
JavaScript简单编程实例学习
2020/02/14 Javascript
JS中FileReader类实现文件上传及时预览功能
2020/03/27 Javascript
微信小程序文章详情功能完整实例
2020/06/03 Javascript
python编码最佳实践之总结
2016/02/14 Python
Python进阶-函数默认参数(详解)
2017/05/18 Python
python使用super()出现错误解决办法
2017/08/14 Python
python实现可下载音乐的音乐播放器
2020/02/25 Python
python关于变量名的基础知识点
2020/03/03 Python
python ETL工具 pyetl
2020/06/07 Python
PyQt5的相对布局管理的实现
2020/08/07 Python
独特的礼品和创新的科技产品:The Grommet
2018/02/24 全球购物
意大利珠宝店:Luxury Zone
2019/01/05 全球购物
新大陆软件面试题
2016/11/24 面试题
面向对象概念面试题(.NET)
2016/11/04 面试题
劲霸男装广告词改编版
2014/03/21 职场文书
解除劳动合同协议书(样本)
2014/10/02 职场文书
商家认证委托书格式
2014/10/16 职场文书
2015年试用期自我评价范文
2015/03/10 职场文书
go 原生http web 服务跨域restful api的写法介绍
2021/04/27 Golang
mysql 获取相邻数据项
2022/05/11 MySQL
华为HarmonyOS3.0强在哪? 看看鸿蒙3.0这7个小功能
2023/01/09 数码科技