如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python服务器端收发请求的实现代码
Sep 29 Python
Python引用模块和查找模块路径
Mar 17 Python
TensorFlow入门使用 tf.train.Saver()保存模型
Apr 24 Python
详解Python 正则表达式模块
Nov 05 Python
基于python3 pyQt5 QtDesignner实现窗口化猜数字游戏功能
Jul 15 Python
Django中自定义模型管理器(Manager)及方法
Sep 23 Python
flask 框架操作MySQL数据库简单示例
Feb 02 Python
python中rc1什么意思
Jun 19 Python
matplotlib教程——强大的python作图工具库
Oct 15 Python
python Scrapy框架原理解析
Jan 04 Python
Python中的面向接口编程示例详解
Jan 17 Python
OpenCV-Python使用cv2实现傅里叶变换
Jun 09 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
PHP - Html Transfer Code
2006/10/09 PHP
ECMall支持SSL连接邮件服务器的配置方法详解
2014/05/19 PHP
php三种实现多线程类似的方法
2015/10/30 PHP
js实现运行代码需要刷新的解决方法
2007/08/18 Javascript
JS实现简单的Canvas画图实例
2013/07/04 Javascript
jQuery中next()方法用法实例
2015/01/07 Javascript
多个jQuery版本共存的处理方案
2015/03/17 Javascript
javascript跨域方法、原理以及出现问题解决方法(详解)
2015/08/06 Javascript
JS检测移动端横竖屏的代码
2016/05/30 Javascript
浅析BootStrap栅格系统
2016/06/07 Javascript
利用jquery实现实时更新歌词的方法
2017/01/06 Javascript
JavaScript实现微信号随机切换代码
2018/03/09 Javascript
浅谈webpack-dev-server的配置和使用
2018/05/17 Javascript
详解mpvue开发小程序小总结
2018/07/25 Javascript
微信小程序的注册页面包含倒计时验证码、获取用户信息
2019/05/22 Javascript
Python数据结构之Array用法实例
2014/10/09 Python
利用Python绘制MySQL数据图实现数据可视化
2015/03/30 Python
浅谈Python 集合(set)类型的操作——并交差
2016/06/30 Python
python实现求两个字符串的最长公共子串方法
2018/07/20 Python
Python实现快速傅里叶变换的方法(FFT)
2018/07/21 Python
详解Django的CSRF认证实现
2018/10/09 Python
在pycharm 中添加运行参数的操作方法
2019/01/19 Python
python matplotlib如何给图中的点加标签
2019/11/14 Python
python基于property()函数定义属性
2020/01/22 Python
浅谈Python 参数与变量
2020/06/20 Python
python如何使用腾讯云发送短信
2020/09/17 Python
html5中canvas学习笔记2-判断浏览器是否支持canvas
2013/01/06 HTML / CSS
英国厨房与餐具用品为主的设计品牌:Joseph Joseph
2018/04/26 全球购物
学习十八大精神心得体会
2013/12/31 职场文书
商业房地产广告语
2014/03/13 职场文书
保护环境建议书100字
2014/05/13 职场文书
物流专业自荐信
2014/05/23 职场文书
业务员岗位职责范本
2015/04/03 职场文书
2015年生产车间工作总结
2015/04/22 职场文书
《地震中的父与子》教学反思
2016/02/16 职场文书
图片批量处理 - 尺寸、格式、水印等
2022/03/07 杂记