如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中使用 Selenium 实现网页截图实例
Jul 18 Python
Python 正则表达式(转义问题)
Dec 15 Python
详解Python多线程
Nov 14 Python
Python实现二分查找与bisect模块详解
Jan 13 Python
浅谈python中的数字类型与处理工具
Aug 02 Python
python、java等哪一门编程语言适合人工智能?
Nov 13 Python
python3获取当前文件的上一级目录实例
Apr 26 Python
Python用for循环实现九九乘法表
May 31 Python
python3 中的字符串(单引号、双引号、三引号)以及字符串与数字的运算
Jul 18 Python
python 魔法函数实例及解析
Sep 25 Python
python如何将两个txt文件内容合并
Oct 18 Python
基于Python词云分析政府工作报告关键词
Jun 02 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
php绝对路径与相对路径之间关系的的分析
2010/03/03 PHP
php中将数组转成字符串并保存到数据库中的函数代码
2013/09/29 PHP
JavaScript 获得选中文本内容的方法
2009/02/15 Javascript
js中return false(阻止)的用法
2013/08/14 Javascript
浅析基于WEB前端页面的页面内容搜索的实现思路
2014/06/10 Javascript
jquery操作checkbox示例分享
2014/07/21 Javascript
Bootstrap每天必学之进度条
2015/11/30 Javascript
EasyUi combotree 实现动态加载树节点
2016/04/01 Javascript
JS中split()用法(将字符串按指定符号分割成数组)
2016/10/24 Javascript
EasyUI中的dataGrid的行内编辑
2017/06/22 Javascript
2分钟实现一个Vue实时直播系统的示例代码
2020/06/05 Javascript
Vue实现返回顶部按钮实例代码
2020/10/21 Javascript
[01:06]DOTA2隆重推出2016冬季勇士令状 内含上海特级锦标赛互动指南
2016/02/17 DOTA
[00:55]深扒TI7聊天轮盘语音出处3
2017/05/11 DOTA
[40:12]Liquid vs Chaos 2019国际邀请赛小组赛 BO2 第二场 8.15
2019/08/16 DOTA
Python Queue模块详解
2014/11/30 Python
在Django的URLconf中使用多个视图前缀的方法
2015/07/18 Python
python模块之time模块(实例讲解)
2017/09/13 Python
numpy.random.seed()的使用实例解析
2018/02/03 Python
python常用数据重复项处理方法
2019/11/22 Python
python文件和文件夹复制函数
2020/02/07 Python
如何配置关联Python 解释器 Anaconda的教程(图解)
2020/04/30 Python
Python实现Word文档转换Markdown的示例
2020/12/22 Python
解决pytorch 数据类型报错的问题
2021/03/03 Python
HTML5中的拖放实现详解
2017/08/23 HTML / CSS
中东地区为妈妈们提供一切的头号购物目的地:Sprii
2018/05/06 全球购物
一些.net面试题
2014/10/06 面试题
linux面试题参考答案(5)
2014/09/01 面试题
八项规定整改措施
2014/02/12 职场文书
大学生实习鉴定评语
2014/04/25 职场文书
平安工地汇报材料
2014/08/19 职场文书
迎新生欢迎词2015
2015/07/16 职场文书
励志语录:时光飞逝,请学会珍惜所有的人和事
2020/01/16 职场文书
苹果电脑mac os中货币符号快捷输入
2022/02/17 杂记
mysql 获取相邻数据项
2022/05/11 MySQL
Spring boot admin 服务监控利器详解
2022/08/05 Java/Android