如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python使用paramiko模块实现ssh远程登陆上传文件并执行
Jan 27 Python
操作Windows注册表的简单的Python程序制作教程
Apr 07 Python
Python中函数的多种格式和使用实例及小技巧
Apr 13 Python
Python中最常用的操作列表的几种方法归纳
Apr 24 Python
Python并发:多线程与多进程的详解
Jan 24 Python
python3编写ThinkPHP命令执行Getshell的方法
Feb 26 Python
详解python之heapq模块及排序操作
Apr 04 Python
Python3 文章标题关键字提取的例子
Aug 26 Python
python3 xpath和requests应用详解
Mar 06 Python
Python2.7:使用Pyhook模块监听鼠标键盘事件-获取坐标实例
Mar 14 Python
Python如何输出百分比
Jul 31 Python
Python基于Webhook实现github自动化部署
Nov 28 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
PHP面向接口编程 耦合设计模式 简单范例
2011/03/23 PHP
PHP APC的安装与使用详解
2013/06/13 PHP
php中fsockopen用法实例
2015/01/05 PHP
Yii中CGridView实现批量删除的方法
2015/12/28 PHP
ThinkPHP框架安全实现分析
2016/03/14 PHP
PHP中的日期时间处理利器实例(Carbon)
2017/06/09 PHP
php-fpm服务启动脚本的方法
2018/04/27 PHP
tp5.1框架数据库子查询操作实例分析
2020/05/26 PHP
javascript中的undefined 与 null 的区别  补充篇
2010/03/17 Javascript
jQuery学习笔记 操作jQuery对象 CSS处理
2012/09/19 Javascript
javascript 实现字符串反转的三种方法
2013/11/23 Javascript
利用window.name实现windowStorage代码分享
2014/01/02 Javascript
jquery中获得元素尺寸和坐标的方法整理
2014/05/18 Javascript
Node.js与PHP、Python的字符处理性能对比
2014/07/06 Javascript
了不起的node.js读书笔记之node.js中的特性
2014/12/22 Javascript
jquery增加和删除元素的方法
2015/01/14 Javascript
js中 计算两个日期间的工作日的简单实例
2016/08/08 Javascript
利用JS对iframe父子(内外)页面进行操作的方法教程
2017/06/15 Javascript
详解angularJS自定义指令间的相互交互
2017/07/05 Javascript
使用 vue.js 构建大型单页应用
2018/02/10 Javascript
解决vue打包报错Unexpected token: punc的问题
2020/10/24 Javascript
详细介绍Python语言中的按位运算符
2013/11/26 Python
Python使用xlrd模块操作Excel数据导入的方法
2015/05/26 Python
Python常见加密模块用法分析【MD5,sha,crypt模块】
2017/05/24 Python
Python使用getpass库读取密码的示例
2017/10/10 Python
python Pandas 读取txt表格的实例
2018/04/29 Python
用python简单实现mysql数据同步到ElasticSearch的教程
2018/05/30 Python
删除python pandas.DataFrame 的多重index实例
2018/06/08 Python
Python GUI Tkinter简单实现个性签名设计
2018/06/19 Python
python 类之间的参数传递方式
2019/12/20 Python
Python接口测试get请求过程详解
2020/02/28 Python
StubHub希腊:购买体育赛事、音乐会和剧院门票
2019/08/03 全球购物
致800米运动员广播稿
2014/02/16 职场文书
“四风”查摆问题自我剖析材料
2014/09/27 职场文书
优秀教师事迹材料
2014/12/15 职场文书
一文解答什么是MySQL的回表
2022/08/05 MySQL