如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用Redis实现作业调度系统(超简单)
Mar 22 Python
Python类属性的延迟计算
Oct 22 Python
Django应用程序中如何发送电子邮件详解
Feb 04 Python
Python环境搭建之OpenCV的步骤方法
Oct 20 Python
python编程之requests在网络请求中添加cookies参数方法详解
Oct 25 Python
为什么入门大数据选择Python而不是Java?
Mar 07 Python
python素数筛选法浅析
Mar 19 Python
Python实现合并同一个文件夹下所有PDF文件的方法示例
Apr 28 Python
Python实现绘制双柱状图并显示数值功能示例
Jun 23 Python
解决Pyinstaller 打包exe文件 取消dos窗口(黑框框)的问题
Jun 21 Python
python读取ini配置文件过程示范
Dec 23 Python
pycharm 中mark directory as exclude的用法详解
Feb 14 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
PHP实现原生态图片上传封装类方法
2016/11/08 PHP
Yii框架使用魔术方法实现跨文件调用功能示例
2017/05/20 PHP
PHP实现基于面向对象的mysqli扩展库增删改查操作工具类
2017/07/18 PHP
laravel如何开启跨域功能示例详解
2017/08/31 PHP
baidu博客的编辑友情链接的新的层窗口!经典~支持【FF】
2007/02/09 Javascript
javascript 面向对象全新理练之数据的封装
2009/12/03 Javascript
JS两种定义方式的区别、内部原理
2013/11/21 Javascript
jquery改变tr背景色的示例代码
2013/12/28 Javascript
jquery中get和post的简单实例
2014/02/04 Javascript
控制input输入框中提示信息的显示和隐藏的方法
2014/02/12 Javascript
JavaScript常见的五种数组去重的方式
2016/12/15 Javascript
VueJs路由跳转——vue-router的使用详解
2017/01/10 Javascript
创建一般js对象的几种方式
2017/01/19 Javascript
js中创建对象的几种方式
2017/02/05 Javascript
详解vue-cli快速构建vue应用并实现webpack打包
2017/12/13 Javascript
axios进阶实践之利用最优雅的方式写ajax请求
2017/12/20 Javascript
详解微信小程序input标签正则初体验
2018/08/18 Javascript
详解angular2.x创建项目入门指令
2018/10/11 Javascript
JS获取表格视图所选行号的ids过程解析
2020/02/21 Javascript
[01:07:47]Secret vs Optic Supermajor 胜者组 BO3 第一场 6.4
2018/06/05 DOTA
[01:01:36]Optic vs paiN 2018国际邀请赛小组赛BO2 第一场 8.19
2018/08/21 DOTA
python获取文件后缀名及批量更新目录下文件后缀名的方法
2014/11/11 Python
Python获取CPU、内存使用率以及网络使用状态代码
2018/02/08 Python
Python实现平行坐标图的两种方法小结
2019/07/04 Python
python多线程共享变量的使用和效率方法
2019/07/16 Python
基于Python中isfile函数和isdir函数使用详解
2019/11/29 Python
使用Tensorflow将自己的数据分割成batch训练实例
2020/01/20 Python
加拿大床上用品、家居装饰、厨房和浴室产品购物网站:Linen Chest
2018/06/05 全球购物
办公室秘书自我鉴定
2014/01/18 职场文书
新党章心得体会
2014/09/04 职场文书
对外汉语教师推荐信
2015/03/27 职场文书
刘胡兰观后感
2015/06/16 职场文书
运动会致辞稿
2015/07/29 职场文书
总经理2015中秋节致辞
2015/07/29 职场文书
在CSS中使用when/else的方法
2022/01/18 HTML / CSS
MySQL中正则表达式(REGEXP)使用详解
2022/07/07 MySQL