如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python操作MySQL数据库的方法分享
May 29 Python
Python Web开发模板引擎优缺点总结
May 06 Python
Python新手实现2048小游戏
Mar 31 Python
Python实现二分查找算法实例
May 26 Python
Python 异常处理的实例详解
Sep 11 Python
python基于http下载视频或音频
Jun 20 Python
详解windows python3.7安装numpy问题的解决方法
Aug 13 Python
python实现图片识别汽车功能
Nov 30 Python
在Django中实现添加user到group并查看
Nov 18 Python
python读取图像矩阵文件并转换为向量实例
Jun 18 Python
Python 多线程处理任务实例
Nov 07 Python
Python&Matlab实现灰狼优化算法的示例代码
Mar 21 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
收集的PHP中与数组相关的函数
2007/03/22 PHP
CodeIgniter框架数据库事务处理的设计缺陷和解决方案
2014/07/25 PHP
php中Y2K38的漏洞解决方法实例分析
2014/09/22 PHP
php生成高清缩略图实例详解
2015/12/07 PHP
PHP 搜索查询功能实现
2016/11/29 PHP
与jquery serializeArray()一起使用的函数,主要来方便提交表单
2011/01/31 Javascript
jQuery实现单行文字间歇向上滚动源代码
2013/06/02 Javascript
浅谈JS正则表达式的RegExp对象和括号的使用
2016/07/28 Javascript
js修改onclick动作的四种方法(推荐)
2016/08/18 Javascript
Bootstrap对话框使用实例讲解
2016/09/24 Javascript
react-redux中connect()方法详细解析
2017/05/27 Javascript
ExtJs的Ext.Ajax.request实现waitMsg等待提示效果
2017/06/14 Javascript
详解express与koa中间件模式对比
2017/08/07 Javascript
JavaScript中Hoisting详解 (变量提升与函数声明提升)
2017/08/18 Javascript
JS图片延迟加载插件LazyImgv1.0用法分析【附demo源码下载】
2017/09/04 Javascript
iview在vue-cli3如何按需加载的方法
2018/10/31 Javascript
[48:11]完美世界DOTA2联赛 Magma vs GXR 第二场 11.07
2020/11/10 DOTA
在Django中限制已登录用户的访问的方法
2015/07/23 Python
python按行读取文件,去掉每行的换行符\n的实例
2018/04/19 Python
django manage.py扩展自定义命令方法
2018/05/27 Python
Pycharm中import torch报错的快速解决方法
2020/03/05 Python
详解Python中的编码问题(encoding与decode、str与bytes)
2020/09/30 Python
python使用scapy模块实现ping扫描的过程详解
2021/01/21 Python
汉森批发:Hansen Wholesale
2018/05/24 全球购物
市场专员岗位职责
2014/02/14 职场文书
学习演讲稿范文
2014/05/10 职场文书
群众路线教育实践活动心得体会(四风)
2014/11/03 职场文书
环卫工人慰问信
2015/02/15 职场文书
2015年税务稽查工作总结
2015/05/26 职场文书
党课主持词大全
2015/06/30 职场文书
市级三好生竞选稿
2015/11/21 职场文书
使用nginx动态转换图片大小生成缩略图
2021/03/31 Servers
nginx配置文件使用环境变量的操作方法
2021/06/02 Servers
图文详解nginx日志切割的实现
2022/01/18 Servers
MySQL 开窗函数
2022/02/15 MySQL
电频谱管理的原则是什么
2022/02/18 无线电