如何将PySpark导入Python的放实现(2种)


Posted in Python onApril 26, 2020

方法一

使用findspark

使用pip安装findspark:

pip install findspark

在py文件中引入findspark:

>>> import findspark
>>> findspark.init()

导入你要使用的pyspark库

>>> from pyspark import *

优点:简单快捷
缺点:治标不治本,每次写一个新的Application都要加载一遍findspark

方法二

把预编译包中的Python库文件添加到Python的环境变量中

export SPARK_HOME=你的PySpark目录
export PYTHONPATH=$SPARK_HOME/libexec/python:$SPARK_HOME/libexec/python/build:$PYTHONPATH

优点:一劳永逸
缺点:对于小白可能不太了解环境变量是什么

问题1、ImportError: No module named pyspark

现象:

  • 已经安装配置好了PySpark,可以打开PySpark交互式界面;
  • 在Python里找不到pysaprk。

参照上面解决

问题2、ImportError: No module named ‘py4j'

现象:

已经安装配置好了PySpark,可以打开PySpark交互式界面;
按照上面的b方式配置后出现该问题。
解决方法:

把py4j添加到Python的环境变量中

export PYTHONPATH= $SPARK_HOME/python/lib/py4j-x.xx-src.zip:$PYTHONPATH

注意:这里的py4j-x.xx-src.zip根据自己电脑上的py4j版本决定。

测试成功的环境

  • Python: 3.7、2.7
  • PySpark: 1.6.2 - 预编译包
  • OS: Mac OSX 10.11.1

参考
Stackoverflow: importing pyspark in python shell
Stackoverflow: Why can't PySpark find py4j.java_gateway?

到此这篇关于如何将PySpark导入Python的放实现(2种)的文章就介绍到这了,更多相关PySpark导入Python内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现拼接多张图片的方法
Dec 01 Python
Python格式化压缩后的JS文件的方法
Mar 05 Python
使用Python的PIL模块来进行图片对比
Feb 18 Python
python 写的一个爬虫程序源码
Feb 28 Python
CentOS6.5设置Django开发环境
Oct 13 Python
python操作 hbase 数据的方法
Dec 18 Python
Python实现的微信公众号群发图片与文本消息功能实例详解
Jun 30 Python
Python从零开始创建区块链
Mar 06 Python
django admin后管定制-显示字段的实例
Mar 11 Python
Numpy 多维数据数组的实现
Jun 18 Python
如何在keras中添加自己的优化器(如adam等)
Jun 19 Python
python 多进程和协程配合使用写入数据
Oct 30 Python
基于python实现对文件进行切分行
Apr 26 #Python
python matplotlib模块基本图形绘制方法小结【直线,曲线,直方图,饼图等】
Apr 26 #Python
简单了解Java Netty Reactor三种线程模型
Apr 26 #Python
Python Selenium截图功能实现代码
Apr 26 #Python
使用Pycharm(Python工具)新建项目及创建Python文件的教程
Apr 26 #Python
Python实现密钥密码(加解密)实例详解
Apr 26 #Python
Python基于QQ邮箱实现SSL发送
Apr 26 #Python
You might like
在PWS上安装PHP4.0正式版
2006/10/09 PHP
提高PHP编程效率的53个要点(经验小结)
2010/09/04 PHP
PHP分页详细讲解(有实例)
2013/10/30 PHP
PHP把MSSQL数据导入到MYSQL的方法
2014/12/27 PHP
JavaScript 通过模式匹配实现重载
2010/08/12 Javascript
兼容所有浏览器的js复制插件Zero使用介绍
2014/03/19 Javascript
JS和JQ的event对象区别分析
2014/11/24 Javascript
jQuery+css实现的时钟效果(兼容各浏览器)
2016/01/27 Javascript
Web程序员必备的7个JavaScript函数
2016/06/14 Javascript
ui组件之input多选下拉实现方法(带有搜索功能)
2016/07/14 Javascript
js轮盘抽奖实例分析
2020/04/17 Javascript
js通过指定下标或指定元素进行删除数组的实例
2017/01/12 Javascript
jQuery 循环遍历改变a标签的href(实例讲解)
2017/07/12 jQuery
React-Native之定时器Timer的实现代码
2017/10/04 Javascript
Python查看多台服务器进程的脚本分享
2014/06/11 Python
使用IPython下的Net-SNMP来管理类UNIX系统的教程
2015/04/15 Python
使用Python通过win32 COM打开Excel并添加Sheet的方法
2018/05/02 Python
在cmd中运行.py文件: python的操作步骤
2018/05/12 Python
Python Requests库基本用法示例
2018/08/20 Python
用Python调用win命令行提高工作效率的实例
2019/08/14 Python
tesserocr与pytesseract模块的使用方法解析
2019/08/30 Python
python GUI库图形界面开发之PyQt5打开保存对话框QFileDialog详细使用方法与实例
2020/02/27 Python
python代码xml转txt实例
2020/03/10 Python
python爬虫使用正则爬取网站的实现
2020/08/03 Python
详解如何用HTML5 Canvas API控制图片的缩放变换
2016/03/22 HTML / CSS
韩国家庭购物网上商店:Nsmall
2017/05/07 全球购物
西班牙太阳镜品牌:Hawkers
2018/03/11 全球购物
英国床和浴室商场:Bed & Bath Emporium
2018/05/20 全球购物
抽象方法、抽象类怎样声明
2014/10/25 面试题
工作失职检讨书范文
2014/01/16 职场文书
辅导员评语
2014/05/04 职场文书
放飞梦想演讲稿800字
2014/08/26 职场文书
个人授权委托书范本格式
2014/10/12 职场文书
护理自荐信
2019/05/14 职场文书
JavaScript 语句之常用 for 循环详解
2021/03/29 Javascript
深入讲解数据库中Decimal类型的使用以及实现方法
2022/02/15 MySQL