完美解决python针对hdfs上传和下载的问题


Posted in Python onJune 05, 2020

当我们使用python的hdfs包进行上传和下载文件的时候,总会出现如下问题

requests.packages.urllib3.exceptions.NewConnectionError:<requests.packages.urllib3.connection.HTTPConnection object at 0x7fe87cc37c50>: Failed to establish a new connection: [Errno -2] Name or service not known

其实这主要是由于没有将各个集群节点的ip映射到/etc/hosts文件中

修改/etc/hosts文件,将各个集群节点ip映射加上即可,如博主所示

vim /etc/hosts
192.168.20.174 hadoop04
192.168.20.173 hadoop03
192.168.20.172 hadoop02
192.168.20.171 hadoop01

补充知识:python上传文件到hadoop异常问题

使用库:pyhdfs

调用方法:

pyhdfs.HdfsClient(ip,port,user).copy_from_local()

pyhdfs.HdfsClient(ip,port,user).copy_to_local()

异常现象1如下图:

完美解决python针对hdfs上传和下载的问题

异常现象2如下图:

完美解决python针对hdfs上传和下载的问题

异常现象3如下图:

完美解决python针对hdfs上传和下载的问题

原因分析:可以看出,以上都是连接成功了,但是上传或者下载失败了,造成这种现象的原因是

我这里连接的是name节点,端口50070,当调用copy_from_local()时,name节点会主动去连接data节点进行数据读写操作,而data节点端口50075没有开启,造成data节点连接超时,抛出异常

解决办法:开启data节点端口

以上这篇完美解决python针对hdfs上传和下载的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
PHP webshell检查工具 python实现代码
Sep 15 Python
举例讲解Python的Tornado框架实现数据可视化的教程
May 02 Python
python实现unicode转中文及转换默认编码的方法
Apr 29 Python
python脚本替换指定行实现步骤
Jul 11 Python
python中requests使用代理proxies方法介绍
Oct 25 Python
python使用正则表达式替换匹配成功的组并输出替换的次数
Nov 22 Python
详解Python sys.argv使用方法
May 10 Python
Pytorch 抽取vgg各层并进行定制化处理的方法
Aug 20 Python
在tensorflow中设置使用某一块GPU、多GPU、CPU的操作
Feb 07 Python
python内打印变量之%和f的实例
Feb 19 Python
python实现程序重启和系统重启方式
Apr 16 Python
python如何快速生成时间戳
Jul 21 Python
python读取hdfs并返回dataframe教程
Jun 05 #Python
python pymysql链接数据库查询结果转为Dataframe实例
Jun 05 #Python
python mysql中in参数化说明
Jun 05 #Python
JAVA SWT事件四种写法实例解析
Jun 05 #Python
pandas 像SQL一样使用WHERE IN查询条件说明
Jun 05 #Python
基于Python爬虫采集天气网实时信息
Jun 05 #Python
浅谈pymysql查询语句中带有in时传递参数的问题
Jun 05 #Python
You might like
利用php-cli和任务计划实现刷新token功能的方法
2017/05/03 PHP
PHP常见字符串操作函数与用法总结
2019/03/04 PHP
激活 ActiveX 控件
2006/10/09 Javascript
求得div 下 img的src地址的js代码
2007/02/28 Javascript
用javascript删除当前行,添加行(示例代码)
2013/11/25 Javascript
JQuery动画与特效实例分析
2015/02/02 Javascript
分享jQuery插件的学习笔记
2016/01/14 Javascript
jQuery改变form表单的action,并进行提交的实现代码
2016/05/25 Javascript
jQuery简单验证上传文件大小及类型的方法
2016/06/02 Javascript
正则表达式替换html元素属性的方法
2016/11/26 Javascript
Node.js利用debug模块打印出调试日志的方法
2017/04/25 Javascript
基于zepto.js实现手机相册功能
2017/07/11 Javascript
Vue.js项目模板搭建图文教程
2017/09/20 Javascript
vue input实现点击按钮文字增删功能示例
2019/01/29 Javascript
vue实现在线预览pdf文件和下载(pdf.js)
2019/11/26 Javascript
javascript设计模式 ? 中介者模式原理与用法实例分析
2020/04/20 Javascript
全面解析js中的原型,原型对象,原型链
2021/01/25 Javascript
[58:15]2018DOTA2亚洲邀请赛 4.1 小组赛 A组 NB vs Liquid
2018/04/02 DOTA
Python的包管理器pip更换软件源的方法详解
2016/06/20 Python
python学习之hook钩子的原理和使用
2018/10/25 Python
pandas pivot_table() 按日期分多列数据的方法
2018/11/16 Python
python多线程与多进程及其区别详解
2019/08/08 Python
python读取配置文件方式(ini、yaml、xml)
2020/04/09 Python
Python TestSuite生成测试报告过程解析
2020/07/23 Python
爬虫代理的cookie如何生成运行
2020/09/22 Python
为你的html5网页添加音效示例
2014/04/03 HTML / CSS
小班开学寄语
2014/04/04 职场文书
演讲比赛主持词
2015/06/29 职场文书
宿舍管理制度范本
2015/08/07 职场文书
2016年“我们的节日·端午节”活动总结
2016/04/01 职场文书
Redis6.0搭建集群Redis-cluster的方法
2021/05/08 Redis
教你怎么用Python生成九宫格照片
2021/05/20 Python
基于flask实现五子棋小游戏
2021/05/25 Python
Pandas搭配lambda组合使用详解
2022/01/22 Python
深入讲解数据库中Decimal类型的使用以及实现方法
2022/02/15 MySQL
MySQL存储过程及语法详解
2022/08/05 MySQL