完美解决python针对hdfs上传和下载的问题


Posted in Python onJune 05, 2020

当我们使用python的hdfs包进行上传和下载文件的时候,总会出现如下问题

requests.packages.urllib3.exceptions.NewConnectionError:<requests.packages.urllib3.connection.HTTPConnection object at 0x7fe87cc37c50>: Failed to establish a new connection: [Errno -2] Name or service not known

其实这主要是由于没有将各个集群节点的ip映射到/etc/hosts文件中

修改/etc/hosts文件,将各个集群节点ip映射加上即可,如博主所示

vim /etc/hosts
192.168.20.174 hadoop04
192.168.20.173 hadoop03
192.168.20.172 hadoop02
192.168.20.171 hadoop01

补充知识:python上传文件到hadoop异常问题

使用库:pyhdfs

调用方法:

pyhdfs.HdfsClient(ip,port,user).copy_from_local()

pyhdfs.HdfsClient(ip,port,user).copy_to_local()

异常现象1如下图:

完美解决python针对hdfs上传和下载的问题

异常现象2如下图:

完美解决python针对hdfs上传和下载的问题

异常现象3如下图:

完美解决python针对hdfs上传和下载的问题

原因分析:可以看出,以上都是连接成功了,但是上传或者下载失败了,造成这种现象的原因是

我这里连接的是name节点,端口50070,当调用copy_from_local()时,name节点会主动去连接data节点进行数据读写操作,而data节点端口50075没有开启,造成data节点连接超时,抛出异常

解决办法:开启data节点端口

以上这篇完美解决python针对hdfs上传和下载的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
零基础写python爬虫之使用urllib2组件抓取网页内容
Nov 04 Python
python实现统计代码行数的方法
May 22 Python
详解Python字符串对象的实现
Dec 24 Python
Python实现小数转化为百分数的格式化输出方法示例
Sep 20 Python
python实现人脸识别代码
Nov 08 Python
django之跨表查询及添加记录的示例代码
Oct 16 Python
解决python3 pika之连接断开的问题
Dec 18 Python
wxPython之wx.DC绘制形状
Nov 19 Python
PyTorch中反卷积的用法详解
Dec 30 Python
Python任务调度利器之APScheduler详解
Apr 02 Python
详解Python中namedtuple的使用
Apr 27 Python
pyqt5蒙版遮罩mask,setmask的使用
Jun 11 Python
python读取hdfs并返回dataframe教程
Jun 05 #Python
python pymysql链接数据库查询结果转为Dataframe实例
Jun 05 #Python
python mysql中in参数化说明
Jun 05 #Python
JAVA SWT事件四种写法实例解析
Jun 05 #Python
pandas 像SQL一样使用WHERE IN查询条件说明
Jun 05 #Python
基于Python爬虫采集天气网实时信息
Jun 05 #Python
浅谈pymysql查询语句中带有in时传递参数的问题
Jun 05 #Python
You might like
Discuz批量替换帖子内容的方法(使用SQL更新数据库)
2014/06/23 PHP
php实现仿写CodeIgniter的购物车类
2015/07/29 PHP
php+mysql开发中的经验与常识小结
2019/03/25 PHP
js带按钮的提示框可供选择示例代码
2013/09/17 Javascript
textarea不能通过maxlength属性来限制字数的解决方法
2014/09/01 Javascript
鼠标悬浮停留三秒后自动显示大图js代码
2014/09/09 Javascript
JavaScript实现输入框与清空按钮联动效果
2016/09/09 Javascript
jQuery选择器之基本过滤选择器用法实例分析
2019/02/19 jQuery
基于 jQuery 实现键盘事件监听控件
2019/04/04 jQuery
bootstrap-table+treegrid实现树形表格
2019/07/26 Javascript
vue+element表格导出为Excel文件
2019/09/26 Javascript
原生javascript的ajax请求及后台PHP响应操作示例
2020/02/24 Javascript
[06:50]DSPL次级职业联赛十强晋级之路
2014/11/18 DOTA
python爬虫入门教程之糗百图片爬虫代码分享
2014/09/02 Python
Python类定义和类继承详解
2015/05/08 Python
centos6.4下python3.6.1安装教程
2017/07/21 Python
Python实现上下班抢个顺风单脚本
2018/02/07 Python
python3+PyQt5+Qt Designer实现扩展对话框
2018/04/20 Python
PyCharm配置mongo插件的方法
2018/11/30 Python
python处理document文档保留原样式
2019/09/23 Python
python3 使用openpyxl将mysql数据写入xlsx的操作
2020/05/15 Python
详解查看Python解释器路径的两种方式
2020/10/15 Python
Python word文本自动化操作实现方法解析
2020/11/05 Python
We Fashion荷兰:一家国际时装公司
2018/04/18 全球购物
如何启动时不需输入用户名与密码
2014/05/09 面试题
创建索引时需要注意的事项
2013/05/13 面试题
机械个人求职信范文
2014/01/24 职场文书
高中运动会入场词
2014/02/14 职场文书
班级心理活动总结
2014/07/04 职场文书
幼儿园小班个人总结
2015/02/12 职场文书
自主招生自荐信怎么写
2015/03/24 职场文书
办公经费申请报告
2015/05/15 职场文书
长江七号观后感
2015/06/11 职场文书
幼儿园六一主持词
2015/06/30 职场文书
教您怎么制定西餐厅运营方案 ?
2019/07/05 职场文书
win10下go mod配置方式
2021/04/25 Golang