完美解决python针对hdfs上传和下载的问题


Posted in Python onJune 05, 2020

当我们使用python的hdfs包进行上传和下载文件的时候,总会出现如下问题

requests.packages.urllib3.exceptions.NewConnectionError:<requests.packages.urllib3.connection.HTTPConnection object at 0x7fe87cc37c50>: Failed to establish a new connection: [Errno -2] Name or service not known

其实这主要是由于没有将各个集群节点的ip映射到/etc/hosts文件中

修改/etc/hosts文件,将各个集群节点ip映射加上即可,如博主所示

vim /etc/hosts
192.168.20.174 hadoop04
192.168.20.173 hadoop03
192.168.20.172 hadoop02
192.168.20.171 hadoop01

补充知识:python上传文件到hadoop异常问题

使用库:pyhdfs

调用方法:

pyhdfs.HdfsClient(ip,port,user).copy_from_local()

pyhdfs.HdfsClient(ip,port,user).copy_to_local()

异常现象1如下图:

完美解决python针对hdfs上传和下载的问题

异常现象2如下图:

完美解决python针对hdfs上传和下载的问题

异常现象3如下图:

完美解决python针对hdfs上传和下载的问题

原因分析:可以看出,以上都是连接成功了,但是上传或者下载失败了,造成这种现象的原因是

我这里连接的是name节点,端口50070,当调用copy_from_local()时,name节点会主动去连接data节点进行数据读写操作,而data节点端口50075没有开启,造成data节点连接超时,抛出异常

解决办法:开启data节点端口

以上这篇完美解决python针对hdfs上传和下载的问题就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Linux RedHat下安装Python2.7开发环境
May 20 Python
linux环境下python中MySQLdb模块的安装方法
Jun 16 Python
Django Admin实现三级联动的示例代码(省市区)
Jun 22 Python
Python中GIL的使用详解
Oct 03 Python
python实现简单登陆系统
Oct 18 Python
Python内存管理实例分析
Jul 10 Python
Django中的FBV和CBV用法详解
Sep 15 Python
通过实例了解Python str()和repr()的区别
Jan 17 Python
解决Django Haystack全文检索为空的问题
May 19 Python
Python中的Cookie模块如何使用
Jun 04 Python
pyecharts在数据可视化中的应用详解
Jun 08 Python
Selenium Webdriver元素定位的八种常用方式(小结)
Jan 13 Python
python读取hdfs并返回dataframe教程
Jun 05 #Python
python pymysql链接数据库查询结果转为Dataframe实例
Jun 05 #Python
python mysql中in参数化说明
Jun 05 #Python
JAVA SWT事件四种写法实例解析
Jun 05 #Python
pandas 像SQL一样使用WHERE IN查询条件说明
Jun 05 #Python
基于Python爬虫采集天气网实时信息
Jun 05 #Python
浅谈pymysql查询语句中带有in时传递参数的问题
Jun 05 #Python
You might like
php数组函数序列之array_unique() - 去除数组中重复的元素值
2011/10/29 PHP
PHP的autoload机制的实现解析
2012/09/15 PHP
php旋转图片90度的方法
2013/11/07 PHP
php数组删除元素示例
2014/03/21 PHP
php采用file_get_contents代替使用curl实例
2014/11/07 PHP
php中magic_quotes_gpc对unserialize的影响分析
2014/12/16 PHP
ThinkPHP数据操作方法总结
2015/09/28 PHP
php json_encode与json_decode详解及实例
2016/12/13 PHP
Laravel 数据库加密及数据库表前缀配置方法
2019/10/10 PHP
javascript 表格内容排序 简单操作示例代码
2014/01/03 Javascript
Extjs的FileUploadField文件上传出现了两个上传按钮
2014/04/29 Javascript
JS根据生日算年龄的方法
2015/05/05 Javascript
JS获取鼠标坐标位置实例分析
2016/01/20 Javascript
JS实现响应鼠标点击动画渐变弹出层效果代码
2016/03/25 Javascript
JS实现上传图片实时预览功能
2017/05/22 Javascript
浅谈在node.js进入文件目录的问题
2018/05/13 Javascript
微信小程序实现省市区三级地址选择
2020/06/21 Javascript
Vue侦测相关api的实现方法
2019/05/22 Javascript
基于layui实现高级搜索(筛选)功能
2019/07/26 Javascript
手把手15分钟搭一个企业级脚手架
2019/09/16 Javascript
vue实现拖拽效果
2019/12/23 Javascript
vue实现页面切换滑动效果
2020/06/29 Javascript
Python过滤函数filter()使用自定义函数过滤序列实例
2014/08/26 Python
Python利用multiprocessing实现最简单的分布式作业调度系统实例
2017/11/14 Python
在VS Code上搭建Python开发环境的方法
2018/04/06 Python
Python 读取有公式cell的结果内容实例方法
2020/02/17 Python
python实现提取COCO,VOC数据集中特定的类
2020/03/10 Python
CSS3径向渐变之大鱼吃小鱼之孤单的大鱼
2016/04/26 HTML / CSS
迪卡侬英国官网:Decathlon英国
2017/04/08 全球购物
美国大码时尚女装购物网站:ELOQUII
2017/12/28 全球购物
JSF面试题:Jsf中导航的标签是什么
2013/04/20 面试题
数据库测试通常都包括哪些方面
2015/11/30 面试题
纠风工作实施方案
2014/03/15 职场文书
读书月活动方案
2014/05/22 职场文书
交警失职检讨书
2015/01/26 职场文书
什么是css原子化,有什么用?
2022/04/24 HTML / CSS