如何在Win10系统使用Python3连接Hive


Posted in Python onOctober 15, 2020

由于数据存放在大数据平台的Hive数据仓库中,我需要在Win10系统上利用Python3连接Hive,然后读取数据,进行探索、分析和挖掘工作。

如何在Win10系统使用Python3连接Hive

我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。

第一步:安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示:若是无法安装,也可以点击如下网址,

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载,然后进行本地化安装。

第二步:安装impyla库

我采用本地化安装方式,先下载impyla库的whl,如下图:

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示:上面的绝对路径根据你自己的情况而定

第三步:测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过,表示利用impala连接Hive配置成功。

简单示例:

从Hive的一张表读取100条记录,放到pandas的DataFrame里面。

参考代码:

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容,更多关于Python3连接Hive的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
Python的函数嵌套的使用方法
Jan 24 Python
Python编程语言的35个与众不同之处(语言特征和使用技巧)
Jul 07 Python
django自带的server 让外网主机访问方法
May 14 Python
详解django2中关于时间处理策略
Mar 06 Python
从0开始的Python学习016异常
Apr 08 Python
python实现ip代理池功能示例
Jul 05 Python
Python实现Selenium自动化Page模式
Jul 14 Python
python爬虫 urllib模块url编码处理详解
Aug 20 Python
python中利用numpy.array()实现俩个数值列表的对应相加方法
Aug 26 Python
Python爬取YY评级分数并保存数据实现过程解析
Jun 01 Python
如何用python处理excel表格
Jun 09 Python
利用Python实现最小二乘法与梯度下降算法
Feb 21 Python
Python进行特征提取的示例代码
Oct 15 #Python
Python通过递归函数输出嵌套列表元素
Oct 15 #Python
Python安装第三方库攻略(pip和Anaconda)
Oct 15 #Python
Python return语句如何实现结果返回调用
Oct 15 #Python
python 进程池pool使用详解
Oct 15 #Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 #Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 #Python
You might like
图形数字验证代码
2006/10/09 PHP
dede3.1分页文字采集过滤规则详说(图文教程)
2007/04/03 PHP
PHP获取数组中单列值的方法
2017/06/10 PHP
JavaScript 异步调用框架 (Part 5 - 链式实现)
2009/08/04 Javascript
JavaScript高级程序设计 学习笔记 js高级技巧
2011/09/20 Javascript
js跳转页面方法实现汇总
2014/02/11 Javascript
元素未显示设置width/height时IE中使用currentStyle获取为auto
2014/05/04 Javascript
ext combobox动态加载数据库数据(附前后台)
2014/06/17 Javascript
node.js中的fs.mkdir方法使用说明
2014/12/17 Javascript
jquery实现的Banner广告收缩效果代码
2015/09/02 Javascript
javascript中call apply 与 bind方法详解
2016/03/10 Javascript
jquery实现的回旋滚动效果完整实例【附demo源码下载】
2016/09/20 Javascript
原生Javascript和jQuery做轮播图简单例子
2016/10/11 Javascript
详解angularJs中自定义directive的数据交互
2017/01/13 Javascript
详解vue.js+UEditor集成 [前后端分离项目]
2017/07/07 Javascript
Vue动态组件实例解析
2017/08/20 Javascript
[45:15]Optic vs VP 2018国际邀请赛淘汰赛BO3 第一场 8.24
2018/08/25 DOTA
python爬取网站数据保存使用的方法
2013/11/20 Python
python实现批量按比例缩放图片效果
2018/03/30 Python
对python字典元素的添加与修改方法详解
2018/07/06 Python
python画折线图的程序
2018/07/26 Python
pyqt远程批量执行Linux命令程序的方法
2019/02/14 Python
Python检测数据类型的方法总结
2019/05/20 Python
Python爬取YY评级分数并保存数据实现过程解析
2020/06/01 Python
python反扒机制的5种解决方法
2021/02/06 Python
html5+css3之制作header实例与更新
2020/12/21 HTML / CSS
CSS3实现苹果手机解锁的字体闪亮效果示例
2021/01/05 HTML / CSS
浅谈html5增强的页面元素
2016/06/14 HTML / CSS
canvas学习总结三之绘制路径-线段
2019/01/31 HTML / CSS
汇集了世界上最好的天然和有机美容产品:LoveLula
2018/02/05 全球购物
Tessabit日本:集世界奢侈品和设计师品牌的意大利精品买手店
2020/01/07 全球购物
Ibatis中如何提高SQL Map的性能
2013/05/11 面试题
2013年保送生自荐信格式
2013/11/20 职场文书
婚前协议书怎么写
2014/04/15 职场文书
小学校园文化建设汇报材料
2014/08/19 职场文书
浅谈MySql整型索引和字符串索引失效或隐式转换问题
2021/11/20 MySQL