如何在Win10系统使用Python3连接Hive


Posted in Python onOctober 15, 2020

由于数据存放在大数据平台的Hive数据仓库中,我需要在Win10系统上利用Python3连接Hive,然后读取数据,进行探索、分析和挖掘工作。

如何在Win10系统使用Python3连接Hive

我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。

第一步:安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示:若是无法安装,也可以点击如下网址,

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载,然后进行本地化安装。

第二步:安装impyla库

我采用本地化安装方式,先下载impyla库的whl,如下图:

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示:上面的绝对路径根据你自己的情况而定

第三步:测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过,表示利用impala连接Hive配置成功。

简单示例:

从Hive的一张表读取100条记录,放到pandas的DataFrame里面。

参考代码:

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容,更多关于Python3连接Hive的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
python实现问号表达式(?)的方法
Nov 27 Python
pyramid配置session的方法教程
Nov 27 Python
python计算对角线有理函数插值的方法
May 07 Python
python实现分页效果
Oct 25 Python
详解python异步编程之asyncio(百万并发)
Jul 07 Python
opencv python 基于KNN的手写体识别的实例
Aug 03 Python
django 实现编写控制登录和访问权限控制的中间件方法
Jan 15 Python
python基础梳理(一)(推荐)
Apr 06 Python
Django 用户认证组件使用详解
Jul 23 Python
Django文件存储 自己定制存储系统解析
Aug 02 Python
python中wx模块的具体使用方法
May 15 Python
scrapy中如何设置应用cookies的方法(3种)
Sep 22 Python
Python进行特征提取的示例代码
Oct 15 #Python
Python通过递归函数输出嵌套列表元素
Oct 15 #Python
Python安装第三方库攻略(pip和Anaconda)
Oct 15 #Python
Python return语句如何实现结果返回调用
Oct 15 #Python
python 进程池pool使用详解
Oct 15 #Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 #Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 #Python
You might like
利用php绘制饼状图的实现代码
2013/06/07 PHP
新闻内页-JS分页
2006/06/07 Javascript
JS调试必备的5个debug技巧
2014/03/07 Javascript
JavaScript实现动态删除列表框值的方法
2015/08/12 Javascript
在JavaScript中模拟类(class)及类的继承关系
2016/05/20 Javascript
jQuery实现图片轮播效果代码(基于jquery.pack.js插件)
2016/06/02 Javascript
iOS和Android用同一个二维码实现跳转下载链接的方法
2016/09/28 Javascript
jQuery Validation Engine验证控件调用外部函数验证的方法
2017/01/18 Javascript
浅谈vue同一页面中拥有两个表单时,的验证问题
2018/09/18 Javascript
浅谈目前可以使用ES10的5个新特性
2019/06/25 Javascript
ES6 Object方法扩展的应用实例分析
2019/06/25 Javascript
浅谈vue中组件绑定事件时是否加.native
2019/11/09 Javascript
用云开发Cloudbase实现小程序多图片内容安全监测的代码详解
2020/06/07 Javascript
深入理解python多进程编程
2016/06/12 Python
Python中属性和描述符的正确使用
2016/08/23 Python
浅谈机器学习需要的了解的十大算法
2017/12/15 Python
Python多线程扫描端口代码示例
2018/02/09 Python
python 通过字符串调用对象属性或方法的实例讲解
2018/04/21 Python
python使用matplotlib绘制热图
2018/11/07 Python
Ralph Lauren法国官网:美国高品味时装品牌
2017/12/08 全球购物
英语硕士生求职简历的自我评价
2013/10/15 职场文书
法律六进活动方案
2014/03/13 职场文书
公司年会搞笑主持词
2014/03/24 职场文书
怎样拟定创业计划书
2014/05/01 职场文书
开工典礼策划方案
2014/05/23 职场文书
2014年“四风”问题个人整改措施
2014/09/17 职场文书
教师节标语大全
2014/10/07 职场文书
先进教育工作者事迹材料
2014/12/23 职场文书
先进工作者申报材料
2014/12/23 职场文书
拾金不昧通报表扬范文
2015/05/05 职场文书
2015中学教学工作总结
2015/07/22 职场文书
门卫管理制度范本
2015/08/05 职场文书
电力培训学习心得体会
2016/01/11 职场文书
详解Mysql 函数调用优化
2021/04/07 MySQL
MySQL系列之一 MariaDB-server安装
2021/07/02 MySQL
Redis入门基础常用操作命令整理
2022/06/01 Redis