如何在Win10系统使用Python3连接Hive


Posted in Python onOctober 15, 2020

由于数据存放在大数据平台的Hive数据仓库中,我需要在Win10系统上利用Python3连接Hive,然后读取数据,进行探索、分析和挖掘工作。

如何在Win10系统使用Python3连接Hive

我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。

第一步:安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示:若是无法安装,也可以点击如下网址,

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载,然后进行本地化安装。

第二步:安装impyla库

我采用本地化安装方式,先下载impyla库的whl,如下图:

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示:上面的绝对路径根据你自己的情况而定

第三步:测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过,表示利用impala连接Hive配置成功。

简单示例:

从Hive的一张表读取100条记录,放到pandas的DataFrame里面。

参考代码:

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容,更多关于Python3连接Hive的资料请关注三水点靠木其它相关文章!

Python 相关文章推荐
使用Python的Bottle框架写一个简单的服务接口的示例
Aug 25 Python
django 多数据库配置教程
May 30 Python
浅析Python四种数据类型
Sep 26 Python
安装docker-compose的两种最简方法
Jul 30 Python
numpy np.newaxis 的实用分享
Nov 30 Python
python 实现让字典的value 成为列表
Dec 16 Python
Python时间差中seconds和total_seconds的区别详解
Dec 26 Python
Python 基于FIR实现Hilbert滤波器求信号包络详解
Feb 26 Python
Pycharm-community-2020.2.3 社区版安装教程图文详解
Dec 08 Python
python程序实现BTC(比特币)挖矿的完整代码
Jan 20 Python
python中操作文件的模块的方法总结
Feb 04 Python
Python通过m3u8文件下载合并ts视频的操作
Apr 16 Python
Python进行特征提取的示例代码
Oct 15 #Python
Python通过递归函数输出嵌套列表元素
Oct 15 #Python
Python安装第三方库攻略(pip和Anaconda)
Oct 15 #Python
Python return语句如何实现结果返回调用
Oct 15 #Python
python 进程池pool使用详解
Oct 15 #Python
python 输入字符串生成所有有效的IP地址(LeetCode 93号题)
Oct 15 #Python
Python3使用 GitLab API 进行批量合并分支
Oct 15 #Python
You might like
PHP无限分类代码,支持数组格式化、直接输出菜单两种方式
2011/05/18 PHP
非常好用的两个PHP函数 serialize()和unserialize()
2012/02/04 PHP
php错误级别的设置方法
2013/06/17 PHP
php解析url并得到url中的参数及获取url参数的四种方式
2015/10/26 PHP
PHP中Cookie的使用详解(简单易懂)
2017/04/28 PHP
php获取用户真实IP和防刷机制的实例代码
2018/11/28 PHP
laravel利用中间件防止未登录用户直接访问后台的方法
2019/09/30 PHP
JavaScript 获得选中文本内容的方法
2009/02/15 Javascript
深入理解JavaScript系列(12) 变量对象(Variable Object)
2012/01/16 Javascript
PHP abstract与interface之间的区别
2013/11/11 Javascript
JavaScript encodeURI 和encodeURIComponent
2015/12/04 Javascript
jQuery阻止移动端遮罩层后页面滚动
2017/03/15 Javascript
vue中使用vue-print.js实现多页打印
2020/03/05 Javascript
JavaScript中while循环的基础使用教程
2020/08/11 Javascript
JavaScript实现随机点名小程序
2020/10/29 Javascript
JavaScript语法约定和程序调试原理解析
2020/11/03 Javascript
vue实现可移动的悬浮按钮
2021/03/04 Vue.js
Python中logging模块的用法实例
2014/09/29 Python
浅谈Python中copy()方法的使用
2015/05/21 Python
对pandas的dataframe绘图并保存的实现方法
2017/08/05 Python
Python 仅获取响应头, 不获取实体的实例
2019/08/21 Python
Django 自定义分页器的实现代码
2019/11/24 Python
pytorch中的自定义反向传播,求导实例
2020/01/06 Python
Jupyter打开图形界面并画出正弦函数图像实例
2020/04/24 Python
pycharm永久激活超详细教程
2020/10/29 Python
python爬虫中采集中遇到的问题整理
2020/11/27 Python
css3实现图片遮罩效果鼠标hover以后出现文字
2013/11/05 HTML / CSS
英国最大的体育&时尚零售公司:JD Sports
2017/12/13 全球购物
Camper鞋西班牙官方网上商店:西班牙马略卡岛的鞋类品牌
2019/03/14 全球购物
精选奢华:THE LIST
2019/09/05 全球购物
美国在线医疗分销商:MedEx Supply
2020/02/04 全球购物
介绍一下SOA和SOA的基本特征
2016/02/24 面试题
大学生活动总结怎么写
2014/04/29 职场文书
关于空气污染危害的感想
2015/08/11 职场文书
JavaScript 去重和重复次数统计
2021/03/31 Javascript
zabbix agent2 监控oracle数据库的方法
2021/05/13 Oracle