编程 Python

如何在Win10系统使用Python3连接Hive

Posted in Python onOctober 15, 2020

由于数据存放在大数据平台的Hive数据仓库中，我需要在Win10系统上利用Python3连接Hive，然后读取数据，进行探索、分析和挖掘工作。

我通过网上查找资料和实际测试，把Win10系统Python3成功连接Hive配置总结如下。

第一步：安装依赖库

pip install bitarray
pip install bit_array
pip install thrift
pip install thriftpy
pip install pure_sasl
pip install --no-deps thrift-sasl==0.2.1

提示：若是无法安装，也可以点击如下网址，

https://www.lfd.uci.edu/~gohlke/pythonlibs/

选择合适库的whl下载，然后进行本地化安装。

第二步：安装impyla库

我采用本地化安装方式，先下载impyla库的whl，如下图：

如何在Win10系统使用Python3连接Hive

再安装

pip install E:/Python_Library/impyla-0.16.2-py2.py3-none-any.whl

提示：上面的绝对路径根据你自己的情况而定

第三步：测试impyla库是否可以使用

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

若是运行通过，表示利用impala连接Hive配置成功。

简单示例：

从Hive的一张表读取100条记录，放到pandas的DataFrame里面。

参考代码：

from impala.dbapi import connect #用来连接Hive的函数
from impala.util import as_pandas #用来把数据结构转换为pandas

conn = connect(host='my.host.com', port=21050)
cursor = conn.cursor()
cursor.execute('SELECT * FROM mytable LIMIT 100')
df = as_pandas(cursor)
cursor.close()

参考资料

https://github.com/cloudera/impyla

以上就是如何在Win10系统使用Python3连接Hive的详细内容，更多关于Python3连接Hive的资料请关注三水点靠木其它相关文章！

如何在Win10系统使用Python3连接Hive

- Author -

陆勤_数据人网

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

python实现问号表达式(?)的方法

Nov 27 Python

pyramid配置session的方法教程

Nov 27 Python

python计算对角线有理函数插值的方法

May 07 Python

python实现分页效果

Oct 25 Python

详解python异步编程之asyncio(百万并发)

Jul 07 Python

opencv python 基于KNN的手写体识别的实例

Aug 03 Python

django 实现编写控制登录和访问权限控制的中间件方法

Jan 15 Python

python基础梳理（一）（推荐）

Apr 06 Python

Django 用户认证组件使用详解

Jul 23 Python

Django文件存储自己定制存储系统解析

Aug 02 Python

python中wx模块的具体使用方法

May 15 Python

scrapy中如何设置应用cookies的方法(3种)

Sep 22 Python

Python进行特征提取的示例代码

Oct 15 #Python

Python通过递归函数输出嵌套列表元素

Oct 15 #Python

Python安装第三方库攻略(pip和Anaconda)

Oct 15 #Python

Python return语句如何实现结果返回调用

Oct 15 #Python

python 进程池pool使用详解

Oct 15 #Python

python 输入字符串生成所有有效的IP地址(LeetCode 93号题)

Oct 15 #Python

Python3使用 GitLab API 进行批量合并分支

Oct 15 #Python

You might like

利用php绘制饼状图的实现代码

2013/06/07 PHP

新闻内页-JS分页

2006/06/07 Javascript

JS调试必备的5个debug技巧

2014/03/07 Javascript

JavaScript实现动态删除列表框值的方法

2015/08/12 Javascript

在JavaScript中模拟类(class)及类的继承关系

2016/05/20 Javascript

jQuery实现图片轮播效果代码(基于jquery.pack.js插件)

2016/06/02 Javascript

iOS和Android用同一个二维码实现跳转下载链接的方法

2016/09/28 Javascript

jQuery Validation Engine验证控件调用外部函数验证的方法

2017/01/18 Javascript

浅谈vue同一页面中拥有两个表单时,的验证问题

2018/09/18 Javascript

浅谈目前可以使用ES10的5个新特性

2019/06/25 Javascript

ES6 Object方法扩展的应用实例分析

2019/06/25 Javascript

浅谈vue中组件绑定事件时是否加.native

2019/11/09 Javascript

用云开发Cloudbase实现小程序多图片内容安全监测的代码详解

2020/06/07 Javascript

深入理解python多进程编程

2016/06/12 Python

Python中属性和描述符的正确使用

2016/08/23 Python

浅谈机器学习需要的了解的十大算法

2017/12/15 Python

Python多线程扫描端口代码示例

2018/02/09 Python

python 通过字符串调用对象属性或方法的实例讲解

2018/04/21 Python

python使用matplotlib绘制热图

2018/11/07 Python

Ralph Lauren法国官网：美国高品味时装品牌

2017/12/08 全球购物

英语硕士生求职简历的自我评价

2013/10/15 职场文书

法律六进活动方案

2014/03/13 职场文书

公司年会搞笑主持词

2014/03/24 职场文书

怎样拟定创业计划书

2014/05/01 职场文书

开工典礼策划方案

2014/05/23 职场文书

2014年“四风”问题个人整改措施

2014/09/17 职场文书

教师节标语大全

2014/10/07 职场文书

先进教育工作者事迹材料

2014/12/23 职场文书

先进工作者申报材料

2014/12/23 职场文书

拾金不昧通报表扬范文

2015/05/05 职场文书

2015中学教学工作总结

2015/07/22 职场文书

门卫管理制度范本

2015/08/05 职场文书

电力培训学习心得体会

2016/01/11 职场文书

详解Mysql 函数调用优化

2021/04/07 MySQL

MySQL系列之一 MariaDB-server安装

2021/07/02 MySQL

Redis入门基础常用操作命令整理

2022/06/01 Redis