python处理数据,存进hive表的方法


Posted in Python onJuly 04, 2018

首先,公司的小组长给了我一个任务,把一个txt的文件中的部分内容,存进一个在hive中已有的表的相同结构的表中。所以我的流程主要有三个,首先,把数据处理成和hive中表相同结构的数据,然后仿照已有的hive中表的结构再创建一张新的数据表,最后把本地的txt文件上传到hive中新建的数据表中。

1:已有的数据表的结构和在hive表中的结构完全对不上,下面的图是原来hive中表的结构和小组长给我的txt中表的结构:

python处理数据,存进hive表的方法

python处理数据,存进hive表的方法

大家可以看出,我们原来的hive中表的字段一共有17个,而组长给我的表中的字段一共有9个,其中最后一个为json结构,而且顺序还不对,所以我们要进行筛选,把对应上的字段放到相应位置,对应不上的字段写成空。

python处理数据,存进hive表的方法

大家要注意几个地方,原来的数据是按照tab来划分的,所以我们要数好对应的tab的数目,好来计算出来数据的实际的位置信息,然后我们按照原来hive表中的数据顺序,重新排列我们新建表的数据的顺序,下面给大家看看结果:

python处理数据,存进hive表的方法

其中line[0]=null,line[1]=102,大家以此类推。

3:我们把本地的txt文件导入到hive表中。首先我们要新建一个和原来hive表中相同结构的数据表,然后把我们的数据导入到表中,

hive> creat table new_sft(x1 string,x2 string ,...,xn string) partitioned by (d string);

建好表之后,把数据导入到新表之中:

hive> load data local inpath‘/home/opendev/1.txt' into table new_sft;

最后给大家看看我的最终的结果:

python处理数据,存进hive表的方法

以上这篇python处理数据,存进hive表的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python导出DBF文件到Excel的方法
Jul 25 Python
Python数据类型详解(四)字典:dict
May 12 Python
python编写简易聊天室实现局域网内聊天功能
Jul 28 Python
Python的argparse库使用详解
Oct 09 Python
Python批处理更改文件名os.rename的方法
Oct 26 Python
python3 实现对图片进行局部切割的方法
Dec 05 Python
Python采集猫眼两万条数据 对《无名之辈》影评进行分析
Dec 05 Python
python与C、C++混编的四种方式(小结)
Jul 15 Python
Python测试线程应用程序过程解析
Dec 31 Python
python GUI库图形界面开发之PyQt5美化窗体与控件(异形窗体)实例
Feb 25 Python
Python类和实例的属性机制原理详解
Mar 21 Python
利用Python的folium包绘制城市道路图的实现示例
Aug 24 Python
利用Pandas读取文件路径或文件名称包含中文的csv文件方法
Jul 04 #Python
使用pandas read_table读取csv文件的方法
Jul 04 #Python
使用Numpy读取CSV文件,并进行行列删除的操作方法
Jul 04 #Python
Python读取mat文件,并转为csv文件的实例
Jul 04 #Python
python实现对csv文件的列的内容读取
Jul 04 #Python
Python实现朴素贝叶斯分类器的方法详解
Jul 04 #Python
如何优雅地改进Django中的模板碎片缓存详解
Jul 04 #Python
You might like
php while循环得到循环次数
2013/10/26 PHP
php简单实现短网址(短链)还原的方法(测试可用)
2016/05/09 PHP
CodeIgniter生成静态页的方法
2016/05/17 PHP
PHP单态模式简单用法示例
2016/11/16 PHP
JavaScript下申明对象的几种方法小结
2008/10/02 Javascript
JS window.opener返回父页面的应用
2009/10/24 Javascript
jQuery 学习第七课 扩展jQuery的功能 插件开发
2010/05/17 Javascript
jQuery中使用了document和window哪些属性和方法小结
2011/09/13 Javascript
javascript学习笔记(七) js函数介绍
2012/06/19 Javascript
使用jQuery的attr方法来修改onclick值
2014/07/07 Javascript
JavaScript中的包装对象介绍
2015/01/27 Javascript
jquery实现textarea 高度自适应
2015/03/11 Javascript
JavaScript模拟可展开、拖动与关闭的聊天窗口实例
2015/05/12 Javascript
jQuery实现ToolTip元素定位显示功能示例
2016/11/23 Javascript
AngularJS过滤器filter用法分析
2016/12/11 Javascript
详解nodejs 文本操作模块-fs模块(四)
2016/12/22 NodeJs
Vue + better-scroll 实现移动端字母索引导航功能
2018/05/07 Javascript
jQuery实现图片简单轮播功能示例
2018/08/13 jQuery
JQuery模拟实现网页中自定义鼠标右键菜单功能
2018/11/14 jQuery
vue生命周期与钩子函数简单示例
2019/03/13 Javascript
vue实现微信分享链接添加动态参数的方法
2019/04/29 Javascript
js针对图片加载失败的处理方法分析
2019/08/24 Javascript
解决vue组件没显示,没起作用,没报错,但该显示的组件没显示问题
2020/09/02 Javascript
Python实现的插入排序算法原理与用法实例分析
2017/11/22 Python
Tensorflow实现AlexNet卷积神经网络及运算时间评测
2018/05/24 Python
python获取点击的坐标画图形的方法
2019/07/09 Python
浅谈Python 敏感词过滤的实现
2019/08/15 Python
python获取时间戳的实现示例(10位和13位)
2020/09/23 Python
Selenium关闭INFO:CONSOLE提示的解决
2020/12/07 Python
利用css3-animation实现逐帧动画效果
2016/03/10 HTML / CSS
ONLY瑞典官网:世界知名服装品牌
2018/06/19 全球购物
世界汽车零件:World Car Parts
2019/09/04 全球购物
幼儿园教师请假制度
2014/01/16 职场文书
支部书记四风问题对照检查材料
2014/10/04 职场文书
红歌会主持词
2015/07/02 职场文书
JS实现简单的九宫格抽奖
2022/06/28 Javascript