Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
MySQL 角色(role)功能介绍
Apr 24 MySQL
使用springboot暴露oracle数据接口的问题
May 07 Oracle
zabbix agent2 监控oracle数据库的方法
May 13 Oracle
MongoDB 常用的crud操作语句
Jun 20 MongoDB
MySQL快速插入一亿测试数据
Jun 23 MySQL
关于redisson缓存序列化几枚大坑说明
Aug 04 Redis
Redis集群新增、删除节点以及动态增加内存的方法
Sep 04 Redis
基于MySql验证的vsftpd虚拟用户
Nov 07 MySQL
在Centos 8.0中安装Redis服务器的教程详解
Mar 21 Redis
Beekeeper Studio开源数据库管理工具比Navicat更炫酷
Jun 21 数据库
一文教你快速生成MySQL数据库关系图
Jun 28 Redis
如何使用注解方式实现 Redis 分布式锁
Jul 23 Redis
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
php中处理mysql_fetch_assoc返回来的数组 不用foreach----echo
2011/05/04 PHP
php header Content-Type类型小结
2011/07/03 PHP
PHP语言中global和$GLOBALS[]的分析 之二
2012/02/02 PHP
PHP7正式版测试,性能惊艳!
2015/12/08 PHP
Javascript var变量隐式声明方法
2009/10/19 Javascript
javascript实现原生ajax的几种方法介绍
2013/09/21 Javascript
jquery插件冲突(jquery.noconflict)解决方法分享
2014/03/20 Javascript
js的回调函数详解
2015/01/05 Javascript
浅析Node.js实现HTTP文件下载
2016/08/05 Javascript
AngularJS实现树形结构(ztree)菜单示例代码
2016/09/18 Javascript
AngularJS 过滤器(自带和自建)详解
2016/09/19 Javascript
smartupload实现文件上传时获取表单数据(推荐)
2016/12/12 Javascript
微信小程序实现表单校验功能
2020/03/30 Javascript
微信小程序新手教程之启动页的重要性
2019/03/03 Javascript
简单了解JavaScript中的执行上下文和堆栈
2019/06/24 Javascript
js实现圆形显示鼠标单击位置
2020/02/11 Javascript
vue下拉刷新组件的开发及slot的使用详解
2020/12/23 Vue.js
[01:14:34]DOTA2上海特级锦标赛C组资格赛#2 LGD VS Newbee第一局
2016/02/28 DOTA
python中如何使用朴素贝叶斯算法
2017/04/06 Python
python导入csv文件出现SyntaxError问题分析
2017/12/15 Python
python爬虫 模拟登录人人网过程解析
2019/07/31 Python
django rest framework serializer返回时间自动格式化方法
2020/03/31 Python
python实现猜单词游戏
2020/05/22 Python
如何基于python实现年会抽奖工具
2020/10/20 Python
python+opencv实现车道线检测
2021/02/19 Python
10分钟入门CSS3 Animation
2018/12/25 HTML / CSS
美国一家运动专业鞋类零售商:Warehouse Shoe Sale(WSS)
2018/03/28 全球购物
澳大利亚礼品卡商店:Gift Card Store
2019/06/24 全球购物
Timberland德国官网:靴子、鞋子、衣服、夹克及配件
2019/12/10 全球购物
经理职责范文
2013/11/08 职场文书
职工运动会邀请函
2014/02/02 职场文书
运动会搞笑广播稿
2014/10/14 职场文书
推销搭讪开场白
2015/05/28 职场文书
四年级语文教学反思
2016/03/03 职场文书
go语言中json数据的读取和写出操作
2021/04/28 Golang
Vue.js中v-for指令的用法介绍
2022/03/13 Vue.js