Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
MySQL复制问题的三个参数分析
Apr 07 MySQL
详解MySQL的半同步
Apr 22 MySQL
MySQL 表空间碎片的概念及相关问题解决
May 07 MySQL
mysql 8.0.24 安装配置方法图文教程
May 12 MySQL
Centos环境下Postgresql 安装配置及环境变量配置技巧
May 18 PostgreSQL
Redis 哨兵集群的实现
Jun 18 Redis
Redis三种集群模式详解
Oct 05 Redis
SQL注入篇学习之盲注/宽字节注入
Mar 03 MySQL
MySQL中B树索引和B+树索引的区别详解
Mar 03 MySQL
MySQL日期时间函数知识汇总
Mar 17 MySQL
使用Redis做预定库存缓存功能
Apr 02 Redis
MySQL sql模式设置引起的问题
May 15 MySQL
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
农民C键的运用技巧
2020/03/04 星际争霸
PHP 一个比较完善的简单文件上传
2010/03/25 PHP
深入php list()函数的详解
2013/06/05 PHP
Linux中用PHP判断程序运行状态的2个方法
2014/05/04 PHP
PHP实现对站点内容外部链接的过滤方法
2014/09/10 PHP
php设计模式之备忘模式分析【星际争霸游戏案例】
2020/03/24 PHP
javascript算法题 求任意一个1-9位不重复的N位数在该组合中的大小排列序号
2012/07/21 Javascript
Javascript 按位左移运算符使用介绍(
2014/02/04 Javascript
判断及设置浏览器全屏模式
2014/04/20 Javascript
jQuery标签编辑插件Tagit使用指南
2015/04/21 Javascript
AngularJS基础学习笔记之指令
2015/05/10 Javascript
检查表单元素的值是否为空的实例代码
2016/06/16 Javascript
Angularjs---项目搭建图文教程
2016/07/08 Javascript
Vue计算属性的使用
2017/08/04 Javascript
详谈js对url进行编码和解码(三种方式的区别)
2017/08/16 Javascript
AngularJS使用Filter自定义过滤器控制ng-repeat去除重复功能示例
2018/04/21 Javascript
jQuery基于闭包实现的显示与隐藏div功能示例
2018/06/09 jQuery
webpack4.0 入门实践教程
2018/10/08 Javascript
Layer+Echarts构建弹出层折线图的方法
2019/09/25 Javascript
javascript利用键盘控制小方块的移动
2020/04/20 Javascript
[43:33]EG vs Spirit Supermajor 败者组 BO3 第一场 6.4
2018/06/05 DOTA
python中的全局变量用法分析
2015/06/09 Python
PyQt5通信机制 信号与槽详解
2019/08/07 Python
django框架ModelForm组件用法详解
2019/12/11 Python
python实现删除列表中某个元素的3种方法
2020/01/15 Python
tensorflow实现从.ckpt文件中读取任意变量
2020/05/26 Python
Python数据可视化图实现过程详解
2020/06/12 Python
世界上最具创新性的增强型知名运动品牌:Proviz
2018/04/03 全球购物
小学美术教学反思
2014/02/01 职场文书
环境工程专业自荐信范文
2014/03/18 职场文书
教师一岗双责责任书
2014/04/16 职场文书
校园元旦活动总结
2014/07/09 职场文书
食堂采购员岗位职责
2015/04/03 职场文书
2016春季幼儿园开学寄语
2015/12/03 职场文书
公安忠诚教育心得体会
2016/01/23 职场文书
小学秋季运动会加油口号及加油稿
2019/08/19 职场文书