Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
MySql开发之自动同步表结构
May 28 MySQL
浅谈Redis主从复制以及主从复制原理
May 29 Redis
MySQL注入基础练习
May 30 MySQL
MySQL 时间类型的选择
Jun 05 MySQL
MySQL 如何设计统计数据表
Jun 15 MySQL
MySQL系列之二 多实例配置
Jul 02 MySQL
mysql 直接拷贝data 目录下文件还原数据的实现
Jul 25 MySQL
MySQL命令无法输入中文问题的解决方式
Aug 30 MySQL
PostgreSQL并行计算算法及参数强制并行度设置方法
Apr 07 PostgreSQL
mysql使用 not int 子查询隐含陷阱
Apr 12 MySQL
MySQL中的全表扫描和索引树扫描
May 15 MySQL
SQL SERVER中的流程控制语句
May 25 SQL Server
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
上海地方志办公室-上海电子仪表工业志
2021/03/04 无线电
PHP正则表达式之定界符和原子介绍
2012/10/05 PHP
PHP flock 文件锁详细介绍
2012/12/29 PHP
php实现字符串翻转的方法
2015/03/27 PHP
Yii框架扩展CGridView增加导出CSV功能的方法
2017/05/24 PHP
CI框架(CodeIgniter)实现的导入、导出数据操作示例
2018/05/24 PHP
PHP实现简单用户登录界面
2019/10/23 PHP
深入认识JavaScript中的函数
2007/01/22 Javascript
JS 屏蔽键盘不可用与鼠标右键不可用的方法
2013/11/18 Javascript
js获取元素的外链样式的简单实现方法
2016/06/06 Javascript
JS实现iframe编辑器光标位置插入内容的方法(兼容IE和Firefox)
2016/06/24 Javascript
深入理解bootstrap框架之第二章整体架构
2016/10/09 Javascript
jQuery动态生成Bootstrap表格
2016/11/01 Javascript
lhgcalendar时间插件限制只能选择三个月的实现方法
2017/07/03 Javascript
解决使用layui对select append元素无效或者未及时更新的问题
2019/09/18 Javascript
通过Py2exe将自己的python程序打包成.exe/.app的方法
2018/05/26 Python
python高级特性和高阶函数及使用详解
2018/10/17 Python
python对验证码降噪的实现示例代码
2019/11/12 Python
Python基于wordcloud及jieba实现中国地图词云图
2020/06/09 Python
Python 执行矩阵与线性代数运算
2020/08/01 Python
python实现数据结构中双向循环链表操作的示例
2020/10/09 Python
html5简单示例_动力节点Java学院整理
2017/07/07 HTML / CSS
AmazeUI的下载配置与Helloworld的实现
2020/08/19 HTML / CSS
美国手机支架公司:PopSockets
2019/11/27 全球购物
linux比较文件内容的命令是什么
2015/09/23 面试题
软件测试工程师结构化面试题库
2016/11/23 面试题
会计电算化专业毕业生推荐信
2013/12/24 职场文书
优秀的自荐信要注意哪些
2014/01/03 职场文书
优秀班干部事迹材料
2014/01/26 职场文书
股东协议书
2014/04/14 职场文书
《中国梦我的梦》小学生演讲稿
2014/08/20 职场文书
公安机关党的群众路线教育实践活动剖析材料
2014/10/10 职场文书
农村党员学习党的群众路线教育实践活动心得体会
2014/11/04 职场文书
2014年人事科工作总结
2014/11/19 职场文书
2015年社区综治工作总结
2015/04/21 职场文书
辞职申请书范本
2019/05/20 职场文书