Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
Mysql实现主从配置和多主多从配置
Jun 02 MySQL
MySQL5.7并行复制原理及实现
Jun 03 MySQL
Redis 哨兵集群的实现
Jun 18 Redis
MySQL中IF()、IFNULL()、NULLIF()、ISNULL()函数的使用详解
Jun 26 MySQL
SQLServer中JSON文档型数据的查询问题解决
Jun 27 SQL Server
mysql脏页是什么
Jul 26 MySQL
MySQL定时备份数据库(全库备份)的实现
Sep 25 MySQL
mongoDB数据库索引快速入门指南
Mar 23 MongoDB
你真的会用Mysql的explain吗
Mar 31 MySQL
深入理解MySQL中MVCC与BufferPool缓存机制
May 25 MySQL
oracle设置密码复杂度及设置超时退出的功能
Jun 28 Oracle
在SQL Server中使用 Try Catch 处理异常的示例详解
Jul 15 SQL Server
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
php+ajax实现仿百度查询下拉内容功能示例
2017/10/20 PHP
php实现的生成迷宫与迷宫寻址算法完整实例
2017/11/06 PHP
PHP的imageTtfText()函数深入详解
2021/03/03 PHP
用js判断浏览器是否是IE的比较好的办法
2007/05/08 Javascript
jquery 结合C#后台的数组对文章的关键字自动添加链接的代码
2011/07/15 Javascript
jquery ajax return没有返回值的解决方法
2011/10/20 Javascript
修复ie8&chrome下window的resize事件多次执行
2011/10/20 Javascript
动态加载JavaScript文件的两种方法
2016/04/22 Javascript
jquery设置表单元素为不可用的简单代码
2016/07/04 Javascript
关于JavaScript的单双引号嵌套问题
2017/08/20 Javascript
使用taro开发微信小程序遇到的坑总结
2019/04/08 Javascript
vue项目中使用scss的方法步骤
2019/05/16 Javascript
python进阶教程之词典、字典、dict
2014/08/29 Python
Python实现的数据结构与算法之基本搜索详解
2015/04/22 Python
在Django的URLconf中进行函数导入的方法
2015/07/18 Python
Python结巴中文分词工具使用过程中遇到的问题及解决方法
2017/04/15 Python
解决pycharm工程启动卡住没反应的问题
2019/01/19 Python
PYTHON如何读取和写入EXCEL里面的数据
2019/10/28 Python
基于Python和PyYAML读取yaml配置文件数据
2020/01/13 Python
python中最小二乘法详细讲解
2021/02/19 Python
CSS3中线性颜色渐变的一些实现方法
2015/07/14 HTML / CSS
使用CSS3的appearance属性改变元素的外观的方法
2015/12/12 HTML / CSS
css3动画 小球滚动 js控制动画暂停
2019/11/29 HTML / CSS
调用HTML5的Canvas API绘制图形的快速入门指南
2016/06/17 HTML / CSS
拉飞逸官网:Lafayette 148 New York
2020/07/15 全球购物
生日邀请函范文
2014/01/13 职场文书
营销总经理岗位职责
2014/02/02 职场文书
勿忘国耻9.18演讲稿(经典篇)
2014/09/14 职场文书
万能检讨书2000字
2014/10/17 职场文书
上课说话检讨书
2015/01/27 职场文书
起诉状范本
2015/05/20 职场文书
2015小学五年级班主任工作总结
2015/05/21 职场文书
《圆的面积》教学反思
2016/02/19 职场文书
Jsonp劫持学习
2021/04/01 PHP
Java多条件判断场景中规则执行器的设计
2021/06/26 Java/Android
Python IO文件管理的具体使用
2022/03/20 Python