Hive导入csv文件示例


Posted in 数据库 onJune 25, 2022

正文

现有文件为csv格式,需要导入hive中,设csv内容如下

1001,zs,23
1002,lis,24

首先创建表

create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as textfile ;

导入数据及查询

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

其他注意事项

如果建表是parquet格式可否load导入csv文件?

drop table csv2;
create table if not exists csv2(
    uid int,
    uname string,
    age int
)
row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
stored as parquet ;

load data local inpath '/data/csv2.csv' into table csv2;
select * from csv2;

使用时会报错

Failed with exception java.io.IOException:java.lang.RuntimeException: hdfs://192.168.10.101:8020/user/hive/warehouse/csv2/csv2.csv is not a Parquet file. expected magic number at tail [80, 65, 82, 49] but found [44, 50, 52, 10]

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

drop table csv2;
create table if not exists csv2
(
    uid   int,
    uname string,
    age   int
)
    row format serde 'org.apache.hadoop.hive.serde2.OpenCSVSerde'
    stored as textfile;
-- 先导入csv文件到表格csv2,保存格式是textfile
load data local inpath '/data/csv2.csv' into table csv2;


drop table csv3;
-- 创建csv3,保存格式parquet
create table if not exists csv3
(
    uid   int,
    uname string,
    age   int
)
    row format delimited
        fields terminated by ','
    stored as parquet;
-- 提取csv2的数据插入到csv3
insert overwrite table csv3 select * from csv2;

总结

  • 关键是要引入org.apache.hadoop.hive.serde2.OpenCSVSerde
  • csv要保存到hiveparquet,需要先保存成textfile

以上就是Hive导入csv文件示例的详细内容,更多关于Hive导入csv文件的资料请关注三水点靠木其它相关文章!


Tags in this post...

数据库 相关文章推荐
MYSQL主从数据库同步备份配置的方法
May 26 MySQL
MYSQL 无法识别中文的永久解决方法
Jun 03 MySQL
Redis可视化客户端小结
Jun 10 Redis
解决mysql模糊查询索引失效问题的几种方法
Jun 18 MySQL
浅析MySQL如何实现事务隔离
Jun 26 MySQL
使用ORM新增数据在Mysql中的操作步骤
Jul 26 MySQL
mysql聚集索引、辅助索引、覆盖索引、联合索引的使用
Feb 12 MySQL
将MySQL的表数据全量导入clichhouse库中
Mar 21 MySQL
SQL Server数据库查询出现阻塞之性能调优
Apr 10 SQL Server
解决MySQL报“too many connections“错误
Apr 19 MySQL
MySQL批量更新不同表中的数据
May 11 MySQL
Mysql索引失效 数据库表中有索引还是查询很慢
May 15 MySQL
Hive HQL支持2种查询语句风格
Jun 25 #数据库
Hive日期格式转换方法总结
Jun 25 #数据库
PostgreSQL怎么创建分区表详解
Jun 25 #PostgreSQL
Mysql中的触发器定义及语法介绍
Jun 25 #MySQL
Hive常用日期格式转换语法
Jun 25 #数据库
MySQL数据库配置信息查看与修改方法详解
Jun 25 #MySQL
SQL语句中EXISTS的详细用法大全
Jun 25 #MySQL
You might like
PHP中对数组的一些常用的增、删、插操作函数总结
2015/11/27 PHP
PHP正则表达式过滤html标签属性(DEMO)
2016/05/04 PHP
PHP十六进制颜色随机生成器功能示例
2017/07/24 PHP
PHP设计模式(六)桥连模式Bridge实例详解【结构型】
2020/05/02 PHP
setAttribute 与 class冲突解决
2008/02/17 Javascript
jQuery 工具函数学习资料
2010/04/29 Javascript
JavaScript的常见兼容问题及相关解决方法(chrome/IE/firefox)
2013/12/31 Javascript
jQuery模仿单选按钮选中效果
2016/06/24 Javascript
js跨域资源共享 基础篇
2016/07/02 Javascript
JavaScript 继承详解(五)
2016/10/11 Javascript
JS如何设置元素样式的方法示例
2017/08/28 Javascript
详解react服务端渲染(同构)的方法
2017/09/21 Javascript
Async/Await替代Promise的6个理由
2019/06/15 Javascript
详解Nuxt.js中使用Element-UI填坑
2019/09/06 Javascript
JavaScript中while循环的基础使用教程
2020/08/11 Javascript
Jquery $.map使用方法实例详解
2020/09/01 jQuery
使用wxPython获取系统剪贴板中的数据的教程
2015/05/06 Python
Python中if __name__ == '__main__'作用解析
2015/06/29 Python
python直接访问私有属性的简单方法
2016/07/25 Python
Python实现简单过滤文本段的方法
2017/05/24 Python
Django项目中用JS实现加载子页面并传值的方法
2018/05/28 Python
Flask框架响应、调度方法和蓝图操作实例分析
2018/07/24 Python
python使用docx模块读写docx文件的方法与docx模块常用方法详解
2020/02/17 Python
Python任务调度模块APScheduler使用
2020/04/15 Python
美国最大的珠宝首饰网上商城:Jewelry.com
2016/07/22 全球购物
文艺晚会策划方案
2014/06/11 职场文书
校运动会广播稿(100篇)
2014/09/12 职场文书
2014年手术室工作总结
2014/11/26 职场文书
公务员年终个人总结
2015/02/12 职场文书
自荐信模板大全
2015/03/27 职场文书
宾馆客房管理制度
2015/08/06 职场文书
创业计划书之奶茶店开店方案范本!
2019/08/06 职场文书
Django如何与Ajax交互
2021/04/29 Python
详解CSS开发过程中的20个快速提升技巧
2021/05/21 HTML / CSS
九大龙王魂骨,山龙王留下躯干骨,榜首死的最憋屈(被捏碎)
2022/03/18 国漫
搭建zabbix监控以及邮件报警的超级详细教学
2022/07/15 Servers