备案控制台

开发者社区数据库文章正文

创建ORC结果表

2018-11-14 2508

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

创建ORC结果表

ORC(Optimized Row Columnar)是Hadoop生态圈中的一种列式存储格式。ORC产生于2013年初，最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet类似，它并不是一个单纯的列式存储格式，仍然是先根据行组分割整个表，在每一个行组内进行按列存储。ORC文件是自描述的，它的元数据使用Protocol Buffers序列化，并且文件中的数据尽可能的压缩，以降低存储空间的消耗。目前ORC也被Spark SQL、Presto等查询引擎支持。但是Impala对于ORC目前没有支持，仍然使用Parquet作为主要的列式存储格式。2015年ORC项目被Apache项目基金会提升为Apache顶级项目。

DDL定义

Flink支持使用ORC格式文件作为输出，示例代码如下。

create table orc_source(
id int,
user_name VARCHAR,
content VARCHAR,
primary key(id)
) with (
type='orc',
filePath='hdfs://hdfshome/orcpath/test'
);

WITH参数

参数	注释说明	备注
filePath	文件路径	目前支持hdfs、oss两种文件系统。
writeMode	无	默认为None
compressionCodecName	压缩格式	无

本文转自实时计算—— 创建ORC结果表

文章标签：

Apache

存储

SQL

分布式计算

李博 bluemind

目录

相关文章

Jast

|

6月前

|

SQL 消息中间件数据处理

DataX读取Hive Orc格式表丢失数据处理记录

DataX读取Hive Orc格式表丢失数据处理记录

Jast

255 0 0

诸葛子房

|

6月前

|

SQL 分布式计算 Hadoop

创建hive表并关联数据

创建hive表并关联数据

诸葛子房

68 0 0

以山向海

|

3月前

|

SQL 存储算法

ads创建普通表详解

【8月更文挑战第12天】

以山向海

75 1 1

木易巷

|

6月前

|

SQL HIVE

Hive表删除数据不支持使用Delete From...

Hive表删除数据不支持使用Delete From...

木易巷

271 0 0

星光下的赶路人

|

SQL 存储分布式计算

Hive学习---5、分区表和分桶表

Hive学习---5、分区表和分桶表

星光下的赶路人

220 1 1

笑看风云路

|

SQL 存储 HIVE

Hive 内部表和外部表对比

Hive 内部表和外部表区别

笑看风云路

163 0 0

真题OK撒

|

SQL Linux 数据库

Hive 表 DML 操作——Hive 表 DML 操作——第1关：将文件中的数据导入（Load）到 Hive 表中

Hive 表 DML 操作——Hive 表 DML 操作——第1关：将文件中的数据导入（Load）到 Hive 表中

真题OK撒

1000 0 0

学堂小助手

|

SQL 存储分布式计算

Apache Hive--DDL--创建表--分桶表创建&分桶数据导入| 学习笔记

快速学习Apache Hive--DDL--创建表--分桶表创建&分桶数据导入

学堂小助手

147 0 0

Apache Hive--DDL--创建表--分桶表创建&分桶数据导入| 学习笔记

学堂小助手

|

SQL 存储大数据

Apache Hive--DDL--创建表--分桶表总结&分桶表好处| 学习笔记

快速学习 Apache Hive--DDL--创建表--分桶表总结&分桶表好处

学堂小助手

160 0 0

Apache Hive--DDL--创建表--分桶表总结&分桶表好处| 学习笔记

琦彦

|

SQL 存储 Shell

hive：建库建表、表分区、内部表外部表、数据导入导出

hive：建库建表、表分区、内部表外部表、数据导入导出

琦彦

468 0 0

热门文章

最新文章

Java 生成 UUID

一文读懂 Serverless 的起源、发展和落地实践

Fiddler抓包：下载、安装及使用

用CodeViz绘制函数调用关系图(call graph)

阿里AI上岗双11服装车间，能识别头发丝直径十分之一的瑕疵

SpringBoot开发案例之整合Dubbo提供者(一)

Dubbo架构介绍

警惕垃圾邮件借加沙新闻进行钓鱼攻击

美国博客刊文发布NetApp StoreVault停产通知

IntelliJ IDEA 12 创建Web项目教程超详细版

通义灵码与云计算平台的融合：基础与概述

《深度解析：死锁的“前世今生”与防范之道》

《探秘程序崩溃：核心转储（Core Dump）分析全攻略》

今日 AI 开源｜共 12 项｜开源的DIY健康追踪项目，基于低成本的智能戒指构建私人的健康监测应用

Open Interpreter：AI 赋能终端！在终端中对话AI模型进行编程，通过运行代码来完成各种计算机操作任务

「Mac畅玩鸿蒙与硬件15」鸿蒙UI组件篇5 - Slider 和 Progress 组件

ai断点怎么做?

AI Shell：在命令行里“对话” AI ，微软推出将 AI 助手引入命令行的 CLI 工具，打造对话式交互命令行

ai怎么设计迷宫字体效果?

「Mac畅玩鸿蒙与硬件14」鸿蒙UI组件篇4 - Toggle 和 Checkbox 组件

相关课程

更多

StarRocks 数据导入、建表查询以及manger管理

相关电子书

更多

HBase Schema 设计

大批量处理excel文件到ODPS中方案

低代码开发师（初级）实战教程

下一篇

阿里云OSS设置跨域访问