请问使用presto查询hudi的表需要配置什么吗?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
CREATE [EXTERNAL] TABLE table_name (
column1_type column1_name
[, column2_type column2_name]...
) [COMMENT table_comment]
[PARTITIONED BY (partition_column_type partition_column_name
[, partition_volumn_type partition_volumn_name...])]
[STORED AS file_format]
LOCATION hdfs_path;
CREATE [OR REPLACE] SCHEMA [IF NOT EXISTS] schema_name
[AUTHORIZATION user_name];
USE SCHEMA schema_name;
CREATE [OR REPLACE] CATALOG [IF NOT EXISTS] catalog_name
WITH (
type = 'hudi',
hudi_table_type = 'COW', -- 当前 Hudi 表的类型
hudi_base_path = '/path/to/hudi/table', -- Hudi 表的基本路径
hudi_database = 'hudi_db', -- Hudi 表所在的数据库
hudi_snapshot_sync_retry_count = 3, -- 最多尝试同步 Hudi 快照的次数
hudi_table_name_suffix = '.hudi', -- Hudi 表的后缀名
hudi_full_table_name_separator = '_', -- 用于拼接 Hudi 表的全名,以及区分 Hudi 表的表名和命名空间的分隔符
hudi_truncate_column = 'timestamp', -- Hudi 表的时间戳列名称
... -- 其他 Hudi 表的参数
);
其中,
hudi_table_type
参数表示 Hudi 表的类型,可以是COW
(Copy-on-Write)或MOR
(Merge-on-Read),分别表示基于写入复制或基于读取合并的两种不同写入方式;hudi_base_path
参数表示 Hudi 表的基本路径,是一个 HDFS 路径;hudi_database
参数表示 Hudi 表所在的数据库名称,需要与 Hudi 表配置一致。
实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。