创建Parquet结果表
Parquet是一种高性能的里存储格式,详情请参考Apache Parquet官网。
Flink可以读取Parquet格式数据作为输出,如下:
create table parquet_source(
x varchar,
y varchar,
z varchar
) with (
type='parquet',
filePath='oss://osspath/test.csv'
);
WITH参数
参数 | 注释说明 | 备注 |
---|---|---|
filePath | 文件路径 | 支持oss、hdfs的文件系统。 |
enumerateNestedFiles | 递归读取目录下的所有文件 | 默认为true |
writeMode | 写入方式 | 默认None |
compressionCodecName | 压缩方式 | 默认为snappy。Parquet支持uncompressed、snappy、gzip、lzo,4种格式。 |
本文转自实时计算——创建Parquet结果表