开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

flink cdc paimon设置了file.format为parquet但生成的文件依然是orc

问题描述

我在使用Flink + Flink cdc + Paimon + oss 做数据同步,在cdc的yaml里指定了paimon的文件格式是parquet,但生成的文件依然是默认的文件格式orc,请问是什么原因?
image.png

软件版本

  • Flink :1.18.1
  • Flink CDC : 3.1.0
  • Paimon: 0.8.0

cdc yaml

source:
  type: mysql
  name: MySQL Source
  hostname: 192.168.xxx.xxx
  port: 3306
  username: xxxx
  password: xxxx
  tables: paimon_test.users,paimon_test.products,paimon_test.order_details,paimon_test.orders
  server-id: 5401-5404
  scan.startup.mode: initial
  jdbc.properties.useSSL: false
  server-time-zone: Asia/Shanghai

sink:
  type: paimon
  name: Paimon Sink
  catalog.properties.file.format: parquet
  catalog.properties.metastore: filesystem
  catalog.properties.warehouse: oss://paimon-test/warehouse
  catalog.properties.fs.oss.endpoint: oss-cn-shenzhen.aliyuncs.com
  catalog.properties.fs.oss.accessKeyId: xxxxx
  catalog.properties.fs.oss.accessKeySecret: xxx


pipeline:
  name: MySQL to Paimon Pipeline OSS
  parallelism: 1

展开
收起
carl.zeiss 2024-10-29 17:06:44 88 0
0 条回答
写回答
取消 提交回答

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

相关产品

  • 实时计算 Flink版
  • 相关电子书

    更多
    Flink CDC Meetup PPT - 龚中强 立即下载
    Flink CDC Meetup PPT - 王赫 立即下载
    Flink CDC Meetup PPT - 覃立辉 立即下载