在离线批量导入hudi表请问怎么配置 ?

2f46536677af14e65631d6859acc6533.png 在离线批量导入hudi表请问怎么配置 关闭 FHTTP://T.LENOVO.CN/3EZQQNlink 的检查点功能

展开
收起
圆葱猪肉包 2023-03-27 14:19:18 338 分享 版权
1 条回答
写回答
取消 提交回答
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    你圈的那行是避免在离线模式下浪费资源和时间进行 checkpointing,以提高作业的执行效率。

    另外需要配置Hudi的相关信息:

    #属性指定了在 Hudi 写操作时使用的预合并字段
    hoodie.datasource.write.precombine.field = timestamp
    #指定了记录 ID 字段
    hoodie.datasource.write.recordkey.field = id
    #指定了分区路径字段
    hoodie.datasource.write.partitionpath.field = partition_path
    
    2023-03-27 17:11:11
    赞同 展开评论

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

收录在圈子:
实时计算 Flink 版(Alibaba Cloud Realtime Compute for Apache Flink,Powered by Ververica)是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理系统,由 Apache Flink 创始团队官方出品,拥有全球统一商业化品牌,完全兼容开源 Flink API,提供丰富的企业级增值功能。
还有其他疑问?
咨询AI助理