开发者社区 > 大数据与机器学习 > 实时计算 Flink > 正文

在离线批量导入hudi表请问怎么配置 ?

2f46536677af14e65631d6859acc6533.png 在离线批量导入hudi表请问怎么配置 关闭 FHTTP://T.LENOVO.CN/3EZQQNlink 的检查点功能

展开
收起
圆葱猪肉包 2023-03-27 14:19:18 280 0
1 条回答
写回答
取消 提交回答
  • 发表文章、提出问题、分享经验、结交志同道合的朋友

    你圈的那行是避免在离线模式下浪费资源和时间进行 checkpointing,以提高作业的执行效率。

    另外需要配置Hudi的相关信息:

    #属性指定了在 Hudi 写操作时使用的预合并字段
    hoodie.datasource.write.precombine.field = timestamp
    #指定了记录 ID 字段
    hoodie.datasource.write.recordkey.field = id
    #指定了分区路径字段
    hoodie.datasource.write.partitionpath.field = partition_path
    
    2023-03-27 17:11:11
    赞同 展开评论 打赏

实时计算Flink版是阿里云提供的全托管Serverless Flink云服务,基于 Apache Flink 构建的企业级、高性能实时大数据处理系统。提供全托管版 Flink 集群和引擎,提高作业开发运维效率。

热门讨论

热门文章

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载