开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

为啥DataWorks现在实时任务一直都不同步呢?以前才新加的实时任务有延时以后就追平了,现在就一直

为啥DataWorks现在实时任务一直都不同步呢?以前才新加的实时任务有延时以后就追平了,现在就一直不拉数据?隔一会拉一下image.png香港
/home/admin/streamx/bin/streamx.py --jvm='-Xms1792m -Xmx1792m' --jobid 2025 --jobmark 9597a1db6c4ac943765ba24c3521e023 -m local http://di-service-cn-hongkong.data.aliyun.com:80/api/inner/streamx/2025/config

展开
收起
真的很搞笑 2023-05-21 17:15:32 97 0
1 条回答
写回答
取消 提交回答
  • 留问题1回答2,回答2改为:
    查看下来初步判断还是写满了,动态分区新建分区非常频繁,历史的数据分区很多,在频繁的创建分区 image.png
    读到的数据没有分区,就会新建,可以先尝试调高一些flush的时间间隔 相当于攒批flush 现在是一两条数据一次flush ;或者可以考虑历史数据用离线同步过来 增量的数据再用实时同步;但是因为业务原因,这个任务确实还是会很慢image.png,此回答整理自钉群“DataWorks交流群(答疑@机器人)”

    2023-07-10 14:10:35
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 热门讨论

    热门文章

    相关电子书

    更多
    DataWorks数据集成实时同步最佳实践(含内测邀请)-2020飞天大数据平台实战应用第一季 立即下载
    DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载
    基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

    相关实验场景

    更多