开发者社区> 问答> 正文

Flink结果表数据量正确性问题

已解决

Flink结果表数据量正确性问题

展开
收起
提个问题 2024-06-01 10:02:15 46 0
1 条回答
写回答
取消 提交回答
  • 开发者社区问答官方账号
    官方回答
    采纳回答
    • 场景描述
      上线运行作业后,下游结果表中没有数据。
    • 排错流程图

    • 检查作业中是否存在Failover
      • 排错指引
        查看Failover报错信息,分析作业运行异常原因。
      • 解决方案
        解决Failover问题,使作业正常运行。
    • 检查源表数据是否进入实时计算Flink版
      • 排错指引
        这种情况下没有Failover,但数据延时会很大,查看数据曲线页面numRecordsIn_VVP,检查各Source输入是否有数据。
      • 解决方案
        检查源表,保证上游有数据进入实时计算Flink版。
    • 检查数据是否被某个节点过滤
      在作业运维页面,单击目标作业名称,单击返回开发,在页面右侧高级配置面板的更多Flink配置中添加pipeline.operator-chaining: 'false' ,将节点拆分,然后观察每个节点的Bytes Received(输入)和Bytes Sent(输出),确定数据在哪个节点被过滤,如果某个节点输出为0,输入不为0,说明数据被这个节点过滤了。常见的导致数据无输出的算子包括join、window或where。
    • 检查下游是否由于默认缓存机制缓存了数据
      • 解决方案:排除作业的业务逻辑异常后,调整下游存储的batchsize的大小。
    • 检查作业是否存在严重业务延迟
      • 解决方案:检查作业是否反压节点调整并发处理能力等待任务无延迟后检查数据。
    重要:如果batchsize参数设置的过小,则可能会造成下游数据库I/O压力过大、存在性能瓶颈的风险。例如,如果将batchsize设置为1,说明处理完一条数据,就会请求一次数据库,大数据场景下会导致数据库压力大。
    • 检查下游RDS,是否存在死锁
      • 解决方案:参见上下游存储。
    2024-06-01 10:02:16
    赞同 展开评论 打赏
问答排行榜
最热
最新

相关电子书

更多
Flink CDC Meetup PPT - 龚中强 立即下载
Flink CDC Meetup PPT - 王赫 立即下载
Flink CDC Meetup PPT - 覃立辉 立即下载