开发者社区 问答 正文

Flink一次性操作数据如何确定100W数据是否处理完毕?

已解决

Flink一次性操作数据如何确定100W数据是否处理完毕?

展开
收起
阿里云服务支持 2022-12-14 16:30:13 294 分享 版权
1 条回答
写回答
取消 提交回答
  • 官方回答

    可以通过数据曲线查看下列参数:

    ○ numRecordsIn

    ○ numRecordsInPerSecondnumRecordsOut

    ○ numRecordsOutPerSecond

    1. 如果数据曲线总数量没变化,每秒输入输出记录数趋于0,说明数据已经处理结束,也可以在目标端去查询数据,如果最新更新的数据在目标端也已经更新,那么数据处理结束。

    2. currentEmitEventTimeLag指标记录的是 Source发送一条记录到下游节点的时间点和该记录在数据库中生成时间点的差值,用于衡量数据从数据库中产生到离开Source节点的延迟。

    3. currentFetchEventTimeLag和currentEmitEventTimeLag 均反映了Flink当前处理的延迟,如果业务延迟比较严重,可以通过两个指标的差值(即数据在 Source中停留的时间)分析Source当前的处理能力。

    4. 如果两个延迟非常接近,说明Source从外部系统中拉取数据的能力(网络 I/O、并发数)不足。

    5. 如果两个延迟差值较大,说明Source的数据处理能力(数据解析、并发、反压)不足。

    详情参考:查看监控指标

    2022-12-14 16:36:22
    赞同 展开评论