Flink一次性操作数据如何确定100W数据是否处理完毕?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
可以通过数据曲线查看下列参数:
○ numRecordsIn
○ numRecordsInPerSecondnumRecordsOut
○ numRecordsOutPerSecond
如果数据曲线总数量没变化,每秒输入输出记录数趋于0,说明数据已经处理结束,也可以在目标端去查询数据,如果最新更新的数据在目标端也已经更新,那么数据处理结束。
currentEmitEventTimeLag指标记录的是 Source发送一条记录到下游节点的时间点和该记录在数据库中生成时间点的差值,用于衡量数据从数据库中产生到离开Source节点的延迟。
currentFetchEventTimeLag和currentEmitEventTimeLag 均反映了Flink当前处理的延迟,如果业务延迟比较严重,可以通过两个指标的差值(即数据在 Source中停留的时间)分析Source当前的处理能力。
如果两个延迟非常接近,说明Source从外部系统中拉取数据的能力(网络 I/O、并发数)不足。
如果两个延迟差值较大,说明Source的数据处理能力(数据解析、并发、反压)不足。
详情参考:查看监控指标