Flink CDC里假设我做widow计算使用ProcessTime计算,然后我有20台机器,其中4台机器错乱了,时间提前了2个小时,然后这会导致什么问题?
我的水位线会怎么样,会因为提前的事件导致我正常的时间变成延迟数据吗?
我的窗口计算 正常的数据 和不正常的是不是都产生了异常的数据
如果使用ProcessTime计算窗口,并且有4台机器的时间提前了2个小时,那么可能会导致以下问题:
水位线可能会受到影响。由于时间提前了2个小时,导致这些机器上的事件被过早地计算和处理,因此可能会导致水位线上移,即实际的事件时间比水位线上记录的时间更早。这可能会导致一些正常数据被误认为是延迟数据。
窗口计算可能会出现异常的数据。由于时间提前了2个小时,导致这些机器上的事件被过早地计算和处理,因此可能会导致窗口计算的结果出现异常。例如,如果使用的是滚动窗口,那么窗口的结束时间可能会比预期的更早,导致窗口中包含的数据量变少;如果使用的是滑动窗口,那么窗口的起始时间可能会比预期的更早,导致窗口中包含的数据量变多。
总之,时间提前的机器会导致水位线和窗口计算结果出现问题,需要及时处理。