Blink 对状态的copy(从本机到HDFS)是异步的,怎样保证exactly once了?
Blink的state采取了多版本控制(MVCC)的方式进行并发控制。在barrier到达时,Blink对state进行了快照。尽管在copy时,state仍然会被更新,但是快照所看到的数据是不会改变的。由于所有operator在同一个barrier下对state进行了快照,所以得到的状态是一致的,都是处理完同一批输入之后的状态。以这个状态恢复的计算自然也就是exactly once的了。
赞1
踩0