什么是数据的一致性和正确性,它们有何区别?一致性和正确性在流计算中是如何关联的?
数据的一致性指的是跨越所有流计算上下游系统的数据反映了相同的信息,而数据的正确性则是指流计算的结果能够准确地反映真实物理世界中的对象。一致性是数据正确性的必要非充分条件,即如果数据是一致的,但不一定正确;但如果数据是正确的,则必定是一致的。
在流计算中,一致性通常与“exactly-once”这个术语相关,表示流计算引擎可以从故障中恢复到一致的状态,并且输出结果不包含重复或丢失的数据。然而,即使引擎实现了一致性,也可能由于源头数据无序、延迟等问题导致最终结果不正确。因此,正确性的要求比一致性更为严格。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。