1.多种数据源(有时不可靠):当数据是由数以百万计的不同用户或设备产生的,它是安全的假设数据会按照事件产生的顺序到达,和在上游数据失败的情况下,一些事件可能会比他们晚几个小时,迟到的数据也需要计算,这样的结果是准确的。
2.应用程序状态管理:当程序变得更加的复杂,比简单的过滤或者增强的数据结构,这个时候管理这些应用的状态将会变得比较难(例如:计数器,过去数据的窗口,状态机,内置数据库)。Flink 提供了工具,这些状态是有效的,容错的,和可控的,所以你不需要 自己构建这些功能。
3.数据的快速处理:有一个焦点在实时或近实时用例场景中,从数据生成的那个时刻, 数据就应该是可达的。在必要的时候,Flink 完全有能力满足这些延迟。
4.海量数据处理:这些程序需要分布在很多节点运行来支持所需的规模。Flink 可以在大 型的集群中无缝运行,就像是在一个小集群一样。
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。