- Reduce
源码
https://gitee.com/pingfanrenbiji/Flink-UserBehaviorAnalysis/blob/master/FlinkTutorial/src/main/scala/com/xdl/apitest/TransformTest.scala
KeyedStream、DataStream 一个分组数据流的聚合操作 合并当前的元素和上次聚合的结果 产生一个新的值 返回的流中包含每一次聚合的结果 而不是只返回最后一次聚合的最终结果
- Union
对两个或两个以上的DataStream进行union操作 产生一个包含所有DataStram元素的新的DataStream
connect和union区别
1、union之前两个流的类型必须一样 connect可以不一样 在之后的coMap中再调整成一样的 2、Connect只能操作两个流 Union可以操作多个
支持的数据类型
Flink流应用程序处理的是以数据对象表示事件流 数据对象需要被序列化和反序列化 以便通过网络传送它们或从状态后端、检查点和保存点读取它们
Flink使用类型信息的概念来表示数据类型 并为每个数据类型生成特定的序列化器、反序列化器和比较器
Flink具有类型提取系统 该系统分析函数的输入和返回类型 以自动获取类型信息 从而获取序列化和反序列化器
lamdba 函数或泛型类型 需要显示的提供类型信息 才能使得应用程序正常工作或提高性能