Flink DataStream 针对数据重新分区的疑惑?
这个问题应该是采用keyby来实现分区,之前使用keyby之后,会生成 KeyedStream ,不理解Tuple是干啥用的,之前使用spark 进行group之后,应该是这样的结构( ),这个tuple,让我很蒙圈,以为只能使用在其后面使用聚合类的算子,但是后来实验了一下,可以进行map,并且map的时候tuple不会出现,虽然还是不懂为啥会有个tuple出现,但是能满足业务需求了。后续搞懂了,再来分享,如果有大神理解的比较深刻,也请多多赐教!
public class WC { public String word; public int count;}DataStream words = // [...]DataStream wordCounts = words.keyBy('word').window(/window specification/);对于不是很明白keyby参数word的含义,可以看看这个
赞0
踩0